■ランダムウォークの母関数と準超幾何関数(その49)
【3】ベータ分布
ベータ関数(オイラーの第1種積分)は,
B(a,b)=∫(0,1)t^(a-1)(1-t)^(b-1)dt t=0~1
によって定義されます.ここで積分変数をtからu=(1-t)/tによってuに変えると,
B(a,b)=∫(0,∞)u^(a-1)/(1+u)^(a+b)du u=0~∞
が得られます.
ベータ関数とガンマ関数との間には
B(a,b)=Γ(a)Γ(b)/Γ(a+b)
の関係がありますから,ベータ関数はガンマ関数の兄弟分にあたります.
Γ(1/2)=√π
を得るにはベータ関数が用いられます.この関数においてt=sin^2θとおくと
dt=2sinθcosθdθ
ですから
B(a,b)=∫(0,1)t^(a-1)(1-t)^(b-1)dt
=2∫(0,π/2)sin^(2a-1)θcos^(2b-1)θdθ
ここで,a=1/2,b=1/2とすると
B(1/2,1/2)=2∫(0,π/2)dθ=π
Γ^2(1/2)/Γ(1)=π
においてΓ(1)=1であり,
Γ(1/2)=√π
となります.
ベータ関数を一般化すると,
∫(a,b)(x-a)^m(b-x)^ndx=m!n!/(m+n+1)!(b-a)^(m+n+1)
が得られますが,これらは受験参考書に必ず書いてある
∫(a,b)(x-a)(x-b)dx=-1/6(b-a)^3
∫(a,b)(x-a)(x-b)^2dx=1/12(b-a)^4
という公式の一般化になっています.
ベータ関数の一般化というと,超幾何関数のオイラー型積分表示
2F1(a,b,c,x)=Γ(c)/Γ(a)Γ(c-a)∫(0,1)t^(a-1)(1-t)^(c-a-1)(1-xt)^(-b)dt
も思いつくところです.この積分表示は(1-xt)^(-b)のテイラー展開
(1-xt)^(-b)=Σ(-b,n)(-xt)^n=Σ(b,n)/n!(xt)^n
と
(b,n)=Γ(b+n)/Γ(b)
B(a,b)=Γ(a)Γ(b)/Γ(a+b)
を組み合わせることで示されます.
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
ベータ関数は非負ですから,積分すると1になるように規格化するとベータ分布が得られます.ベータ分布はその定義域が0と1の間にある確率現象のモデルとして使われますが,その標準型は次のような確率密度関数になります.
f(x)=x^(α-1)(1-x)^(β-1)/B(α,β) 0 mean=a/(a+b)
variance=ab/(a+b+1)/(a+b)^2
mode=(a-1)/(a+b-2)
2つの形状母数α,βを含み,これらの値により密度関数は単峰形,J字型,U字型など種々の形状をとることができます.たとえば,両母数がともに1より大きければ単峰形となり,α<βのとき右の方へゆがみ,α>βのとき左の方へゆがみ,母数を入れかえることによって鏡像が得られます.β=1のときがべき乗分布でJ字型分布,α=β=1/2のときが逆正弦分布で,U字型の形状をとります.また,α=β=1のとき一様分布になります.
任意の範囲(a<x<b)にベータ分布を拡張させるには
y=(x−a)/(b−a)
とおいて変数変換します(0<y<1).試験成績のように(0,100)の間に分布するデータでは,a=0,b=100とおいて変数変換ののちベータ分布をあてはめます.
変数xの変域が両側から制限されているのですが,形はかなりフレキシブルに変化するという特徴を利用して多方面に応用されています.たとえば,試験の得点は正規分布になると考えられているようです(正規分布神話)が,試験成績のように上限・下限が存在してしかも対称形になるとは限らないデータではむしろベータ分布などを適用すべきとする意見もあり,実際,共通1次試験の点数分布にはベータ分布が一番よくあてはまるといわれています.右にゆがんだ分布も表現できる分布なのです.
ベータ分布Beta(α,β)は,xとyが独立でそれぞれガンマ分布Gamma(λ,α),Gamma(λ,β)に従うとき,x /(x+y)の分布として求められます.自由度mのカイ2乗分布は,自由度m/2のガンマ分布ですから,2つの確率変数が独立に,それぞれ自由度m,nのカイ2乗分布にしたがうとき,x /(x+y)の分布はBeta(m/2,n/2)となります.
===================================