■ランダムウォークの母関数と準超幾何関数(その50)
【4】酔歩とベータ分布
球に相当するn次元の図形を超球と呼びます.n次元単位超球{x1^2+x2^2+・・・+xn^2≦1}の体積をVnとすると,
Vn=π^(n/2)/Γ(n/2+1)
で与えられます.また,単位超球の表面積Sn-1はnVnとなります.
ベータ分布は単位球面上で一様に分布する点の配置に密接な関係があります.x=(x1,x2,・・・,xn)を単位球面Sn-1上で一様分布する点とすると,
「確率変数
y=x1^2+x2^2+・・・+xk^2 0はベータ分布Beta(k/2,(n-k)/2)に従う」
ことを証明してみましょう.
(証明)
z1,z2,・・・,znを標準正規分布にしたがうn個の独立な確率変数とします.すなわち,ziの密度関数はいずれも
(2π)^(-1/2)exp(-z^2/2)
z=(z1,z2,・・・,zn)の密度関数は
(2π)^(-n/2)exp(-(z1^2+z2^2+・・・+zn^2)/2)
この密度の大きさは原点からの距離だけで決まり,方向には無関係ですから,xi=zi/|z|とおくとx=(x1,x2,・・・,xn)は単位球面上で一様分布する点となります.このとき,
x1^2+x2^2+・・・+xk^2=(z1^2+z2^2+・・・+zk^2)/(z1^2+z2^2+・・・+zk^2+zk+1^2+・・・+zn^2)
z1^2+z2^2+・・・+zk^2は自由度kのカイ2乗分布,zk+1^2+・・・+zn^2は自由度n−kのカイ2乗分布にしたがいますから,x1^2+x2^2+・・・+xk^2の分布はベータ分布Beta(k/2,(n-k)/2)となります.
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
(1)正弦波の確率分布
逆正弦分布の確率密度関数は
f(x)=1/π・{x(1-x)}^(1/2)
となりますが,n=2,k=1すなわち円周上に一様分布する点,正弦波の確率分布に関係して出現します.
たとえば,正弦波がx=asinθで与えられ,θが−π/2≦θ≦π/2の範囲の一様分布に従うとき,xは1つの連続確率変数と考えることができます.そして,xの確率密度関数はp(θ)=1/2πより,
f(x)dx=2p(θ)dθ=1/π・{a^2-x^2}^(1/2)
を得ることができます.この分布は逆正弦分布の確率密度関数を位置=尺度変換したものとなっています.
(2)ランダムウォークの確率分布
コインを投げて表がでれば右へε,裏がでれば左へε進む人のモデルを考える.n回の試行ののち,その人がx=kεのところにいる確率は,nを十分大にすると,2項分布の正規近似により,分散σ^2=nε^2の正規分布(0,nε^2)に近づきます.
それでは,彷徨の仕方はどうなるでしょうか? 右,左へ進む確率はそれぞれ1/2ですから,原点の近くをウロウロし,右,左の領域に半分ずつ存在したと予測するのが常識的ですが,この常識は破られます.実際にはどちらか片方にばかりにいる確率が大なのです.
結論を先にいうと,この人が原点より右にいる時間をx(左にいる時間を1−x)とするとその確率密度は
f(x)=1/π・{x(1-x)}^(1/2)
であり,対応する累積分布関数は
F(x)=2/πarcsin(√x)
となります.
この分布の平均は1/2ですが,そこはU字型分布の谷底であり,一番確率が小さいところになっています.つまり,右,左の領域に半分ずついるのは,もっとも起こりそうにない事象なのです.この分布はxが0または1に近いほど確率が高く0,1で発散する,ということは常にどちらか片側の領域にいることとよく符合しています.
逆正弦分布はベータ分布の特別な場合であり,1次元ブラウン運動の滞在確率に関係して現れます.そしてその滞在確率の式中にarcsinが現れることから,「1次元ブラウン運動の逆正弦則」という名で呼ばれます.
ランダムウォークのような非確定データは,統計的に取り扱われなければなりませんが,このように,ベータ分布は対称ランダムウォークなどマルコフ過程の解析に応用されています.
===================================