■ガウス関数の積分と不等式(その40)
固定した標的に向けて銃を発砲するとき,銃弾の命中点の分布を考えるのが2次元標的問題です.この問題は任意の次元に拡張して考えることができます.ここで,確率変数xが標準正規分布N(0,1)に従うとき,x2の分布は自由度1のχ2分布,また,n個の変数xiがすべてN(0,1)に従うならば,Σxi2は自由度nのχ2分布になります.すなわち,χ2分布は距離の2乗の和の分布と考えることができますが,そもそも,距離の2乗の和にとくに具体的な意味があるようには思えません.むしろ,2乗を取り去って距離の分布としたほうが問題としては自然です.そこで,χ2分布の平方根分布(χ分布)について考えてみることが必要になります.
===================================
(χ分布の密度関数)
自由度nのχ2分布の確率密度関数
f(x)=1/{2^(n/2)Γ(n/2)}・(x)^(n/2-1)・exp(-x/2) 0≦x<∞
において,x=y2と変数変換すると,dx=2ydyより,χ分布の確率密度関数
f(x)=1/{2^(n/2-1)Γ(n/2)}・(x)^(n-1)・exp(-x^2/2) 0≦x<∞
が得られます.
mean=2^(1/2)Γ((n+1)/2)/Γ(n/2)
variance=2Γ(n/2+1)/Γ(n/2)-{2Γ((n+1)/2)/Γ(n/2)}^2
mode=sqr(n-1) (n>1)
とくに,自由度1のχ分布は
半正規分布:f(x)=1/σsqr(2/π)exp(-x^2/2σ2)
であり,この分布は期待値が0の正規分布:f(x)=1/σsqr(2π)exp(-x^2/2σ2)
をy軸(x=0)で折り返した分布になっています.また,自由度2のχ分布は
レイリー分布:f(x)=x/σ^2exp(-x^2/2σ2)
自由度3のχ分布は
マクスウェル分布:f(x)=2^(3/2)/σ^3x^2exp(-x^2/2σ2)
と命名されています.
χ2分布は主として統計分野で用いられていますが,χ分布,とりわけ,レイリー分布は英国のレイリー卿が音響工学との関連でこの分布を発見したことに由来し,マクスウェル分布は気体分子の速度分布と関係した物理学上の重要な分布関数になっています.
===================================
(χ分布と標的問題の関連)
周辺分布がともに平均0,分散σ2の正規分布となる2次元正規分布
p(x,y)dxdy=1/2πσ2・exp(-(x2+y2)/2σ2)dxdy
において,x=rcosθ,y=rsinθと極座標変換します.ヤコビアンは
D(x,y)/D(r,θ)=r
ですから
p(x,y)dxdy=1/σ2rexp(-r2/2σ2)dr*1/2πdθ
よって,rとr+drの間に落ちる確率は1/σ2rexp(-r2/2σ2)dr
このようにして,レイリー分布が得られますが,言い換えれば,x1,x2が正規分布N(0,1)にしたがい,独立のとき(x12+x22)^(1/2)はレイリー分布にしたがうことになります.レイリー分布はミサイルなどが目標からrだけ離れる分布と考えることができます.なお,振幅rの確率分布はレイリー分布となりましたが,一方,位相θの分布はp(θ)=1/2πすなわち一様分布となります.
レイリー分布はワイブル分布の1種でもあり,また,自由度2のχ2分布は指数分布ですから,レイリー分布は指数分布にしたがう確率変数の平方根の分布と理解することもできます.応用面では,2次元の標的問題(ミサイルなどの目標地点と実際の着弾地点の距離分布)に適用されるほかに,通信工学分野(電気回路の雑音の特定の周波数について,振幅rと位相θとの組合せはレイリー分布に従う)など極めて重要な応用領域をもっています.また,ポアソン過程で生成された個々の点の最近接点(nearest neighbor)との距離の分布として,あるいはハザードレートを計算すると,h(x)=x/σ^2よりlinearly IFRの性質を持つ寿命分布のモデルとして利用されています.
同様のことを3次元で行うと,
3次元空間の直角座標(x,y,z)←→球面座標(r,θ,φ)の座標変換は
x=rsinθcosφ,y=rsinθsinφ,z=rcosφ
ヤコビアンは
D(x,y,z)/D(r,θ,φ)=r2sinθ
ここで,方向を表すベクトルを球面座標でs=(θ,φ)とおき,
ds=sinθdθdφ,dxdydz=r^2drds
のような変換を行えば,3次元正規分布
p(x,y,z)dxdydz=sqr(2/π)σ3exp{-(x2+y2+z2)/2σ2)r2dr*1/4πds
に変換され,r2=x2+y2+z2よりマクスウェル分布が得られます.また,sは球面上で確率密度1/4πの一様分布をすることも理解されます.
===================================
マクスウェル,レイリーの後,ミラーが多次元正規分布での原点からのユークリッド距離の確率分布として一般的なχ分布を導いています.ミラーにならって,任意の次元のχ分布を導いてみましょう.
n次元正規分布は
p(x1,x2,x3,・・・,xn)=1/(2π)n/2σnexp{-(x12+x2+・・・+xn2)/2σ2}
で与えられます.多次元正規分布の場合,低次元の場合とは違って,密度の裾にあたる領域に大部分のデータが存在します.また,n次元ユークリッド空間の点(x1,x2,x3,・・・,xn)はr>0,0≦θ1,θ2,・・・,θn-2≦π,0≦θn-1≦2πを満たすr,θ1,θ2,・・・,θn-1によって,
x1=rcosθ1
x2=rsinθ1cosθ2
x3=rsinθ1sinθ2cosθ3
・・・・・・・・・・・・・・・・・・・・
xn-1=rsinθ1sinθ2・・・sinθn-2cosθn-1
xn=rsinθ1sinθ2・・・sinθn-2sinθn-1
と表すことができます(ただし,n=2のときは,周知のとおり,x1=rcosθ1,x2=rsinθ1とする).
(r,θ1,θ2,・・・,θn-1)がn次元極座標で,そのとき,ヤコビアンD(x1,・・・,xn)/D(r,θ1,・・・,θn-1)は
r^(n-1)sin^(n-2)θ1・・・sin^2θn-3sinθn-2
となりますから,同様にして
ds=sin^(n-2)θ1・・・sin^2θn-3sinθn-2dθ1dθ2・・・dθn-1
dx1dx2・・・dxn=r^(n-1)drds
ここで,n次元単位超球の表面積をSn-1=nVnで表すと,(2*π^(n/2))/Γ(n/2)はn次元単位超球の表面積であり,
p(x1,x2,x3,・・・,xn)dx1dx2・・・dxn=nVn/(2π)n/2σnexp{-r2/2σ2}r^(n-1)dr1/nVnds
Vn=π^(n/2)/Γ(n/2+1)より
p(x1,x2,x3,・・・,xn)dx1dx2・・・dxn=1/(2^(n/2-1)Γ(n/2))σnexp{-r2/2σ2}r^(n-1)dr*Γ(n/2)/(2*π^(n/2))ds
が得られます.したがって,
1/(2^(n/2-1)Γ(n/2))σnexp{-r2/2σ2}r^(n-1)
がχ分布の密度関数となります.
このような理由から,近年,χ分布は一般化されたレイリー分布(generalized Rayleigh distribution)として論文にも引用されることが多くなっています.χ分布はとくに電気通信分野で広い応用範囲を有して,その分野ではm分布とも呼ばれています.
===================================