■標的問題の解とχ分布
固定した標的に向けて銃を発砲するとき,銃弾の命中点の分布を考えるのが2次元標的問題です.この問題は任意の次元に拡張して考えることができます.ここで,確率変数xが標準正規分布N(0,1)に従うとき,x2の分布は自由度1のχ2分布,また,n個の変数xiがすべてN(0,1)に従うならば,Σxi2は自由度nのχ2分布になります.すなわち,χ2分布は距離の2乗の和の分布と考えることができますが,そもそも,距離の2乗の和にとくに具体的な意味があるようには思えません.むしろ,2乗を取り去って距離の分布としたほうが問題としては自然です.そこで,χ2分布の平方根分布(χ分布)について考えてみることが必要になります.
===================================
(χ分布の密度関数)
自由度nのχ2分布の確率密度関数
f(x)=1/{2^(n/2)Γ(n/2)}・(x)^(n/2-1)・exp(-x/2) 0≦x<∞
において,x=y2と変数変換すると,dx=2ydyより,χ分布の確率密度関数
f(x)=1/{2^(n/2-1)Γ(n/2)}・(x)^(n-1)・exp(-x^2/2) 0≦x<∞
が得られます.
mean=2^(1/2)Γ((n+1)/2)/Γ(n/2)
variance=2Γ(n/2+1)/Γ(n/2)-{2Γ((n+1)/2)/Γ(n/2)}^2
mode=sqr(n-1) (n>1)
とくに,自由度1のχ分布は
半正規分布:f(x)=1/σsqr(2/π)exp(-x^2/2σ2)
であり,この分布は期待値が0の正規分布:f(x)=1/σsqr(2π)exp(-x^2/2σ2)
をy軸(x=0)で折り返した分布になっています.また,自由度2のχ分布は
レイリー分布:f(x)=x/σ^2exp(-x^2/2σ2)
自由度3のχ分布は
マクスウェル分布:f(x)=2^(3/2)/σ^3x^2exp(-x^2/2σ2)
と命名されています.
χ2分布は主として統計分野で用いられていますが,χ分布,とりわけ,レイリー分布は英国のレイリー卿が音響工学との関連でこの分布を発見したことに由来し,マクスウェル分布は気体分子の速度分布と関係した物理学上の重要な分布関数になっています.→【補】参照
(χ分布と標的問題の関連)
周辺分布がともに平均0,分散σ2の正規分布となる2次元正規分布
p(x,y)dxdy=1/2πσ2・exp(-(x2+y2)/2σ2)dxdy
において,x=rcosθ,y=rsinθと極座標変換します.ヤコビアンは
D(x,y)/D(r,θ)=r
ですから
p(x,y)dxdy=1/σ2rexp(-r2/2σ2)dr*1/2πdθ
よって,rとr+drの間に落ちる確率は1/σ2rexp(-r2/2σ2)dr
このようにして,レイリー分布が得られますが,言い換えれば,x1,x2が正規分布N(0,1)にしたがい,独立のとき(x12+x22)^(1/2)はレイリー分布にしたがうことになります.レイリー分布はミサイルなどが目標からrだけ離れる分布と考えることができます.なお,振幅rの確率分布はレイリー分布となりましたが,一方,位相θの分布はp(θ)=1/2πすなわち一様分布となります.
レイリー分布はワイブル分布の1種でもあり,また,自由度2のχ2分布は指数分布ですから,レイリー分布は指数分布にしたがう確率変数の平方根の分布と理解することもできます.応用面では,2次元の標的問題(ミサイルなどの目標地点と実際の着弾地点の距離分布)に適用されるほかに,通信工学分野(電気回路の雑音の特定の周波数について,振幅rと位相θとの組合せはレイリー分布に従う)など極めて重要な応用領域をもっています.また,ポアソン過程で生成された個々の点の最近接点(nearest neighbor)との距離の分布として,あるいはハザードレートを計算すると,h(x)=x/σ^2よりlinearly IFRの性質を持つ寿命分布のモデルとして利用されています.
同様のことを3次元で行うと,
3次元空間の直角座標(x,y,z)←→球面座標(r,θ,φ)の座標変換は
x=rsinθcosφ,y=rsinθsinφ,z=rcosφ
ヤコビアンは
D(x,y,z)/D(r,θ,φ)=r2sinθ
ここで,方向を表すベクトルを球面座標でs=(θ,φ)とおき,
ds=sinθdθdφ,dxdydz=r^2drds
のような変換を行えば,3次元正規分布
p(x,y,z)dxdydz=sqr(2/π)σ3exp{-(x2+y2+z2)/2σ2)r2dr*1/4πds
に変換され,r2=x2+y2+z2よりマクスウェル分布が得られます.また,sは球面上で確率密度1/4πの一様分布をすることも理解されます.
マクスウェル,レイリーの後,ミラーが多次元正規分布での原点からのユークリッド距離の確率分布として一般的なχ分布を導いています.ミラーにならって,任意の次元のχ分布を導いてみましょう.
n次元正規分布は
p(x1,x2,x3,・・・,xn)=1/(2π)n/2σnexp{-(x12+x2+・・・+xn2)/2σ2}
で与えられます.多次元正規分布の場合,低次元の場合とは違って,密度の裾にあたる領域に大部分のデータが存在します.また,n次元ユークリッド空間の点(x1,x2,x3,・・・,xn)は
r>0,0≦θ1,θ2,・・・,θn-2≦π,0≦θn-1≦2πを満たすr,θ1,θ2,・・・,θn-1によって,
x1=rcosθ1
x2=rsinθ1cosθ2
x3=rsinθ1sinθ2cosθ3
・・・・・・・・・・・・・・・・・・・・
xn-1=rsinθ1sinθ2・・・sinθn-2cosθn-1
xn=rsinθ1sinθ2・・・sinθn-2sinθn-1
と表すことができます(ただし,n=2のときは,周知のとおり,x1=rcosθ1,x2=rsinθ1とする).
(r,θ1,θ2,・・・,θn-1)がn次元極座標で,そのとき,ヤコビアンD(x1,・・・,xn)/D(r,θ1,・・・,θn-1)は
r^(n-1)sin^(n-2)θ1・・・sin^2θn-3sinθn-2
となりますから,同様にして
ds=sin^(n-2)θ1・・・sin^2θn-3sinθn-2dθ1dθ2・・・dθn-1
dx1dx2・・・dxn=r^(n-1)drds
ここで,n次元単位超球の表面積をSn-1=nVnで表すと,(2*π^(n/2))/Γ(n/2)はn次元単位超球の表面積であり,→【補】参照
p(x1,x2,x3,・・・,xn)dx1dx2・・・dxn=nVn/(2π)n/2σnexp{-r2/2σ2}r^(n-1)dr1/nVnds
Vn=π^(n/2)/Γ(n/2+1)より
p(x1,x2,x3,・・・,xn)dx1dx2・・・dxn=1/(2^(n/2-1)Γ(n/2))σnexp{-r2/2σ2}r^(n-1)dr*Γ(n/2)/(2*π^(n/2))ds
が得られます.したがって,
1/(2^(n/2-1)Γ(n/2))σnexp{-r2/2σ2}r^(n-1)
がχ分布の密度関数となります.
このような理由から,近年,χ分布は一般化されたレイリー分布(generalized Rayleigh distribution)として論文にも引用されることが多くなっています.χ分布はとくに電気通信分野で広い応用範囲を有して,その分野ではm分布とも呼ばれています.
【補】マクスウェルとレイリー
キャベンディッシュは既知の質量をもつ2つの物体間に働く万有引力を初めて実測した人物として人々に記憶されていますが,彼の一族による基金の調達により,英国ケンブリッジにキャベンディッシュ研究所が設立されました.この研究所は物理学の研究および教育機関であり,物理学の近代的大発展はこの研究所と切り離すことのできない関係にあります.
マクスウェル,レイリーはともに所長を努めていますが,以後,J.J.トムソン,ラザフォード,ブラッグなどそうそうたる面々がキャベンディッシュ研究所の指導を引き継いでいます.この有名な研究所はその後もこの分野で多くのノーベル賞受賞者を育み,物理学の中心的な役割を担って,原子核物理学における世界の中心的な存在となっていったのですが,ブラッグ卿はこの研究所の所長に就任したとき,過去の栄光にとらわれることなかれ,流行を追うな等々,刮目に値する5項目の注意事項を並べたとされています.
マックスウェルの最大の功績はさまざまな電気的・磁気的現象を表すことのできる簡単な方程式を見いだし,電気と磁気がそれぞれ単独では存在できないことを明らかにしたことですが,光にも興味をもち,光の3原色を青・緑・赤としこれらを適当に混合して任意の色が得られるとしています.この原理は今日,カラーテレビ,カラー印刷等で応用されているので,ご存知の方も多かろうと思います.
また,レイリー卿(本名ウィリアム・ストラット)はアルゴンの発見により,1904年にはノーベル物理学賞を受けていますが,非常に多彩な研究経歴の持ち主で,物理学の多くの領域で才能をふるったことで知られています.音響工学や光学にも多くの業績を残していますが,それ以外では,たとえば,水面上には油の単分子膜が存在すること,油の分子の直径は約1nmであることを推察しています.19世紀の終わり頃,分子はまだ仮説的な存在であって,いわんや,分子の構造や大きさなどを実験的に測定することは不可能でしたから,大変な慧眼であったというわけです.
【補】n次元単位超球の体積Vnと表面積Sn-1
ガウス積分をn次元に拡張し,
I=int(-∞,∞)exp(-x12+x22+・・・+xn2)dx1dx2・・・dxn
を考えるとint(-∞,∞)exp(-x2)dx=π^(1/2)のn重積分より,直ちに
I=π^(n/2)を得ることができます.
n次元ガウス積分を別の方法,すなわち,直交座標でなく極座標で求めてみましょう.球に相当するn次元の図形を超球と呼びます.n次元単位超球{x12+x22+・・・+xn2≦1}の体積をVnとすると,V1=2(直径),V2=π(面積),V3=4π/3(体積)はご存知でしょう.また,単位超球の表面積Sn-1はnVn,半径rのn次元球の体積はVnr^n,表面積はnVnr^(n-1)となります.
ガウス積分の被積分関数を原点を中心とする半径rの球面上で積分し,次にr=0からr=∞まで積分すると,半径rの球面上で被積分関数は一定値exp(-r2)をとり,表面積はnVnr^(n-1)ですから,
I=int(0,∞)exp(-r2)nVnr^(n-1)dr
=nVnint(0,∞)r^(n-1)exp(-r2)dr
z=r2と変数変換するとdz=2rdrより
I=nVn/2int(0,∞)z^(n/2-1)exp(-z)dz
=Vnn/2Γ(n/2) n/2Γ(n/2)=Γ(n/2+1)
=VnΓ(n/2+1)
したがって,
Vn=π^(n/2)/Γ(n/2+1)
を得ることができます.また,Γ(m+1)=m!より,この結果は,形式的に
Vn=π^(n/2)/(n/2)!
と書くことができます.
nが整数のとき,実際にVnの値を計算してみると,超球の体積はn=5のとき最大8π2/15=5.2637・・・となり,以後は減少します.
1次元 2次元 3次元 4次元 5次元 6次元
2 3.14 4.19 4.93 5.263 5.167
(次元を整数に限らなければ5.256次元で最大となり,そのときの体積は5.277・・・である.)
Vn-1がわかれば,Vnは漸化式:
Vn/Vn-1=Γ(1/2)Γ{(n+1)/2}/Γ(n/2+1)=B(1/2,(n+1)/2)
によって求めることができますが,この計算は面倒ですから,Vn-2との漸化式
Vn/Vn-2=2π/n
を用いると任意のnに対して
nが奇数であればVn=2(2π)^((n-1)/2)/n!!
nが偶数であればVn=(2π)^(n/2)/n!!
とも書けることも理解されます.
n→∞のとき
Vn/Vn-2=2π/n→0
Sn-1/Sn-3=nVn/(n-2)Vn-2=2π/(n-2)→0
ですから,不思議なことに,単位球面の体積や表面積はn→∞のとき0に収束するのです.また,このことから,n次元単位超立方体[-1,1]^nにおいて,単位超球が占める比率は,n=2であればπ/4(79%)であるが,n=5のときは16%に下落し,n=10となると0.25%になることも理解されます.高次元において,超立方体内に一様分布する標本を考えるとき,低次元の場合とは対照的に,大部分のデータは超球外に位置することになります.
【補】ウォリスの公式
比Vn-1/Vn-2=B(1/2,n/2)は自由度nのt分布の定数であり,実際,フィッシャーはn個の観測値の標本平均と母平均の差(距離)を標本標準偏差で割った統計量tの分布をn次元ユークリッド空間を使って導きだしています.
1/2B(1/2,(n+1)/2)=integral(0-π/2)(sinθ)^ndθ
この値は
n=2k(偶数)なら1・3・・・(2k-1)/2・4・・・(2k)*π/2
n=2k+1(奇数)なら2・4・・・(2k)/1・3・・・(2k+1)
これより,
lim1・3・・・(2k-1)/2・4・・・(2k)*root(k)=1/sqr(π)
変形するとウォリスの公式
(2n)!/(2^nn!)^2sqr(n)=1/sqr(π)
が得られる.