標的問題の解とχ分布

■標的問題の解とχ分布

　固定した標的に向けて銃を発砲するとき，銃弾の命中点の分布を考えるのが２次元標的問題です．この問題は任意の次元に拡張して考えることができます．ここで，確率変数ｘが標準正規分布N(0,1)に従うとき，ｘ2の分布は自由度１のχ2分布，また，ｎ個の変数ｘiがすべてN(0,1)に従うならば，Σｘi2は自由度ｎのχ2分布になります．すなわち，χ2分布は距離の２乗の和の分布と考えることができますが，そもそも，距離の２乗の和にとくに具体的な意味があるようには思えません．むしろ，２乗を取り去って距離の分布としたほうが問題としては自然です．そこで，χ2分布の平方根分布（χ分布）について考えてみることが必要になります．

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

（χ分布の密度関数）

　自由度ｎのχ2分布の確率密度関数

f(x)=1/{2^(n/2)Γ(n/2)}･(x)^(n/2-1)･exp(-x/2)　　 0≦x＜∞

において，x=y2と変数変換すると，dx=2ydyより，χ分布の確率密度関数

f(x)=1/{2^(n/2-1)Γ(n/2)}･(x)^(n-1)･exp(-x^2/2)　　 0≦x＜∞

が得られます．

mean=2^(1/2)Γ((n+1)/2)/Γ(n/2)

variance=2Γ(n/2+1)/Γ(n/2)-{2Γ((n+1)/2)/Γ(n/2)}^2

mode=sqr(n-1)　　 (n>1)

とくに，自由度１のχ分布は

半正規分布:f(x)=1/σsqr(2/π)exp(-x^2/2σ2)

であり，この分布は期待値が０の正規分布:f(x)=1/σsqr(2π)exp(-x^2/2σ2)

をｙ軸(x=0)で折り返した分布になっています．また，自由度２のχ分布は

レイリー分布:f(x)=x/σ^2exp(-x^2/2σ2)

自由度３のχ分布は

マクスウェル分布:f(x)=2^(3/2)/σ^3x^2exp(-x^2/2σ2)

と命名されています．

　χ2分布は主として統計分野で用いられていますが，χ分布，とりわけ，レイリー分布は英国のレイリー卿が音響工学との関連でこの分布を発見したことに由来し，マクスウェル分布は気体分子の速度分布と関係した物理学上の重要な分布関数になっています．→【補】参照

（χ分布と標的問題の関連）

　周辺分布がともに平均０，分散σ2の正規分布となる２次元正規分布

p(x,y)dxdy=1/2πσ2･exp(-(x2+y2)/2σ2)dxdy

において，x=rcosθ，y=rsinθと極座標変換します．ヤコビアンは

D(x,y)/D(r,θ)=r

ですから

p(x,y)dxdy=1/σ2rexp(-r2/2σ2)dr*1/2πdθ

よって，ｒとｒ＋ｄｒの間に落ちる確率は1/σ2rexp(-r2/2σ2)dr

　このようにして，レイリー分布が得られますが，言い換えれば，x1,x2が正規分布N(0,1)にしたがい，独立のとき(x12+x22)^(1/2)はレイリー分布にしたがうことになります．レイリー分布はミサイルなどが目標からｒだけ離れる分布と考えることができます．なお，振幅ｒの確率分布はレイリー分布となりましたが，一方，位相θの分布はp(θ)=1/2πすなわち一様分布となります．

　レイリー分布はワイブル分布の１種でもあり，また，自由度２のχ2分布は指数分布ですから，レイリー分布は指数分布にしたがう確率変数の平方根の分布と理解することもできます．応用面では，２次元の標的問題（ミサイルなどの目標地点と実際の着弾地点の距離分布）に適用されるほかに，通信工学分野（電気回路の雑音の特定の周波数について，振幅ｒと位相θとの組合せはレイリー分布に従う）など極めて重要な応用領域をもっています．また，ポアソン過程で生成された個々の点の最近接点(nearest neighbor)との距離の分布として，あるいはハザードレートを計算すると，h(x)=x/σ^2よりlinearly IFRの性質を持つ寿命分布のモデルとして利用されています．

　同様のことを３次元で行うと，

３次元空間の直角座標（ｘ，ｙ，ｚ）←→球面座標（ｒ，θ，φ）の座標変換は

x=rsinθcosφ,y=rsinθsinφ,z=rcosφ

ヤコビアンは

D(x,y,z)/D(r,θ,φ)=r2sinθ

　ここで，方向を表すベクトルを球面座標でｓ＝（θ，φ）とおき，

ds=sinθdθdφ,dxdydz=r^2drds

のような変換を行えば，３次元正規分布

p(x,y,z)dxdydz=sqr(2/π)σ3exp{-(x2+y2+z2)/2σ2)r2dr*1/4πds

に変換され，r2=x2+y2+z2よりマクスウェル分布が得られます．また，ｓは球面上で確率密度1/4πの一様分布をすることも理解されます．

　マクスウェル，レイリーの後，ミラーが多次元正規分布での原点からのユークリッド距離の確率分布として一般的なχ分布を導いています．ミラーにならって，任意の次元のχ分布を導いてみましょう．

　ｎ次元正規分布は

p(x1,x2,x3,･･･,xn)=1/(2π)n/2σnexp{-(x12+x2+･･･+xn2)/2σ2}

で与えられます．多次元正規分布の場合，低次元の場合とは違って，密度の裾にあたる領域に大部分のデータが存在します．また，ｎ次元ユークリッド空間の点(x1,x2,x3,･･･,xn)は

ｒ>0,0≦θ1,θ2,･･･,θn-2≦π,0≦θn-1≦2πを満たすｒ,θ1,θ2,･･･,θn-1によって，

x1=rcosθ1

x2=rsinθ1cosθ2

x3=rsinθ1sinθ2cosθ3

････････････････････

xn-1=rsinθ1sinθ2･･･sinθn-2cosθn-1

xn=rsinθ1sinθ2･･･sinθn-2sinθn-1

と表すことができます（ただし，ｎ＝２のときは，周知のとおり，ｘ1＝ｒｃｏｓθ1，ｘ2＝ｒｓｉｎθ1とする）．

（ｒ,θ1,θ2,･･･,θn-1）がｎ次元極座標で，そのとき，ヤコビアンD(x1,･･･,xn)/D(r,θ1,･･･,θn-1)は

ｒ^(n-1)sin^(n-2)θ1･･･sin^2θn-3sinθn-2

となりますから，同様にして

ds=sin^(n-2)θ1･･･sin^2θn-3sinθn-2dθ1dθ2･･･dθn-1

dx1dx2･･･dxn=ｒ^(n-1)drds

　ここで，ｎ次元単位超球の表面積をＳn-1=ｎＶnで表すと，(2*π^(n/2))/Γ(n/2)はｎ次元単位超球の表面積であり，→【補】参照

p(x1,x2,x3,･･･,xn)dx1dx2･･･dxn=nVn/(2π)n/2σnexp{-r2/2σ2}r^(n-1)dr1/nVnds

Ｖn=π^(n/2)/Γ(n/2+1)より

p(x1,x2,x3,･･･,xn)dx1dx2･･･dxn=1/(2^(n/2-1)Γ(n/2))σnexp{-r2/2σ^２}r^(n-1)dr*Γ(n/2)/(2*π^(n/2))ds

が得られます．したがって，

1/(2^(n/2-1)Γ(n/2))σnexp{-r2/2σ^２}r^(n-1)

がχ分布の密度関数となります．

　このような理由から，近年，χ分布は一般化されたレイリー分布（generalized Rayleigh distribution）として論文にも引用されることが多くなっています．χ分布はとくに電気通信分野で広い応用範囲を有して，その分野ではｍ分布とも呼ばれています．

【補】マクスウェルとレイリー

　キャベンディッシュは既知の質量をもつ２つの物体間に働く万有引力を初めて実測した人物として人々に記憶されていますが，彼の一族による基金の調達により，英国ケンブリッジにキャベンディッシュ研究所が設立されました．この研究所は物理学の研究および教育機関であり，物理学の近代的大発展はこの研究所と切り離すことのできない関係にあります．

　マクスウェル，レイリーはともに所長を努めていますが，以後，Ｊ．Ｊ．トムソン，ラザフォード，ブラッグなどそうそうたる面々がキャベンディッシュ研究所の指導を引き継いでいます．この有名な研究所はその後もこの分野で多くのノーベル賞受賞者を育み，物理学の中心的な役割を担って，原子核物理学における世界の中心的な存在となっていったのですが，ブラッグ卿はこの研究所の所長に就任したとき，過去の栄光にとらわれることなかれ，流行を追うな等々，刮目に値する５項目の注意事項を並べたとされています．

　マックスウェルの最大の功績はさまざまな電気的・磁気的現象を表すことのできる簡単な方程式を見いだし，電気と磁気がそれぞれ単独では存在できないことを明らかにしたことですが，光にも興味をもち，光の３原色を青・緑・赤としこれらを適当に混合して任意の色が得られるとしています．この原理は今日，カラーテレビ，カラー印刷等で応用されているので，ご存知の方も多かろうと思います．

　また，レイリー卿（本名ウィリアム・ストラット）はアルゴンの発見により，１９０４年にはノーベル物理学賞を受けていますが，非常に多彩な研究経歴の持ち主で，物理学の多くの領域で才能をふるったことで知られています．音響工学や光学にも多くの業績を残していますが，それ以外では，たとえば，水面上には油の単分子膜が存在すること，油の分子の直径は約１nmであることを推察しています．１９世紀の終わり頃，分子はまだ仮説的な存在であって，いわんや，分子の構造や大きさなどを実験的に測定することは不可能でしたから，大変な慧眼であったというわけです．

【補】ｎ次元単位超球の体積Ｖnと表面積Ｓn-1

　ガウス積分をｎ次元に拡張し，

I=int(-∞,∞)exp(-x12+x22+･･･+xn2)dx1dx2･･･dxn

を考えるとint(-∞,∞)exp(-x2)dx=π^(1/2)のｎ重積分より，直ちに

I=π^(n/2)を得ることができます．

　ｎ次元ガウス積分を別の方法，すなわち，直交座標でなく極座標で求めてみましょう．球に相当するｎ次元の図形を超球と呼びます．ｎ次元単位超球{x12+x22+･･･+xn2≦1}の体積をＶnとすると，Ｖ1=2（直径）,Ｖ2=π（面積）,Ｖ3=4π/3（体積）はご存知でしょう．また，単位超球の表面積Ｓn-1はｎＶn，半径ｒのｎ次元球の体積はＶnｒ^n，表面積はｎＶnｒ^(n-1)となります．

　ガウス積分の被積分関数を原点を中心とする半径ｒの球面上で積分し，次にｒ＝０からｒ＝∞まで積分すると，半径ｒの球面上で被積分関数は一定値exp(-r2)をとり，表面積はｎＶnｒ^(n-1)ですから，

I=int(0,∞)exp(-r2)ｎＶnｒ^(n-1)dr

=ｎＶnint(0,∞)r^(n-1)exp(-r2)dr

z=r2と変数変換するとdz=2rdrより

I=ｎＶn/2int(0,∞)z^(n/2-1)exp(-z)dz

=Ｖnn/2Γ(n/2)　　　　n/2Γ(n/2)=Γ(n/2+1)

=ＶnΓ(n/2+1)

したがって，

Ｖn=π^(n/2)/Γ(n/2+1)

を得ることができます．また，Γ(m+1)=m!より，この結果は，形式的に

Ｖn=π^(n/2)/(n/2)!

と書くことができます．

　ｎが整数のとき，実際にＶnの値を計算してみると，超球の体積はｎ＝５のとき最大８π2／１５＝５．２６３７・・・となり，以後は減少します．

１次元　　２次元　　３次元　　４次元　　５次元　　６次元

　２　　　 3.14　　　4.19　　　4.93　　　5.263　　 5.167

（次元を整数に限らなければ５．２５６次元で最大となり，そのときの体積は5.277･･･である．）

Ｖn-1がわかれば，Ｖnは漸化式：

Ｖn/Ｖn-1=Γ(1/2)Γ{(n+1)/2}/Γ(n/2+1)=B(1/2,(n+1)/2)

によって求めることができますが，この計算は面倒ですから，Ｖn-2との漸化式

Ｖn/Ｖn-2=2π/n

を用いると任意のｎに対して

ｎが奇数であればＶn=2(2π)^((n-1)/2)/n!!

ｎが偶数であればＶn=(2π)^(n/2)/n!!

とも書けることも理解されます．

ｎ→∞のとき

Ｖn/Ｖn-2=2π/n→０

Ｓn-1/Ｓn-3=nＶn/(n-2)Ｖn-2=2π/(n-2)→０

ですから，不思議なことに，単位球面の体積や表面積はｎ→∞のとき０に収束するのです．また，このことから，ｎ次元単位超立方体[-1,1]^nにおいて，単位超球が占める比率は，ｎ＝２であればπ／４(79%)であるが，ｎ＝５のときは16%に下落し，ｎ＝１０となると0.25%になることも理解されます．高次元において，超立方体内に一様分布する標本を考えるとき，低次元の場合とは対照的に，大部分のデータは超球外に位置することになります．

【補】ウォリスの公式

比Ｖn-1/Ｖn-2=B(1/2,n/2)は自由度ｎのｔ分布の定数であり，実際，フィッシャーはｎ個の観測値の標本平均と母平均の差（距離）を標本標準偏差で割った統計量ｔの分布をｎ次元ユークリッド空間を使って導きだしています．

1/2B(1/2,(n+1)/2)=integral(0-π/2)(sinθ)^ndθ

この値は

n=2k（偶数）なら1･3･･･(2k-1)/2･4･･･(2k)*π/2

n=2k+1（奇数）なら2･4･･･(2k)/1･3･･･(2k+1)

これより，

lim1･3･･･(2k-1)/2･4･･･(2k)*root(k)=1/sqr(π)

変形するとウォリスの公式

(2n)!/(2^nn!)^2sqr(n)=1/sqr(π)

が得られる．