■正規楕円とt楕円
コラム「n次元楕円の陰と影」では,Xがn次元正規分布に従い,その分散共分散行列がΣで表されるとき,n次元楕円
(X-μ)'Σ^(-1)(x-μ)=c^2
の内部の点の全確率pが自由度nのχ2分布
p=χ2(n)
で与えられることを示した.
また,それを(Xi,Xj)平面に投影した場合,全体のp%がその内側に入るような楕円を描くには,上記のc^2を自由度2のχ2分布(すなわち,指数分布)によって,
c^2=-2ln(p)
と定めればよいこともわかった.
この結果は,確率変数xiが標準正規分布N(0,1)に従うとき,xi^2の分布は自由度1のχ2分布,また,n個の変数xiがすべてN(0,1)に従うならば,Σxi^2は自由度nのχ2分布になる,すなわち,
x〜N(0,1) → x^2〜χ2(1)
xi〜N(0,1) → Σxi^2〜χ2(n)
より,直感的にも理解されるところであろう.
それでは,Xがn次元t分布に従うとき,当該の問題の解はどのようになるだろうか?
===================================
【1】t楕円
数学の定理や命題において,2〜3次元で成立することは一般次元でも同じように成立することが多い.しかし,
x〜t(df) → x^2〜{t(df)}^2=F(1,df)
は成り立つものの,これは一般次元では成立しない.決して
xi〜t(df) → Σxi^2〜{t(df)}^(n+1)=F(n+1,df)
などというでたらめを書かないように!...というわけで,解を導き出してみたい.
小生が統計の問題を解く際に,いつも頼みの綱にしているいわば命綱が,Kotz,Balakrishnan,Johnson「Continuous univariate distributions 2nd ed.」John Wiley & Sonsである.ところが,どうしたわけか「Continuous multivariate distributions」の新版(2nd ed.)では多変量t分布,Wishart分布がオミットされている.生命線を絶たれたかに思われたのだが,蓑谷千鳳彦「すぐに役立つ統計分布」東京図書を参考にすることができたのは幸運であった.
それによると,自由度mのn変量t分布の同時確率密度関数は,
f(X,μ,Σ)=Γ((m+n)/2)/Γ(m/2)(mπ)^(n/2)|Σ|^(-1/2)(1+(X-μ)'Σ^(-1)(x-μ)/n)^(-(m+n)/2)
で与えられる.ここで,μは平均ベクトル,Σはn×n次の分散共分散行列である.
一般に,n次元楕円
(X-μ)'Σ^(-1)(x-μ)=c^2
を直交座標系(O:X1,X2,X3,・・・)での関数式で表すと交差項XiXjが出現するため,取り扱いが厄介である.そこで,このn次元楕円は,座標変換により,別の直交座標系(o:x1,x2,x3,・・・)において,以下のような標準形
x1^2/a^2+x2^2/b^2+・・・+xn^2/n^2=1
で表されるものとする.
正定値対称行列のとき,行列の固有値を
λ1,・・・,λn
とすると,すべての固有値は正であり,
λ1x1^2+λ2x2^2+・・・+λnxn^2=c^2 (c^2は定数)
が成り立つから,楕円半径は
a^2=c^2/λ1,b^2=c^2/λ2,・・・,n^2=c^2/λn
で表されることになる.
また,このとき,
|Σ|=λ1・・・λn
であり,
|(X−μ)’Σ^(-1)(X−μ)|
=|(X1−μ1)^2/λ1+・・・+(Xn−μn)^2/λn|
=c^2
の値は不変であるから,変換後の座標で
(X1−μ1)/√λ1=x1,・・・,(Xn−μn)/√λn=xn
と標準化すると,球面上で一様分布する点となる.
そこで,正規分布の場合と同様に,当該の積分
∫∫・・∫∫f(X,μ,Σ)dX1dX2・・dXn
を直交座標でなく極座標で求めてみることにする.すなわち,被積分関数を原点を中心とする半径rの球面上で積分し,次にr=0からr=cまで積分すると,半径rの球面上で被積分関数は一定値(1+r^2/n)^((m+n)/2)をとり,n次元超球の体積をVnとすると表面積はnVnr^(n-1),また,Vn=π^(n/2)/Γ(n/2+1)であるから,
p=∫(0,c)r^(n-1)(1+r^2/n)^((m+n)/2)dr*2/B(n/2,m/2)/m^(n/2)
z=(1+r^2/n)と変数変換すると
p=1/B(n/2,m/2)∫(0,c^2/n)z^(n/2-1)(1+z)^((m+n)/2)dz
このように,球面上で一様分布する点はベータ分布に密接に関係していることが示された.この不完全ベータ関数は自由度(n,m)のF分布であり,また,c^2/nまでの定積分であるから,全体のp%がその内側に入るような楕円を描くには,
p=nF(n,m)
より,上記のc^2を自由度(n,m)のF分布の下側確率×nによって定めればよいことが理解されるだろう.
このことは,幾何学的には,
(1)t分布では正規分布よりも一回り大きな正方形を考えなければならない.
(2)正規変量の2乗和を扱うときはχ2円領域,t変量の2乗和を扱うときは,それよりも一回り大きなF円領域を考えなければならない.
ということであって,とくに,F円領域はScheffeの多重比較法の考え方に類似しているのである.
===================================
【2】n次元正規楕円と相関を考慮したモンテカルロ法
正規乱数を発生させる方法に,ボックス・ミューラー(Box-Muller)法がある.ボックス・ミューラー法は,レイリー分布を応用して正規乱数を発生させる方法であるから,同じ標的問題の解であるマクスウェル分布など一般化したカイ分布(カイ2乗分布の平方根の分布)を用いることによって,n個の一様乱数からn個の互いに独立な正規乱数を容易に作り出すことができる.
また,そのように凝った手を用いずとも,n個の正規乱数を単純に組み合わせるだけであっても,そのランダム性は失われないわけであるから,相関のないn次元正規乱数を発生させることは可能である.
しかし,通常,変数同士には相関があり,どうしても相関を考慮に入れたモンテカルロ法が必要になる場合がある.そこで,この節では分散共分散行列のコレスキー分解に基づいた多変量正規乱数発生法について紹介することにしたい.
n次元正規分布の同時確率密度関数は
f(X,μ,Σ)=(2π)^(n/2)Σ^(-1/2)exp(-(X-μ)'Σ^(-1)(x-μ)/2}
と表すことができるが,Σが分散共分散行列であり,(X-μ)'Σ^(-1)(x-μ)=c^2が等確率楕円である.
この等確率楕円が描けるような多変量正規乱数発生法の原理は簡単で,互いに独立な標準正規乱数X1,X2,・・・,Xnから,
Y1=μ1+a11X1
Y2=μ2+a21X1+a22X2
・・・・・・・・・・・・・・
Yn=μn+an1X1+an2X2+・・・+annXn
とおくと,Yiは正規変数の線形結合であるから平均値μiの正規分布することは明らかだし,YiとYjが相関することも理解できるだろう.
その際の分散・共分散σijは,
σij=ai1aj1+ai2aj2+・・・+aijajj (i≧j)
に等しい.したがって,あとはaijが求められればよいことになるが,それには正値対称行列Σのコレスキー分解
Σ=LL’ (Lは下三角行列,L’はLの転置行列)
によって
Y=LX+μ
と置けばよいことが示される.詳細については,宮武・脇本共著「乱数とモンテカルロ法」共立出版を参照されたい.
下三角行列とは行列要素の上方の三角部が0で対角要素と下方の三角部だけからなる行列であるが,最小2乗法のような正値対称行列ではLU分解やコレスキー分解で効率的に連立1次方程式を解くことができ,計算スピードも加速される.また,修正コレスキー分解とは
Σ=LDL’ (Dは対角行列)
のように三角化と対角化を行うマトリックス計算法である.
ガウス消去法やガウス・ジョルダン法は,丸め誤差がいたずらをするので基本的には不安定であるが,コレスキー分解は計算精度の点でも優れていることが知られている.コレスキー分解では手間もガウス消去法の半分で済むから,格段と能率がよい解法なのであるが,相関を考慮に入れた多変量正規乱数発生にも応用できるのである.意外な使い道であり,予期せざる効能といってもよいだろう.
===================================