■n次元楕円をm次元空間に投影する(その2)

 n次元楕円の投影問題は,元々,測定データのなかに飛び離れた値(外れ値:outlier)があるとき,棄却すべきか採択すべきかを判断する統計検定に由来しています.それを視覚化したものが確率楕円なのですが,確率楕円はたとえば95%のデータ点を含むような楕円として描かれます.このような確率構造が入るのは,棄却検定という統計学上の問題が設定されているからなのです.
 
 そこで,今回のコラムでは,
  (1)確率構造の入った超楕円体の投影問題を扱ってみること
にしました.また,超楕円体と超直方体の比較を行うために,
  (2)確率構造の入った超直方体の投影問題
も扱っています.
 
===================================
 
【1】集中楕円(concentrative ellipsoid)
 
 主成分分析(PCA)における第1主成分を表す直線(直交回帰直線)は,データ点のそれぞれからその直線に下した垂線も長さの2乗和を最小となるようにしたものです.これは第1主成分の分散を最大にすることに対応しています.直交回帰直線は算術平均を通り,計測値の集団の確率楕円の長軸に一致しますから,算術平均を中心として直交回帰直線を長軸とした楕円を描くと確率楕円が得られます.
 
 主成分分析は多変量データ解析において最も基本的な方法の一つですが,理解のためには固有値や固有ベクトルの知識が必要になります.これらについては(その1)をご参照願います.
 
[1]n次元正規分布の集中楕円
 
 n次元正規分布において,n個の確率変数(x1,・・・,xn)の同時確率は
  f(x,μ,Σ)=(2π)^(n/2)Σ^(-1/2)exp{−(x−μ)’Σ^(-1)(x−μ)/2}
によって与えられます.ここで,x=(x1,・・・,xn)’はデータベクトル,μ=(μ1,・・・,μn)’は平均ベクトル,Σはn×n次の分散共分散行列を表します.
 
 この節では,n次元空間内の点
  (μ1,・・・,μn)
を中心として,n次元正規分布するデータ点に対して,全体のp%がその内側に入るような確率のn次元楕円を定めるという問題を考えることにします.
 
 上式の指数部の引数を−c^2/2とおいてみると,楕円面上の点はすべて
  f(x,μ,Σ)=(2π)^(n/2)Σ^(-1/2)exp{−c^2/2}
という確率をもつ等確率楕円
  (x−μ)’Σ^(-1)(x−μ)=c^2
を表すことになります.
 
 また,(その1)のx’Hx=1との対応でいえば,
  x ←→ (x−μ)
  H ←→ Σ^(-1)
  1 ←→ c^2
ということになりますが,統計学では,x’Hxよりも分散・共分散行列Σを用いたx’Σ^(-1)xの形式の方が愛されているようです.以下,HとΣを適宜使い分けることにします.
 
 この等確率楕円面の内部の点の全確率は,多重積分
  ∫∫・・∫∫f(x,μ,Σ)dx1dx2・・dxn
により計算できます.とはいってもこのままでは計算は困難です.一般に,n次元楕円
  (x-μ)'Σ^(-1)(x-μ)=c^2
を直交座標系(O:x1,x2,x3,・・・)での関数式で表すと交差項xixjが出現するため,取り扱いが厄介だからです.
 
 そこで,このn次元楕円は,座標変換により,別の直交座標系(o:X1,X2,X3,・・・)において,以下のような標準形
  X1^2/a^2+X2^2/b^2+・・・+Xn^2/n^2=1
で表されるものとします.ここで,Xi=xi−μi,また,a,b,・・・は楕円半径を表します.
 
 分散・共分散行列Σは正定値対称行列ですから,その固有値を
  λ1,・・・,λn
とすると,すべての固有値は正であり,
  X1^2/λ1+X2^2/λ2+・・・+Xn^2/λn=c^2   (c^2は定数)
が成り立ちますから,楕円半径は
  a^2=λ1c^2,b^2=λ2c^2,・・・,n^2=λnc^2
で表されることになります.
 
 また,このとき,
  |Σ|=λ1・・・λn
であり,
  |(x−μ)’Σ^(-1)(x−μ)|
 =|X1^2/λ1+・・・+Xn^2/λn|
 =c^2
の値は不変ですから,変換後の座標で
  (x1−μ1)/√2λ1=y1,・・・,(xn−μn)/√2λn=yn
と標準化すると,(y1,・・・,yn)は球面上で一様分布する点,一方,当該の多重積分は
  ∫∫・・∫∫f(x,μ,Σ)dx1dx2・・dxn
 =∫∫・・∫∫π^(-n/2)exp(−y1^2−・・・−Xn^2)dy1dy2・・dyn
となります.
 
  I=∫・・∫exp(−y1^2−・・・−yn^2)dy1dy2・・dyn
とおくと,この積分は多重ガウス積分であり,
  I={∫exp(−y^2)dy}^n
 
 ここで,直交座標でなく極座標,すなわち,被積分関数を原点を中心とする半径rの球面上で積分し,次にr=0からr=cまで積分をするのです.すると,半径rの球面上で被積分関数は一定値exp(-r^2)をとり,n次元超球の体積をVnとすると表面積はnVnr^(n-1)ですから,
  I=∫(0,c)exp(−r^2)nVnr^(n-1)dr
   =nVn∫(0,c)r^(n-1)exp(−r^2)dr
 
 z=r^2と置換すると,dz=2rdrより,
  I=nVn/2∫(0,c^2)z^(n/2-1)exp(−z)dz
また,
  Vn=π^(n/2)/Γ(n/2+1)
と表されますから,
  I=π^(n/2)γ(n/2,c^2)/Γ(n/2)
 
 このように不完全ガンマ関数/ガンマ関数が現れましたから,結局,求めるc^2はガンマ分布の分布関数が
  γ(n/2,c^2)/Γ(n/2)
と表されることより,自由度nのχ^2分布の下側p%点で与えられることになります.
  c^2=χ^2(n:p)
 
===================================
 
[2]n次元t分布の集中楕円
 
 上の結果は,確率変数xが標準正規分布N(0,1)に従うとき,x^2の分布は自由度1のχ^2分布,また,n個の変数xiがすべてN(0,1)に従うならば,Σxi^2は自由度nのχ^2分布になる,すなわち,
  x〜N(0,1) → x^2〜χ^2(1)
  xi〜N(0,1) → Σxi^2〜χ^2(n)
より,直感的にも理解されるところです.
 
 それでは,xがn次元t分布に従うとき,当該の問題の解はどのようになるのでしょうか? 確率変数xが自由度dfのt分布に従うとき,x^2の分布は自由度(1,df)のF分布となります.
  x〜t(df) → x^2〜{t(df)}^2=F(1,df)
 
 数学の定理や命題において,1〜3次元で成立することは一般次元でも同じように成立することが多いのですが,
  x〜t(df) → x^2〜{t(df)}^2=F(1,df)
は成り立つものの,これは一般次元では成立しません.決して
  xi〜t(df) → Σxi^2〜{t(df)}^(n+1)=F(n,df)
などというでたらめを書かないように!...というわけで,解を導き出してみることにします.
 
 自由度dfのn変量t分布の同時確率密度関数は,
  f(x,μ,Σ)=Γ((df+n)/2)/Γ(df/2)(dfπ)^(n/2)|Σ|^(-1/2)(1+(x-μ)'Σ^(-1)(x-μ)/n)^(-(df+n)/2)
で与えられます.
 
 変換後の座標で
  (x1−μ1)/√λ1=y1,・・・,(xn−μn)/√λn=yn
と標準化して,正規分布の場合と同様に求めてみると,半径rの球面上で被積分関数は一定値(1+r^2/n)^((df+n)/2)をとりますから,
  p=∫(0,c)r^(n-1)(1+r^2/n)^((df+n)/2)dr*2/B(n/2,df/2)/df^(n/2)
z=(1+r^2/n)と変数変換すると
  p=1/B(n/2,df/2)∫(0,c^2/n)z^(n/2-1)(1+z)^((df+n)/2)dz
 
 このように,球面上で一様分布する点はベータ分布に密接に関係していることが示されます.この不完全ベータ関数は自由度(n,df)のF分布であり,また,c^2/nまでの定積分ですから,全体のp%がその内側に入るような楕円を描くには,pを下側確率として
  c^2/n=F(n,df:p)
したがって,上記のc^2を自由度(n,df)のF分布の下側p%点×nによって定めればよいことが理解されます.
  xi〜t(df) → Σxi^2〜nF(n,df)
 
===================================
 
[3]n次元集中楕円のm次元空間への投影
 
 xがn次元正規分布に従い,その分散共分散行列がΣで表されるとき,n次元楕円
  (x-μ)'Σ^(-1)(x-μ)=c^2
の内部の点の全確率pが自由度nのχ2分布
  c^2=χ^2(n:p)
また,xがn次元t分布に従うときは,
  c^2=nF(n,df:p)
で与えられることを示しました.
 
 以上のことは,
  (1)t分布では正規分布よりも一回り大きな領域を考えなければならない.
  (2)正規変量の2乗和を扱うときはχ^2円領域,t変量の2乗和を扱うときは,それよりも一回り大きなF円領域を考えなければならない.
ということを意味しています.
 
 次に,これらの結果をm次元空間に投影することを考えましょう.
  y1=[x1−μ1,・・・,xm−μm]
  y2=[xm+1−μm+1,・・・,xn−μn]
の同時分布:f(y1,y2)を考えることになるわけですが,
  H=Σ^(-1) =[A,B]   Σ=[O,P]
         [C,D]     [Q,R]
また,
  V=D−CA^(-1)B
と書くことにすると,
  |H|=|A||D−CA^(-1)B|=|A||V|
が得られます.
 
 これより,
  (x−μ)’Σ^(-1)(x−μ)=y1’Ay1+y2’Vy2
  f(y1,y2)=|A|^(1/2)/(2π)^(m/2)exp(−y1’Ay1/2)×|V|^(1/2)/(2π)^((n-m)/2)exp(−y2’Vy2/2)
すなわち,y1,y2は互いに独立な多変量正規分布に従うことが理解されます.
 
 このことは直観的にも明らかですから,答えはもうおわかりでしょうが,全体のp%がその内側に入るようなn次元の集中楕円をm次元空間に投影する場合,正規分布では
  c^2=χ^2(m:p)
t分布では,
  c^2=mF(m,df:p)
と定めればよいことがわかります.
 
 また,このとき,m≦nですから,
  χ^2(m:p)≦χ^2(n:p)
  mF(m,df:p)≦nF(n,df:p)
が成り立ちます.
 
 例をあげて説明しましょう.n次元正規分布に従う確率変数xをn次元楕円を(xi,xj)平面に投影する場合,当該の楕円を描くには,c^2を自由度2のχ^2分布(すなわち,指数分布)によって,
  c^2=−2ln(1−p)
と定めます.例えば,下側確率p=0.95,0.99を代入すると,それぞれc^2=6.0,9.2.
 
 逆に,c=2のとき,p=0.865となりますから,λ1,λ2を小行列Oの固有値として,軸の長さが2√λ1,2√λ2の楕円を描くと,内側に86.5%が含まれることになるのです.
 
 なお,これまでの説明で,(n次元)正規分布やt分布を仮定することが難しいのではと思われた読者もおられるかもしれません.しかし,集中楕円では,厳密な分布にこだわる必要はなく,平均値付近にデータが集中しほぼ左右対称になるような場合には正規分布やt分布で近似してもそれほど違いを生じません.
 
===================================
 
 以下に2次元・3次元の場合の当該の値を掲げますが,m次元空間に投影するとはいっても,最終的に表示するのはモニタ画面上ですから平面です.したがって,必要とされるのはm=2のときの値ということになります.
 
[4]2次元平面への投影(m=2)
 
a)c^2値
          p=0.95       p=0.99
正規分布      5.99146       9.21034
t分布(df=10)    8.20564      15.1189
t分布(df=20)    6.98566      11.6979
t分布(df=30)    6.63166      10.7807
 
b)p値
          c=1      c=2      c=3
正規分布      .393469      .864665      .988891
t分布(df=10)    .379079      .814066      .959614
t分布(df=20)    .386086      .838494      .97566
t分布(df=30)    .388504      .84702      .980463
 
===================================
 
[5]3次元空間への投影(m=3)
 
a)c^2値
          p=0.95       p=0.99
正規分布      7.77862      11.3691
t分布(df=10)   11.1161      19.7827
t分布(df=20)    9.26607      14.827
t分布(df=30)    8.73465      13.5393
 
b)p値
          c=1      c=2      c=3
正規分布      .19653      .739686      .971316
t分布(df=10)    .19692      .682058      .918658
t分布(df=20)    .196686      .708782      .945894
t分布(df=30)    .196546      .718561      .954725
 
===================================
 
【2】集中楕円の計算プログラム
 
 この節では,前節[4],[5]に掲げた
  (1)下側確率p→パーセント点c^2
  (2)パーセント点c^2→下側確率p
の近似計算を行うプログラムを紹介します.
 
 近似計算とはいっても,n次元正規分布に従う場合の平面投影(m=2)のときは正確な値が求められますし,m≧3の場合であっても相対誤差は%オーダーですから,実用的には十分な有効数字があります.
 
1000 M=2
1010 P0=.95:PP=1-P0
1020 DF=M:GOSUB *CHI2.PERCENT:PRINT UUX
1030 '
1040 DF=M
1050 FOR C=1 TO 3
1060  UUX=C*C:GOSUB *CHI2.PROB:PRINT 1-PP
1070 NEXT C
1080 '
1090 M=2
1100 P0=.95:PP=1-P0:DF2=10
1110 DF1=M:GOSUB *F.PERCENT:PRINT UUF*DF1
1120 '
1130 DF1=M
1140 FOR C=1 TO 3
1150  UUF=C*C/DF1:GOSUB *F.PROB:PRINT 1-PP
1160 NEXT C
1170 END
1180 '
1190 ' ** NORMAL DISTRIBUTION **
1200 '
1210 *NORMAL.PERCENT:
1220 XXX=-LOG(4*PP*(1-PP))
1230 UUN=SQR(XXX*(2.06118-5.72622/(XXX+11.6406)))
1240 IF PP>.5 THEN UUN=-UUN
1250 RETURN
1260 '
1270 ' ** T-DISTRIBUTION **
1280 '
1290 *T.PERCENT:
1300 GOSUB *NORMAL.PERCENT
1310 UUN=ABS(UUN)
1320 UU2=UUN*UUN
1330 AA1=(UU2+1)/DF/4
1340 AA2=((5*UU2+16)*UU2+3)/96/DF/DF
1350 AA3=(((3*UU2+19)*UU2+17)*UU2-15)/384/DF/DF/DF
1360 UUT=UUN*(1+AA1+AA2+AA3)
1370 IF PP>.5 THEN UUT=-UUT
1380 RETURN
1390 '
1400 ' ** F-DISTRIBUTION **
1410 '
1420 *F.PERCENT:
1430 IF DF1=1 THEN DF=DF2:PP=PP/2:GOSUB *T.PERCENT                        :UUF=UUT^2:PP=PP*2:RETURN
1440 IF DF2=1 THEN DF=DF2:PP=(1-PP)/2:GOSUB *T.PERCENT                      :UUF=1/UUT^2:PP=1-PP*2:RETURN
1450 IF DF1=2 THEN UUF=DF2/2*(PP^(-2/DF2)-1):RETURN
1460 IF DF2=2 THEN UUF=2/DF1/((1-PP)^(-2/DF1)-1):RETURN
1470 AA=2/9/DF1:BB=2/9/DF2:CC=1-AA:DD=1-BB
1480 GOSUB *NORMAL.PERCENT
1490 UUF=CC*DD+UUN*SQR(CC*CC*BB+DD*DD*AA-AA*BB*UUN*UUN)
1500 UUF=(UUF/(DD*DD-BB*UUN*UUN))^3
1510 RETURN
1520 '
1530 ' ** CHI-SQUARE DISTRIBUTION **
1540 '
1550 *CHI2.PERCENT:
1560 IF DF=1 THEN PP=PP/2:GOSUB *NORMAL.PERCENT                         :UUX=UUN*UUN:PP=PP*2:RETURN
1570 IF DF=2 THEN UUX=-2*LOG(PP):RETURN
1580 GOSUB *NORMAL.PERCENT
1590 UUX=2/(9*DF)
1600 UUX=1-UUX+UUN*SQR(UUX)
1610 UUX=UUX^3*DF
1620 RETURN
1630 '
1640 ' ** NORMAL DISTRIBUTION **
1650 '
1660 *NORMAL.PROB:
1670 AA1=.196854
1680 AA2=.115194
1690 AA3=.000344
1700 AA4=.019527
1710 W=ABS(UUN)
1720 P0=1+W*(AA1+W*(AA2+W*(AA3+W*AA4)))
1730 P0=P0^4
1740 P0=1-.5/P0
1750 P0=.5+(P0-.5)*SGN(UUN)
1760 PP=1-P0
1770 RETURN
1780 '
1790 ' ** T-DISTRIBUTION **
1800 '
1810 *T.PROB:
1820 W1=(1-2/(3+8*DF))
1830 W2=DF*LOG(UUT*UUT/DF+1)
1840 UUN=W1*SQR(W2)
1850 GOSUB *NORMAL.PROB
1860 PP=1-P0
1870 RETURN
1880 '
1890 ' ** F-DISTRIBUTION **
1900 '
1910 *F.PROB:
1920 IF DF1=2 THEN PP=(UUF/DF2*2+1)^(-DF2/2):RETURN
1930 IF DF2=2 THEN PP=1-(2/UUF/DF1+1)^(-DF1/2):RETURN
1940 FSW=0
1950 IF UUF=0 THEN P0=0:GOTO 2060
1960 IF UUF<1 THEN UUF=1/UUF:SWAP DF1,DF2:FSW=1
1970 AA1=2/(9*DF1)
1980 AA2=2/(9*DF2)
1990 W=UUF^(1/3)
2000 W1=W+AA1-W*AA2-1
2010 W2=AA2*W*W+AA1
2020 UUN=W1/SQR(W2)
2030 IF DF2<=3 THEN UUN=UUN*(1+.08*(UUN^4)/(DF2^3))
2040 GOSUB *NORMAL.PROB
2050 IF FSW=1 THEN P0=1-P0:SWAP DF1,DF2:FSW=0
2060 PP=1-P0
2070 RETURN
2080 '
2090 ' ** CHI-SQUARE DISTRIBUTION **
2100 '
2110 *CHI2.PROB:
2120 IF DF=2 THEN PP=EXP(-UUX/2):RETURN
2130 AA1=2/(9*DF)
2140 AA2=UUX/DF
2150 W=AA2^(1/3)
2160 W1=W+AA1-1
2170 UUN=W1/SQR(AA1)
2180 GOSUB *NORMAL.PROB
2190 PP=1-P0
2200 RETURN
 
 近似計算ではどうしても満足できず,正確な値を保証したい方は,コラム「超幾何関数を用いた確率分布の計算」に掲げたプログラムをご利用下さい.以下にその主要部分だけ掲げておきます.
 
1010 FOR I=1 TO 20
1020 DF=I
1030 PRINT:PRINT DF
1040 C=1:UUX=C*C:GOSUB *CHI2.PROB.HGF:PRINT P0
1050 C=2:UUX=C*C:GOSUB *CHI2.PROB.HGF:PRINT P0
1060 C=3:UUX=C*C:GOSUB *CHI2.PROB.HGF:PRINT P0
1110 NEXT I
1120 END
1130 '
1140 ' ** CHI-SQUARE DISTRIBUTION **
1150 '
1160 *CHI2.PROB.HGF:
1170 A0=1:C0=1+DF/2
1180 A=A0:C=C0
1190 Z=UUX/2:GOSUB *CONFLUENT.HGF :G1#=G#:' [polynomial expansion]
1200 'Z=UUX/2:GOSUB *CONFLUENT.HGF1:G1#=G#:' [ continued fraction ]
1210 Z=1+DF/2:GOSUB *LOG.GAMMA:G2#=G#
1220 Z=UUX/2
1230 'P0=G1#/EXP(G2#)*Z^(DF/2)*EXP(-UUX/2)
1240 P0=LOG(G1#)-G2#+DF/2*LOG(Z)-UUX/2
1250 P0=EXP(P0)
1260 RETURN
1270 '
1280 ' *** 合流型超幾何関数 ***
1290 '
1300 *CONFLUENT.HGF:' [Kummer]
1310 EPSL=1E-09
1320 G0#=0:G#=1
1330 T#=1:K=1
1340 WHILE ABS(G0#-G#)>EPSL
1350  T#=T#*A/C*Z/K
1360  G0#=G#
1370  G#=G#+T#
1380  K=K+1
1390  A=A+1
1400  C=C+1
1410 WEND
1420 G=G#
1430 RETURN
1440 '
1450 ' *** ガウス型超幾何関数 ***
1460 '
1470 *GAUSS.HGF:
1480 EPSL=1E-09
1490 G0#=0:G#=1
1500 T#=1:K=1
1510 WHILE ABS(G0#-G#)>EPSL
1520  T#=T#*A*B/C*Z/K
1530  G0#=G#
1540  G#=G#+T#
1550  K=K+1
1560  A=A+1
1570  B=B+1
1580  C=C+1
1590 WEND
1600 G=G#
1610 RETURN
1620 '
1630 ' *** 合流型超幾何関数の連分数展開 ***
1640 '
1650 *CONFLUENT.HGF1:' 1F1(1,c,x)
1660 NZ=20
1670 G#=0
1680 'FOR ID=NZ TO 1 STEP -1
1690 ID=NZ
1700 WHILE ID>=1
1710  EVEN#=ID/(C+2*ID-1)/(C+2*ID-2)
1720  ODD#=-(C+ID-1)/(C+2*ID)/(C+2*ID-1)
1730  G#=ODD#*Z/(1#+G#)
1740  G#=EVEN#*Z/(1#+G#)
1750 ID=ID-1
1760 WEND
1770 'NEXT ID
1780 G#=-Z/C/(1#+G#)
1790 G#=1#/(1#+G#)
1800 RETURN
1810 '
1820 ' *** ガウス型超幾何関数の連分数展開 ***
1830 '
1840 *GAUSS.HGF1:' 2F1(a,1,c,x)
1850 NZ=20
1860 G#=0
1870 'FOR ID=NZ TO 1 STEP -1
1880 ID=NZ
1890 WHILE ID>=1
1900  ODD#=-(A+ID-1)*(C+ID-2)/(C+2*ID-2)/(C+2*ID-3)
1910  EVEN#=-ID*(C-A+ID-1)/(C+2*ID-1)/(C+2*ID-2)
1920  G#=EVEN#*Z/(1#+G#)
1930  G#=ODD#*Z/(1#+G#)
1940 ID=ID-1
1950 WEND
1960 'NEXT ID
1970 G#=1#/(1#+G#)
1980 RETURN
 
===================================
 
【3】集中多面体(concentrative polyhedron)
 
 まず,復習から始めたいと思います.【1】【2】では集中楕円の問題を扱いましたが,多重ガウス積分は不完全ガンマ関数とになることより,n次元超球では原点からの距離がcの超球内に納まる確率は自由度nのχ^2分布で与えられることが計算されました.
 
 また,2次元平面に投影した場合,自由度2のχ^2分布はすなわち指数分布ですから,全体のp%がその内側に入るような超球の半径cは
  c^2=−2ln(1−p)
によって与えられることがわかりました.例えば,c=1のときp=0.394,c=2のときp=0.865となり,半径が2の円を描くとその内側には86.5%が含まれることになります.
 
 これらは,それぞれ1辺が2,4の正方形の内側に入る確率,
  p=(0.683)^2=0.466>0.394
  p=(0.954)^2=0.910>0.865
よりもさらに小さくなります.
 
 ここで,0.683,0.954はそれぞれ(1次元)正規分布の1σ,2σ点における中心確率です.すなわち,正規分布では,区間
  [μ−σ,μ+σ]に68.3%,
  [μ−2σ,μ+2σ]に95.4%,
  [μ−3σ,μ+3σ]に99.7%
の観測値が入ります.3σ点における中心確率は0.997となりますから,ほとんどの観測値が[μ−3σ,μ+3σ]に入ることを利用して,工場では品質管理を行っています.それが3σ法で,有用なQCテクノロジーの1つになっています.
 
 一方,d次元正規分布は,
  p(x1,x2,x3,・・・,xd)=1/(2πσ^2)^(d/2)exp{-(x1^2+x^2+・・・+xd^2)/2σ^2}
で与えられますが,多次元正規分布の場合,低次元の場合とは対照的に密度の裾にあたる領域に大部分のデータが存在することになります.
 
 1次元であれば3σを外れる確率はわずか千に三つにすぎないのですが,高次元化に伴い次第に中心部は過疎化し,10次元では半分以上が3σの郊外に移り住み,30次元では99%以上が裾の領域に集まるという結果になるのです.
 
 さて,変数xiはそれぞれ独立に(1次元)正規分布またはt分布に従うと考えられますから,この節では全体のp%がその内側に入るような超立方体を描く方法について考えてみることにします.
 
 この問題は,統計学ではよく知られたボンフェローニ・シダック問題であって,1回の検定の有意水準をp0とすると,n回の検定を繰り返すことによって生じる推論全体での有意水準をpに保つには,
  p=1−(1−p0)^n
より
  p0 =1−(1−p)^(1/n)   (シダック解) 
    ≒p/n          (ボンフェローニ解)
と求められることと,全く同じ解になっています.
 
 すなわち,p0 =1−(1−p)^(1/n)として,cを正規分布のp0パーセント点
  c=N(p0)
あるいは,t分布のp0パーセント点
  c=t(df:p0)
に定めてから,2次元平面上に投影すればよいことになるのですが,【4】のサブルーチンを使うならば,
  PP=1-(1-PP)^(1/M):GOSUB *NORMAL.PERCENT:PRINT UUN
といった書式になります.集中楕円の描き方とは,かなり異なることがおわかり頂けたでしょうか? 
 
===================================
 
 誤解を招くといけませんから,ニワトリが先かタマゴが先かという話をしておきます.統計学では,個々の母数に対する個別の信頼区間は容易に作ることができますが,たとえば,2つ(3つ)の母数が存在する場合,その同時信頼区間は長方形(直方体)領域で与えられるものではなく,楕円(楕円体)領域となります.
 
 すなわち,統計学では,集中楕円体として得られるはずの母数空間を集中多面体で近似することが頻繁に行われているのです.厳密な意味では,集中楕円体が基にあり,集中多面体は集中楕円体を近似するための単なる思いつきの産物ということになりましょう.
 
===================================