■平均値の差の検定の一般化(その2)

【1】母数の差の検定

 母数の検定の1標本問題については解決済みですので,ここでは2標本問題を取り扱うことにします.データ数n1,n2個の2組の測定値があって,最尤法によってその母集団の母数がそれぞれθ1,θ2,その標準誤差がΔθ1,Δθ2と推定された場合のことを考えてみます.もし,母集団が正規分布であり,関心のある母数がが平均値に一致する位置母数であるならば,2つの母集団の母数θ1,θ2に差があるかどうかを問う検定は,通常用いられている2群の平均値の差の検定になりますから,この節では平均値の差の一般化について考えることになります.

(1)準ウェルチ検定(擬ウェルチ検定)

 母分布が正規分布の場合に倣って,母数の差(θ1−θ2)の誤差Δθについて考えてみることにします.母数θ1,θ2に差があるかどうかを問う検定は,その分布型や母数と誤差の独立性を考慮に入れず,単純に考えると,100(1-α)%信頼限界(θ1−θ2)±k(α)Δθが0を含んでいるかどうかという問題に還元されそうです.一般に,測定回数が違っているうえに,標準誤差Δθ1,Δθ2も等しいとは限りません.

 Δθの求め方として,素朴に,

  |Δθ|=|Δθ1|+|Δθ2|

としてある本もありますが,この求め方は便宜的・作為的で理論的な裏付けがあるわけではありません.もう少しつじつまがあっていて,しかもいろいろな場面の応用できるましな方法<誤差伝播の法則>を使って求めることにします.

 誤差伝播の法則の詳細はあらためて述べることにして,θ1,θ2が正規母集団からの標本でない場合でも,誤差伝播の公式は使えて,

  (Δθ)2=(Δθ1)2+(Δθ2)2

になります.これは幾何学的にいえば,ピタゴラスの定理にほかなりません.誤差伝播の公式は,正規母集団からの標本でなくても,また,互いに独立に違った回数だけ測定して誤差Δθ1,Δθ2を求めた場合でも,近似的には使えます.ただし,測定回数が違うときΔθは不偏分散にはなりません.測定回数が違うときの不偏分散を出すのはかなり困難です.

 1標本問題を拡張して,正規分布からの標本でない場合の母数の差の検定について考えてみましょう.母数θ1,θ2の分布が漸近正規性をもつことから,母数の差θ1−θ2に対しても漸近正規性が成立すると仮定することは自然です.そこで,kはウェルチのt検定に倣って,近似的に

k(α)=t'(df',α/2)   df'<df

とおくことができると仮定します.ここで,dfはウェルチのt検定の際の自由度ですが,df'<dfとし,さらにt分布の代わりにt’分布を用いて、信頼区間を広めにとれば,母数θ1,θ2には漸近正規性しか仮定できない場合も使用可能と考えられます.すなわち,

m→θ

u^2/√(n)→Δθ

n-1→n-m

t→t'

 そこで,

|θ1−θ2|≧t'(df',α/2)*√(Δθ1)2+(Δθ2)2

df'={(θ1)^2+(θ2)^2}^2/{(Δθ1)^4/(n1-m)+(Δθ2)^4/(n2-m)}

なる統計検定法を考えることができます.この検定法は,ウェルチの近似法においてu^2/nをΔθに,n-1をn-m,tをt’に置き換えただけでまったく同じ形をしています.これを,ウェルチのt検定と区別するために,ここでは準ウェルチ検定と呼ぶことにします.

 母平均を推定したい場合,母分散には興味がない場合が多いわけですが,このような場合,無関心の母数を局外母数(nuisance parameter)と呼びます.推定パラメータ数をmとすると,正規母集団からの平均値の差の検定では,未知母数はμとσの2つですから,m=2に相当し,σが局外母数となります.したがって,準ウェルチ検定はウェルチのt検定より局外母数の分だけ自由度が減った検定と考えることができます.

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

(2)ウェルチのt検定との比較

 正規分布における位置母数の差の検定の場合,位置母数は平均値と一致しますから,母集団をそれぞれ正規分布N(μ1,σ1^2),N(μ2,σ2^2)とするならば,最尤法により,θ1=μ1,θ2=μ2

Δθ1=σ1/√n1,Δθ2=σ2/√n2

また,誤差伝播の法則より,(Δθ)^2=σ1^2/n1+σ2^2/n2

k(α)=t'(df',α/2)

kΔθ=t'(df',α/2)*√σ1^2/n1+σ2^2/n2

 最尤法で求めたわけですから,σ1,σ2の推定量としては最尤推定量s1,s2を用います.したがって,これらを代入すると

θ1=m1,θ2=m2

kΔθ=t'(df',α/2)*√s1^2/n1+s2^2/n2

また,

df'={s1^2/n1+s2^2/n2)}^2/{s1^4/n1^2(n1-2)+s2^4/n2^2(n2-2)}

は,ウェルチのt検定の際の自由度

df={u1^2/n1+u2^2/n2)}^2/{u1^4/n1^2(n1-1)+u2^4/n2^2(n2-1)}

と比較して,

{u^2/n}^2>{s^2/n}^2

{u^2/n}^2/{u^4/n^2(n-1)}={s^2/n}^2/{s^4/n^2(n-1)}<{s^2/n}^2/{s^4/n^2(n-2)}

よりdf'<dfが期待できます.

 結局,

|m1-m2|≧t'(df',α/2)*√s1^2/n1+s2^2/n2

df'={s1^2/n1+s2^2/n2)}^2/{s1^4/n1^2(n1-2)+s2^4/n2^2(n2-2)}

で平均値の差の検定を行うことになります.この場合,ウェルチのt検定

|m1-m2|≧t(df,α/2)*√{u12/n1+u22/n2)}

df={u12/n1+u22/n2)}^2/{u14/n12(n1-1)+u24/n22(n2-1)}

との違いは,

(1)標本不偏分散u^2ではなく,標本最尤分散s^2を用いるという点

(2)局外母数の分だけ自由度が減る(n-1)→(n-2)

(3)t分布の代わりにt’分布を用いる

ということですが,ウェルチのt検定の自然な拡張になっていて,本来のウェルチのt検定にほぼ等しい結果が得られることより,かなりよい統計的性質をもっといると考えられます.

 以上のように,最尤法を応用した母数の差の検定法である準ウェルチ検定は,

ウェルチのt検定に倣って,2標本問題:|θ1−θ2|±kΔθのk(α)値を定めたものですが,最尤法と誤差伝播の法則から単純素朴な発想だけを使って,コロンブスのタマゴ的にごく自然に導き出せること,また,式自体も単純であるばかりでなく,本来のウェルチのt検定よりも美しくもあり,正規母集団からの標本でなくとも,実用上は十分精確な統計検定法であると考えられる所以です.

 見方を変えれば,パラメトリック検定(分布の前提が窮屈であるが検出力がよい)とノンパラメトリック検定(分布の前提は緩やかであるが検出力がよくない)の間を埋めるための式は,t検定の頑健さに強く依存したものであるといえます.t検定は正規分布の仮定に強く依存した手法との印象が強いのですが,正規性・等分散性の仮定に対して一般に考えられているほど過敏ではないことが指摘されています.たとえば,スチューデントのt検定の場合はノンパラメトリックな並べ替え検定と似た頑健な手法,すなわち,正規性の仮定をしなくてもt検定は近似的に正しい有意水準を評価しているのであって,上の事実はこれによく符合したものといえましょう.

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

(3)準ウェルチ型分散分析

 この節では,3群以上の母数の比較のために,ウェルチの分散分析・多重比較を拡張しておきます.非正規分布用の準ウェルチ検定をg群(g>2)の場合に拡張するために,まず,式の各辺を2乗してみましょう.

 t'(df,α/2)^2=F'(1,df,α)ですから,2群比較のための準ウェルチ検定は

  (θ1−θ2)2/{(Δθ1)2+(Δθ2)2}≧F'(1,df,α)

と同値です.そこで,ウェルチの分散分析に倣って,2群の場合を含んで,3群以上のg群に拡張させると

θ={Σθi/(Δθi)2}/{Σ1/(Δθi)2}

W=Σ(θi−θ)2/(Δθi)2

[1+2(g-2)/(g2-1)Σ1/(ni-m)(1-1/(Δθi)2/Σ1/(Δθi)2)^2]-1*w/(g-1)≧F'(g-1,df',α)

が得られます.

ただし,1/df'=3/(g2-1)Σ1/(ni-m){1-1/(Δθi)2/Σ1/(Δθi)2}2

で与えられます.また、F分布の代わりにF’分布を用います.これを準ウェルチ型分散分析と呼ぶことにします.

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

(4)準ウェルチ型多重比較

 分散分析では,帰無仮説「すべての群において,母数は等しい」を同時検定しますが,もしそこで有意の結果が得られたならば仮説は棄却され,「すべての群に等しいというわけではない」すなわち母数の異なる群が存在していると判断し,次には多群のうち1群だけが他の群と違っているのかすべての群がそれぞれ異なるのかなどを比較します.これが,多重比較と呼ばれる解析法で,種々の多重比較法が提案されています.

 もし特定の一組に限って比較するならば,その判定基準は

|θi−θj|≧t'(df',α/2)*√(Δθi)2+(Δθj)2

となりますが,これは厳密な意味では多重比較ではありません.

 最も簡便な多重比較法として,ボンフェローニ法があります.この方法では,比較する組合せの数をhとした場合に,ボンフェローニBonferroniの不等式を用いて,α→α/h(またはより正確なシダックSidakの方法を用いて,α→1-(1-α)^(1/h))とおきます.すなわち,

|θi−θj|≧t'(df',α/2h)*√(Δθi)2+(Δθj)2

かどうかを調べて検定することになります.ここで,もし,すべての組合せに興味がある場合は,総あたり比較ですから,h=gC2=g(g-1)/2

となります.これをTukey型多重比較とよびます.また,対照群とその他の群の比較に興味がある場合は,h=g-1となります(Dunnet型多重比較).

 また,対比較のみならず,線形比較にも興味がある場合は,Scheffe型多重比較を行います.Scheffe型多重比較は

|θi−θj|≧√(g-1)F'(g-1,df',α)*√(Δθi)2+(Δθj)2

で表されます.

 g=2の場合は,t'(df',α/2)=√(g-1)F'(g-1,df',α)ですが,g>2ではt'(df',α/2)>√(g-1)F'(g-1,df',α)ですから,Scheffe型多重比較はTukey型多重比較よりも棄却されにくくなります.

【補】多重比較数

 3群以上で多重比較を行うとき,次の場合を区別しておく必要があります.

(1)あらかじめ決めておいた特定の1対に限定して比較する(フィッシャー法)

(2)対照群と他群を対にして比較する(ダネット法)

(3)2群を対にして,すべての対について比較する(チューキー法)

(4)2群の比較ばかりでなく,任意の群を合併したものを含め,すべての対比を行う(シェフェ法)

 たとえば,5群の平均値μ1,μ2,μ3,μ4,μ5の比較を考える場合,μ3-μ4のような1対1の対比(対比較)のみならず,(μ1+μ2+μ3)/3-(μ4+μ5)/2のような3対2の対比が必要になることもあります.すなわち,多重比較には対比較を線形比較の2種類の方法があり,対比較にはフィッシャー法(特定の比較),ダネット法(基準との比較),チューキー法(あらゆる対の比較)などがあり,線形比較のための検定法として,シェフェ法(あらゆる比較)があります.

 g群の多重比較の場合,対比する組合せ数を求めると,フィッシャー法で1,ダネット法でg−1,チューキー法で,nC2=g(g-1)/2,シェフェ法では(3^g+1)/2-2^g とおりになります.チューキー数は多項式関数的に増加しますが,シェフェ数は意味付け可能な組合せだけでも、指数関数的に(より急激に)増加することが理解されます.

多重比較 3群   4群   5群   6群  g群

フィッシャー数 1 1 1 1 1

ダネット数 2 3 4 5 g-1

チューキー数 3 6 10 15 g(g-1)/2

シェフェ数 6 25 90 301 (3^g+2^(g+1)+1)/2

【補】サタースウェイトの等価自由度

 2群の場合,ウェルチのt検定とサタースウェイトの方法と呼ばれる検定は同じものです.しかし,サタースウェイトの等価自由度は

  1/df'=Σ(Δθi)4/(ni-m)/{Σ(Δθi)2}2

で計算され,3群以上ではウェルチ流の自由度とサタースウェイト流の自由度は異なった値を与えます.

 多重比較における自由度の求め方には,ウェルチ流の求め方とサタースウェイト流の求め方の2つの方法が考えられますが,この2つを比較してみた結果を表()に掲げておきます.自由度が最大となる場合について比較しましたが,サタースウェイトでは群の数が増えるにつれて自由度が急激に増していきます.この結果は到底容認できるものではありません.一方,ウェルチでは自由度が徐々にふえ,5群くらいまでであれば,2群の場合とそれほどの差はみられません.このことからも多群比較にはウェルチの方法が適していると考えられました.

 なお,準ウェルチ検定の自由度は,ウェルチの自由度よりさらに小さな値となります.

===================================