平均値の差の検定の一般化（その１）

■平均値の差の検定の一般化（その１）

　前シリーズで母数とその標準偏差（標準誤差）がも求まったわけですから，つぎに，母数間の差を検定したいというのは当然の成りゆきというものでしょう．

　実際のデータ解析では，理論的・経験的に母集団分布が知られている場合やデータの観測個数が大きく母集団分布を推定できる場合が少なくありません．そこで，ここでは，この事前情報を活かした統計的検定・推定法について取り上げることにしました．すなわち，平均値の差の検定の一般化ですが，これにより，平均値や分散のみならず，分布形が等しいかどうかを同じ枠内で独立に検定することも可能になり，守備範囲が一層広くなります．

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

【１】２群における平均値の差の検定

　正規分布を仮定した議論から得られる結論は，観測値の分布が正規分布でない場合にもほぼ正しいといえることは非常に多く，重要な意味をもっています．とくに，最尤推定量はｎがある程度大きければほぼ正規分布に従うとみてよいわけですから，まず最初に，２つの正規母集団からの平均値の差の検定についておさらいをしておきましょう．

　２つの正規母集団Ｎ（μ1 ，σ1^2），Ｎ（μ2 ，σ2^2）からそれぞれ独立に抽出した場合の標本にもとづいて仮説μ1 ＝μ2 を検定する場合，μ1，μ2 の信頼限界は，それぞれＮ（μ1，σ1^2/n1），Ｎ（μ2，σ2^2/n2）で示され，また，再生性より正規分布をする変数同士の差μ1－μ2の信頼限界は正規分布Ｎ（μ1-μ2，σ1^2/n1+σ1^2/n2）になります．

　２群の平均値の差の基本的な考え方は，観測された平均値の差（群間分散）がその誤差（群内分散）を超えて統計学的に有意な差を示すか否かを客観的な評価基準によって判定することにあります．そのためには，ある有意水準αを定めた統計量ｋ（α）を利用して，群間分散・群内分散比|μ1-μ2|／√(σ1^2/n1+σ1^2/n2)と基準値ｋ（α）のずれを本物とみなすべきか，統計的誤差範囲内とみなすべきかをその大小関係から検討し，もし，

　　|μ1-μ2|／√(σ1^2/n1+σ1^2/n2)≧ｋ（α）

ならば有意水準αで帰無仮説を棄却します．その場合，次の３つの条件下での検定シーンが想定されます．

（１）母分散σ1^2，σ2^2が既知のとき

　μ1，μ2の推定値として標本平均ｘ1，ｘ2を用いるわけですが，母分散σ1^2，σ2^2が既知のとき，群間分散・群内分散比は標準正規分布にしたがいますから，両側検定の場合，ｋ（α）＝u(α/2)とします．

　　|x1-x2|／√(σ1^2/n1+σ1^2/n2)≧u(α/2)

しかし，この仮定は現実的でないことはいうまでもありません．

－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

（２）母分散σ1^2，σ2^2が未知であるが等しいとき（σ1^2＝σ2^2＝σ^2）

　この場合，σ1^2やσ2^2の推定値として，それぞれ不偏標本分散ｕ1^2，ｕ2^2で置き換えるのですが，

　　|x1-x2|／√(u1^2/n1+u1^2/n2)≧u(α/2)

のように正規分布を使用する平均値の差の検定は，大標本すなわち豊かな資料が得られているときだけ信頼できることはよく知られています．

　しかし，そう頻繁に繰り返すことのできない実験もあり，その場合でも小さな標本から平均値の差の有意性を判定する必要が生じます．大きい標本と小さい標本の限界をどこにひくべきかは問題があるところですが，小標本のために考案された平均値の検定が，スチューデントのｔ検定（１９０８年）です．

　考え方の基本となるのは，スチューデントの定理

（１）未知のパラメータμ，σ^2をもつ正規分布に関して，Ｅ［ｕ^2］＝σ^2，すなわち，標本平均ｘと標本不偏分散ｕ^2は任意のμ，σ^2について独立である．

（２）ｔ＝（ｘ－μ）／（ｕ／√ｎ）はμ，σ2に独立な分布（自由度ｎ－１のｔ分布）をもつ．

という事実です．

　スチューデントのｔ検定は２標本問題ですが，本質的には１標本問題であり，スチューデントの定理を２標本問題に適用すると，

ｔ＝|μ1-μ2|／√(σ1^2/n1+σ2^2/n2)=|μ1-μ2|／σ√(1/n1+1/n2)

は自由度ｎ1 ＋ｎ2 －２のｔ分布にしたがうことになります．

　また，スチューデントのｔ検定では，仮定よりσ1^2＝σ2^2＝σ^2ですが，母分散σ^2の大きさを，不偏標本分散ｕ1^2，ｕ2^2を用いてその重みつき平均

　　{(n1-1)u1^2+(n2-1)u2^2}/(n1+n2-2)

で推定しています．

　以上より

ｔ＝|x1-x2|/√{(n1-1)u1^2+(n2-1)u2^2}/(n1+n2-2)*(1/n1+1/n2)≧ｋ

ｋ（α）=t(n1+n2-2,α/2)

かどうかで帰無仮説を棄却します．このように，データ件数が少ないときの平均値の差の検定に関してはｔ分布を使うことになり，正規分布より少し広めに信頼区間を設定することになります．

　なお，スチューデントのｔ検定はσ1^2＝σ2^2であることを仮定していますが，たとえσ1^2≠σ2^2であっても真の有意水準が設定値αからあまりずれないことが知られています．このような性質をｔ検定は分散の違いに対してロバスト（頑健）であると呼びます．ただし，これはｎ1≒ｎ2のとき成り立つのであって，ｎ1／ｎ2が２倍以上異なってくると，ｔ検定は分散の違いに対してロバストではなくなります．

【補】スチューデント＝ゴセット

　スチューデントは，ゴセットのペンネームであることはよく知られていますが，ゴセットの謙虚な人柄を表すのに最適な筆名です．スチューデントのｔ検定をもっと正確にいうと，「ｔ＝(|x1-x2|-μ1-μ2)/√{(n1-1)u1^2+(n2-1)u2^2}/(n1+n2-2)*(1/n1+1/n2)はｔ分布に従う．」です．従って，母平均が等しくなければ，統計量ｔは非心ｔ分布にしたがうことになります．

　一方，母集団分布が正規分布でないとき，統計量ｔ＝（ｘ－μ）／（ｕ／√ｎ）の正確な分布についてはｎが小さいときしか知られておらず，ｎが大きくなると非正規性の影響が大きくなることがわかっています．

－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－

（３）母分散σ12，σ22が未知であり，等しいとは限らないとき

　（２）の設定条件も非常に奇妙に感じられるでしょう。つまり，２つの母平均も未知ならば，母分散も未知と考えるのが妥当であり，等分散とするのは不自然というわけです．

　このように，σ1^2とσ2^2が全く未知であるという現実的条件下で仮説μ1 ＝μ2 を検定する問題は，ベーレンス・フィッシャー問題と呼ばれて論じられてきた問題です．この場合もσ1^2やσ2^2をそれぞれ標本不偏分散ｕ1^2，ｕ2^2で置き換えるのですが，|x1-x2|/√{u1^2/n1+u2^2/n2)}の分布は未知の分散σ1^2，σ2^2よって影響をうけるため，どのように工夫してもσ1^2やσ2^2によらない統計量をつくることはできないことが証明されています．

　正確な信頼区間は求められていないのですが，しかしながら，近似的に標本分布を求める方法が知られており，なかでもウェルチの近似法がもっともよく用いられます．

　ウェルチのｔ検定（１９３８年）では，

ｔ＝|x1-x2|/√{u1^2/n1+u2^2/n2)}≧ｋ

ｋ（α）=t(df,α/2)

df={u1^2/n1+u2^2/n2)}^2/{u1^4/n1^2(n1-1)+u2^4/n2^2(n2-1)}

かどうかで検定します．

　サンプルサイズが等しい（n1=n2）か標本分散が等しい（u1=u2）ならば，スチューデントのｔ検定とウェルチのｔ検定のｔ値は一致します．また，自由度に関しては（n1=n2）かつ（u1=u2）のときdf=n1+n2-2が成り立ちますから，２群のデータ数および標本分散が等しいときに限り，スチューデントのｔ検定とウェルチのｔ検定は一致し，両者の接続性が保たれていることになります．

　一般にmin(n1-1,n2-1)≦df≦n1+n2-2ですから，ウェルチのｔ検定はスチューデントのｔ検定よりも検出力が劣ります．しかし，逆にいうと，推定効率を下げることによって等分散でない場合にも拡張させた手法がウェルチの方法といってよいでしょう．ウェルチの近似解は，σ1^2／σ2^2があまり１から離れない範囲で十分精確な検定方式になっています．

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

【２】３群以上における平均値の差の検定

　２群の場合を含んで，多群間の比較に用いられる総括的な検定手法が，分散分析（ＡＮＯＶＡ）です．この方法は，群間分散／群内分散比（信号／雑音比，偶然性に対する必然性の比）を判別関数とした分析法で，歴史的には１９２０年代にフィッシャーにより提示されたものです．

　よく知られているフィッシャーの分散分析は，母分散が同じかあるいは分散の違いが僅かと推定される幾組かの測定に適用され，３群以上の平均値の差が等しいかどうかという等平均性の同時一括検定（μ1=μ2=･･･=μg）を行います．ｇ＝２のとき，分散分析の検定結果は，２群の平均値の差の検定に用いられるスチューデントのｔ検定に完全に一致しますから，分散分析はスチューデントのｔ検定を拡張・一般化させたものと理解することができます．

　ここで，各群で母分散が異なる場合や母分散がまったく未知であるという条件のもとで，分散分析を拡張しておく必要が生じます．実はそうしたものにウェルチの分散分析があります．

　ウェルチはｇ＝２の場合に倣って，

x0={Σnixi/ui^2}/{Σni/ui^2}

W=Σni(xi-x0)^2/ui^2

1/df=3/(g2-1)Σ1/(ni-1){1-ni/ui^2/Σni/ui^2}^2

とおくとき，

F=[1+2(g-2)/(g2-1)Σ1/(ni-1)(1-ni/ui^2/Σni/ui^2)^2]-1*w/(g-1)

がF(g-1,df,α)のＦ分布に従うことを示しました（１９４７年）．

　ｇ＝２で，u1^2=u2^2=u^2であればウェルチの分散分析の検定結果はウェルチのｔ検定に一致します．

　ウェルチの分散分析については，残念なことにほとんど触れられることがなく，よく知られているとはいえませんが，竹内啓著「数理統計学」東洋経済新報社，「確率分布と統計解析」日本規格協会の中で繰り返し紹介されていますから，ぜひ，参照されたい．なお，正規性・等分散性の仮定がくずれた場合でも，スチューデントのｔ検定の拡張版である分散分析（Ｆ検定）はｔ検定と同様，分散の違いに対してある程度頑健であって，有意水準がほとんど変わらないことが知られています．したがって，それ程神経質になる必要はないとのことですが，極端に不等分散であるかどうかは確認しておく必要があるでしょう．ただし，頑健であるのはデータ数がほぼ等しいときであって，データ数がかなり異なれば解析の妥当性に問題を生ずることを注意しておきます．

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝