■平均値の差の検定の一般化(その1)

 前シリーズで母数とその標準偏差(標準誤差)がも求まったわけですから,つぎに,母数間の差を検定したいというのは当然の成りゆきというものでしょう.

 実際のデータ解析では,理論的・経験的に母集団分布が知られている場合やデータの観測個数が大きく母集団分布を推定できる場合が少なくありません.そこで,ここでは,この事前情報を活かした統計的検定・推定法について取り上げることにしました.すなわち,平均値の差の検定の一般化ですが,これにより,平均値や分散のみならず,分布形が等しいかどうかを同じ枠内で独立に検定することも可能になり,守備範囲が一層広くなります.

===================================

【1】2群における平均値の差の検定

 正規分布を仮定した議論から得られる結論は,観測値の分布が正規分布でない場合にもほぼ正しいといえることは非常に多く,重要な意味をもっています.とくに,最尤推定量はnがある程度大きければほぼ正規分布に従うとみてよいわけですから,まず最初に,2つの正規母集団からの平均値の差の検定についておさらいをしておきましょう.

 2つの正規母集団N(μ1 ,σ1^2),N(μ2 ,σ2^2)からそれぞれ独立に抽出した場合の標本にもとづいて仮説μ1 =μ2 を検定する場合,μ1,μ2 の信頼限界は,それぞれN(μ1,σ1^2/n1),N(μ2,σ2^2/n2)で示され,また,再生性より正規分布をする変数同士の差μ1−μ2の信頼限界は正規分布N(μ1-μ2,σ1^2/n1+σ1^2/n2)になります.

 2群の平均値の差の基本的な考え方は,観測された平均値の差(群間分散)がその誤差(群内分散)を超えて統計学的に有意な差を示すか否かを客観的な評価基準によって判定することにあります.そのためには,ある有意水準αを定めた統計量k(α)を利用して,群間分散・群内分散比|μ1-μ2|/√(σ1^2/n1+σ1^2/n2)と基準値k(α)のずれを本物とみなすべきか,統計的誤差範囲内とみなすべきかをその大小関係から検討し,もし,

  |μ1-μ2|/√(σ1^2/n1+σ1^2/n2)≧k(α)

ならば有意水準αで帰無仮説を棄却します.その場合,次の3つの条件下での検定シーンが想定されます.

(1)母分散σ1^2,σ2^2が既知のとき

 μ1,μ2の推定値として標本平均x1,x2を用いるわけですが,母分散σ1^2,σ2^2が既知のとき,群間分散・群内分散比は標準正規分布にしたがいますから,両側検定の場合,k(α)=u(α/2)とします.

  |x1-x2|/√(σ1^2/n1+σ1^2/n2)≧u(α/2)

しかし,この仮定は現実的でないことはいうまでもありません.

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

(2)母分散σ1^2,σ2^2が未知であるが等しいとき(σ1^2=σ2^2=σ^2)

 この場合,σ1^2やσ2^2の推定値として,それぞれ不偏標本分散u1^2,u2^2で置き換えるのですが,

  |x1-x2|/√(u1^2/n1+u1^2/n2)≧u(α/2)

のように正規分布を使用する平均値の差の検定は,大標本すなわち豊かな資料が得られているときだけ信頼できることはよく知られています.

 しかし,そう頻繁に繰り返すことのできない実験もあり,その場合でも小さな標本から平均値の差の有意性を判定する必要が生じます.大きい標本と小さい標本の限界をどこにひくべきかは問題があるところですが,小標本のために考案された平均値の検定が,スチューデントのt検定(1908年)です.

 考え方の基本となるのは,スチューデントの定理

(1)未知のパラメータμ,σ^2をもつ正規分布に関して,E[u^2]=σ^2,すなわち,標本平均xと標本不偏分散u^2は任意のμ,σ^2について独立である.

(2)t=(x−μ)/(u/√n)はμ,σ2に独立な分布(自由度n−1のt分布)をもつ.

という事実です.

 スチューデントのt検定は2標本問題ですが,本質的には1標本問題であり,スチューデントの定理を2標本問題に適用すると,

t=|μ1-μ2|/√(σ1^2/n1+σ2^2/n2)=|μ1-μ2|/σ√(1/n1+1/n2)

は自由度n1 +n2 −2のt分布にしたがうことになります.

 また,スチューデントのt検定では,仮定よりσ1^2=σ2^2=σ^2ですが,母分散σ^2の大きさを,不偏標本分散u1^2,u2^2を用いてその重みつき平均

  {(n1-1)u1^2+(n2-1)u2^2}/(n1+n2-2)

で推定しています.

 以上より

t=|x1-x2|/√{(n1-1)u1^2+(n2-1)u2^2}/(n1+n2-2)*(1/n1+1/n2)≧k

k(α)=t(n1+n2-2,α/2)

かどうかで帰無仮説を棄却します.このように,データ件数が少ないときの平均値の差の検定に関してはt分布を使うことになり,正規分布より少し広めに信頼区間を設定することになります.

 なお,スチューデントのt検定はσ1^2=σ2^2であることを仮定していますが,たとえσ1^2≠σ2^2であっても真の有意水準が設定値αからあまりずれないことが知られています.このような性質をt検定は分散の違いに対してロバスト(頑健)であると呼びます.ただし,これはn1≒n2のとき成り立つのであって,n1/n2が2倍以上異なってくると,t検定は分散の違いに対してロバストではなくなります.

【補】スチューデント=ゴセット

 スチューデントは,ゴセットのペンネームであることはよく知られていますが,ゴセットの謙虚な人柄を表すのに最適な筆名です.スチューデントのt検定をもっと正確にいうと,「t=(|x1-x2|-μ1-μ2)/√{(n1-1)u1^2+(n2-1)u2^2}/(n1+n2-2)*(1/n1+1/n2)はt分布に従う.」です.従って,母平均が等しくなければ,統計量tは非心t分布にしたがうことになります.

 一方,母集団分布が正規分布でないとき,統計量t=(x−μ)/(u/√n)の正確な分布についてはnが小さいときしか知られておらず,nが大きくなると非正規性の影響が大きくなることがわかっています.

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

(3)母分散σ12,σ22が未知であり,等しいとは限らないとき

 (2)の設定条件も非常に奇妙に感じられるでしょう。つまり,2つの母平均も未知ならば,母分散も未知と考えるのが妥当であり,等分散とするのは不自然というわけです.

 このように,σ1^2とσ2^2が全く未知であるという現実的条件下で仮説μ1 =μ2 を検定する問題は,ベーレンス・フィッシャー問題と呼ばれて論じられてきた問題です.この場合もσ1^2やσ2^2をそれぞれ標本不偏分散u1^2,u2^2で置き換えるのですが,|x1-x2|/√{u1^2/n1+u2^2/n2)}の分布は未知の分散σ1^2,σ2^2よって影響をうけるため,どのように工夫してもσ1^2やσ2^2によらない統計量をつくることはできないことが証明されています.

 正確な信頼区間は求められていないのですが,しかしながら,近似的に標本分布を求める方法が知られており,なかでもウェルチの近似法がもっともよく用いられます.

 ウェルチのt検定(1938年)では,

t=|x1-x2|/√{u1^2/n1+u2^2/n2)}≧k

k(α)=t(df,α/2)

df={u1^2/n1+u2^2/n2)}^2/{u1^4/n1^2(n1-1)+u2^4/n2^2(n2-1)}

かどうかで検定します.

 サンプルサイズが等しい(n1=n2)か標本分散が等しい(u1=u2)ならば,スチューデントのt検定とウェルチのt検定のt値は一致します.また,自由度に関しては(n1=n2)かつ(u1=u2)のときdf=n1+n2-2が成り立ちますから,2群のデータ数および標本分散が等しいときに限り,スチューデントのt検定とウェルチのt検定は一致し,両者の接続性が保たれていることになります.

 一般にmin(n1-1,n2-1)≦df≦n1+n2-2ですから,ウェルチのt検定はスチューデントのt検定よりも検出力が劣ります.しかし,逆にいうと,推定効率を下げることによって等分散でない場合にも拡張させた手法がウェルチの方法といってよいでしょう.ウェルチの近似解は,σ1^2/σ2^2があまり1から離れない範囲で十分精確な検定方式になっています.

===================================

【2】3群以上における平均値の差の検定

 2群の場合を含んで,多群間の比較に用いられる総括的な検定手法が,分散分析(ANOVA)です.この方法は,群間分散/群内分散比(信号/雑音比,偶然性に対する必然性の比)を判別関数とした分析法で,歴史的には1920年代にフィッシャーにより提示されたものです.

 よく知られているフィッシャーの分散分析は,母分散が同じかあるいは分散の違いが僅かと推定される幾組かの測定に適用され,3群以上の平均値の差が等しいかどうかという等平均性の同時一括検定(μ1=μ2=・・・=μg)を行います.g=2のとき,分散分析の検定結果は,2群の平均値の差の検定に用いられるスチューデントのt検定に完全に一致しますから,分散分析はスチューデントのt検定を拡張・一般化させたものと理解することができます.

 ここで,各群で母分散が異なる場合や母分散がまったく未知であるという条件のもとで,分散分析を拡張しておく必要が生じます.実はそうしたものにウェルチの分散分析があります.

 ウェルチはg=2の場合に倣って,

x0={Σnixi/ui^2}/{Σni/ui^2}

W=Σni(xi-x0)^2/ui^2

1/df=3/(g2-1)Σ1/(ni-1){1-ni/ui^2/Σni/ui^2}^2

とおくとき,

F=[1+2(g-2)/(g2-1)Σ1/(ni-1)(1-ni/ui^2/Σni/ui^2)^2]-1*w/(g-1)

がF(g-1,df,α)のF分布に従うことを示しました(1947年).

 g=2で,u1^2=u2^2=u^2であればウェルチの分散分析の検定結果はウェルチのt検定に一致します.

 ウェルチの分散分析については,残念なことにほとんど触れられることがなく,よく知られているとはいえませんが,竹内啓著「数理統計学」東洋経済新報社,「確率分布と統計解析」日本規格協会の中で繰り返し紹介されていますから,ぜひ,参照されたい.なお,正規性・等分散性の仮定がくずれた場合でも,スチューデントのt検定の拡張版である分散分析(F検定)はt検定と同様,分散の違いに対してある程度頑健であって,有意水準がほとんど変わらないことが知られています.したがって,それ程神経質になる必要はないとのことですが,極端に不等分散であるかどうかは確認しておく必要があるでしょう.ただし,頑健であるのはデータ数がほぼ等しいときであって,データ数がかなり異なれば解析の妥当性に問題を生ずることを注意しておきます.

===================================