■ガウス関数の積分と不等式(その19)
【5】標本中央値の漸近分布
正規母集団以外であっても,その母平均,母分散をそれぞれμ,σ^2として,標本平均値の分布が漸近的に正規分布N(μ,σ^2/n)になることは高校の教科書にも取り上げられて,標本平均値についての統計的性質は「中心極限定理」としてよく知られています.しかし,標本中央値の漸近分布を取り上げたものは少ないようです.
以下では,標本中央値に関する極限定理「母集団のメジアンをμmとすると,メジアンの分布は漸近的に正規分布N(μm,1/{4n[f(μm)]^2})になる」ことを証明していきます.
(証明)xがg(x)=(2m+1)!/(m!)^2F(x)^m{1-F(x)}^mf(x)にしたがうとき,
u=(x-μm)/(1/{4n[f(μm)]^2})^(1/2)=2{nf(μm)(x-μm)}^(1/2)
が漸近的にN(0,1)にしたがうことを示せばよい.
uの確率密度関数は,
x=u/2{nf(μm)+μm}^(1/2),dx=du/2{nf(μm)}^(1/2)
より,
h(u)du=g(x)dx=g(u/2{nf(μm)+μm){^(1/2)/2{nf(μm)}^(1/2)du
h(u)=g(u/2{nf(μm)+μm)}^(1/2)/2{nf(μm)}^(1/2)
=(2m+1)!/(m!)2*{∫(-∞,u)f(t)dt*∫(u,∞)f(t)dt}^mf(u/2{nf(μm)+μm)}^(1/2)/2{nf(μm)}^(1/2)
ここで,n→∞のときの極限を考える.スターリングの法則
m!=(2π)^(1/2)m^(m+1/2)exp(-m)
(2m+1)!=(2π)^(1/2)(2m+1)^(2m+3/2)exp(-2m-1)
を使って簡約化すると
(2m+1)!/(m!)2→1/(2π)^(1/2)*{n*2^n}^(1/2)
また,積分学における第1平均値定理により
{∫(-∞,u)f(t)dt*∫(u,∞)f(t)dt}^m
=2^(-2m){1-[uf(ξ)]^2/n[f(μm)]^2}^m → 2/2^nexp(-u^2/2)
f(u/2{nf(μm)+μm)}^(1/2)/2{nf(μm)}^(1/2) → 1/2(n)^(1/2)
したがって,
h(u)→1/(2π)^(1/2)exp(-u^2/2) 〜 N(0,1)
[補]スターリングの公式
n!=(2π)^(1/2)n^(n+1/2)exp(-n)
より
2nCn 〜 2^(2n)/(πn)^(1/2)
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
さらに,F(q)=pなる統計量qの漸近分布は
N(q,p(1-p)/{n[f(μm)]^2})
となることを示すこともできます.この式でp=1/2とおくと中央値の漸近分布,p=1/4とおくと第1四分位数の漸近分布が得られます.また,順序統計量の線形結合の分布に対しても,漸近正規性が成り立つことが証明されています.
母集団分布が正規分布N(μ,σ^2)のとき,
f(x)=1/(2π)^(1/2)σexp{-(x-μ)^2/2σ^2}
ですから,
μm=μ
f(μm)=1/(2π)^(1/2)σ
となるので,標本中央値の分布は漸近的にN(μ,πσ^2/2n)になります.すなわち,母集団分布が正規分布に従うとき,標本平均値と標本中央値は一致しますが,分散は標本中央値のほうが大きくなり,標本中央値の分散は標本平均値の分散のπ/2倍になることが示されます.
これより,標本中央値は標本平均に比べて
(σ^2/n)/(πσ^2/2n)=2/π=0.637(約63.7%)
の有効性しかもたないことがわかります.これを漸近相対効率(ARE:asymptotic relative efficiency)といいます.
また,コーシー分布
f(x)=1/π・α/{α^2+(x-μ)^2}
の中央値の分布が漸近的に平均μ,分散π^2α^2/4nの正規分布になることも導き出されます.これは【4】の結果:α^2/(n+2)(π/2)^2と漸近的に等しくなります.したがって,
N(μm,1/{4n[f(μm)]^2})
式は簡単な推定方式ながら,かなりよい推定量を与えてくれることがわかります.(必ずしも極限定理の分散のほうが小さいというわけではありません.)
===================================