■ガウス関数の積分と不等式(その18)
【4】標本中央値の分布
簡単のために,標本の大きさnを奇数とし,n=2m+1とおきます.【1】において,n=2m+1のとき,中央値x(m+1)の確率密度関数は
g(x)=(2m+1)!/(m!)^2F(x)^m{1-F(x)}^mf(x)
で与えられます.母集団分布が一様分布や指数分布のときこれは簡単な形になりますが,正規母集団のときには簡単にはなりません.
[1]確率変数が区間(0,1)の一様分布にしたがうとき,標本中央値x(m+1)については,
E[x(m+1)]=1/2
V[x(m+1)]=1/4(2m+3)=1/4(n+2)
一様分布の標本平均値と平均値の分散はそれぞれ1/2,1/(12n)ですから,標本平均値と標本中央値は一致しますが,その分散はn>1のときには常に標本中央値のほうが大きくなります.
[2]コーシー分布の標本中央値
コーシー分布
f(x)=1/π・α/{α^2+(x-μ)^2}
F(x)=1/π[arctan(x-μ)/α]+1/2
より,その分布は
g(x)=(2m+1)!/(m!)^2π2^2m{1-(2/πarctanx-μ)/α)^2}^mα/{α^2+(x-μ)^2}
となります.
長い積分計算の後,
期待値:E[x(m+1)]=μ
分散 :V[x(m+1)]=α^2/(n+2)(π/2)^2{1+2/(n+4)(π/2)^2+3/(n+4)(n+6)(π/2)^4+・・・}
したがって,nが十分大きいところでは
V[x(m+1)]=α^2/(n+2)(π/2)^2
これにより,標本中央値の分散は標本の大きさnを大きくすると小さくなることが示されました.コーシー分布に従う変数については,標本平均値に関する中心極限定理が成り立たないわけですから,まことに注目すべきことです.
===================================