■ガウス関数の積分と不等式(その20)
累積分布関数をF(x),確率密度関数をf(x)とするある連続分布からのn個の観測値x1〜xnを大きさの順に並び換えたものを
x(1),・・・,x(n)
と書くことにします.x(1)は最小値,x(n)は最大値であり,x(k)をk番目の順序統計量といいます.
===================================
【1】最大値,最小値の分布
最大値x(n)の累積分布関数G(x)は
x(i)≦x (i=1〜n)
となること,すなわち,x1,・・・,xnのすべてがx以下になることと同値ですから,
P{x(1)<=x and x(2)<=x and x(n)<=x}
=P{x(1)<=x}P{x(2)<=x}・・・P{x(n)<=x}
=F(x)*F(x)*・・・*F(x)
より,
G(x)={F(x)}^n
したがって,最大値の確率密度関数g(x)はxについて微分して
g(x)=n{F(x)}^(n-1)f(x)
同様にして最小値x(1)の累積分布関数は
G(x)=1-{1-F(x)}^n
確率密度関数は
g(x)=n{1-F(x)}^(n-1)f(x)
となります.
一般に,順序統計量x(k)の確率密度関数は,x(k)≦xとなることとx1,・・・,xnのうちk個以上がx以下になることと同値であり,
P{x(k)<=x}=ΣnCkF(x)^k{1-F(x)}^(n-k)
より
g(x)=n!/(k-1)!(n-k)!F(x)^(k-1){1-F(x)}^(n-k)f(x)
で与えられます.
n!/(k-1)!(n-k)!
は2項係数nCk=n!/k!(n-k)!を用いてknCk,ベータ関数を用いて1/B(k,n-k+1)と表せますから
g(x)=knCkF(x)^(k-1){1-F(x)}^(n-k)f(x)
g(x)=1/B(k,n-k+1)F(x)^(k-1){1-F(x)}^(n-k)f(x)
などとも書くことができます.
===================================
[1]x1,・・・,xnが互いに独立に区間(0,1)の一様分布:F(x)=xに従っているとき,x(k)の確率密度関数は
g(x)=1/B(k,n-k+1)x^(k-1){1-x}^(n-k)
すなわちベータ分布:Beta(k,n-k+1)であることがわかります.
したがって,
E[x(k)]=k/(n+1)
V[x(k)]=k(n-k+1)/(n+1)^2/(n+2)
となります.最大値の分布に関して
E[x(n)]=n/(n+1)
ですから,nが無限に大きくなるとx(n)は1に確率収束することを意味しています.これは直感的にも自明です.
===================================
[2]次に,2変数の場合で考えて見ましょう.x,yがパラメータλの指数分布
F(x)=1−exp(-λx)
にしたがい,互いに独立なとき,最小値の累積分布関数は
1-{exp(-λx)}^2 =1-exp(-2λx)
ですから,最小値の分布はパラメータ2λの指数分布になります.
n変数の場合の最小値の分布関数は
1-exp(-nλx)
すなわちパラメータnλの指数分布になります(平均:1/nλ,分散:1/(nλ)^2).しかし,最大値の分布は{1-exp(-λx)}^nですから指数分布にはなりません.
具体的な分布型は煩雑になりますが,指数分布の順序統計量の平均・分散に関しては,それぞれ引数が整数のときのジガンマ関数・トリガンマ関数に帰着し,簡単な形になります.
E[x(k)]=1/λΣ1/(n-k+1)
V[x(k)]=1/λ^2Σ1/(n-k+1)^2
したがって,n→∞のとき,最大値x(n)の分布の平均は無限に大きくなりますが,ほぼ
1/λ・(logn+γ) (γはオイラーの定数:0.57722・・・)
に等くなります.また,Σ1/k^2=π^2/6=ζ(2)ですから,分散は
1/λ^2・π^2/6
に収束します.
===================================
[3]正規分布:
標準正規分布
f(x)=1/(2π)^(1/2)exp(-x^2/2)
の場合,
n=2:E[x(2)]=-E[x(1)]=1/π^(1/2)
n=3:E[x(3)]=-E[x(1)]=3/2π^(1/2),E[x(2)}=0
n=4:E[x(4)]=-E[x(1)]=6arctan(2^(1/2))/π^(3/2)
E[x(3)}=-E[x(2)]=6/π^(1/2)-18arctan(2^(1/2))/π^(3/2)0
n=5:E[x(5)]=-E[x(1)]=15arctan(2^(1/2))/π^(3/2)-5/2π^(1/2)
E[x(4)}=-E[x(2)]=10/π^(1/2)-30arctan(2^(1/2))/π^(3/2)
E[x(3)]=0
一般に
φ(x)=1/(2π)^(1/2)σexp(-(x-μ)^2/2σ^2)
の場合,最大値の分布は
G(x)={Φ((x-μ)/σ)}^n
g(x)=n{Φ((x-μ)/σ)}^(n-1)φ((x-μ)/σ)/σ
E[x(n)]=μ+e1σ (e1はnについての増加関数)
V[x(n)]=e2σ^2 (e2はnについての減少関数)
最小値の分布は
G(x)=1-{1-Φ((x-μ)/σ)}^n
g(x)=n{1-Φ((x-μ)/σ)}^(n-1)φ((x-μ)/σ)/σ
E[x(1)]=μ-e1σ (e1はnについての増加関数)
V[x(1)]=e2σ^2 (e2はnについての減少関数)
と表すことができます.
===================================
[4]半円分布:f(x)=(1-x^2)^(1/2) (-1≦x≦1)の場合,
F(x)=1/2[x(1-x^2)+arcsinx]+π/4
ですから,最大値x(n)の累積分布関数G(x)は
G(x)={1/2[x(1-x^2)+arcsinx]+π/4}^n
となり,具体的な分布型は煩雑です.
===================================