■ガウス関数の積分と不等式(その20)

 累積分布関数をF(x),確率密度関数をf(x)とするある連続分布からのn個の観測値x1〜xnを大きさの順に並び換えたものを

  x(1),・・・,x(n)

と書くことにします.x(1)は最小値,x(n)は最大値であり,x(k)をk番目の順序統計量といいます.

===================================

【1】最大値,最小値の分布

 最大値x(n)の累積分布関数G(x)は

  x(i)≦x (i=1〜n)

となること,すなわち,x1,・・・,xnのすべてがx以下になることと同値ですから,

  P{x(1)<=x and x(2)<=x and x(n)<=x}

  =P{x(1)<=x}P{x(2)<=x}・・・P{x(n)<=x}

  =F(x)*F(x)*・・・*F(x)

より,

  G(x)={F(x)}^n

したがって,最大値の確率密度関数g(x)はxについて微分して

  g(x)=n{F(x)}^(n-1)f(x)

 同様にして最小値x(1)の累積分布関数は

  G(x)=1-{1-F(x)}^n

確率密度関数は

  g(x)=n{1-F(x)}^(n-1)f(x)

となります.

 一般に,順序統計量x(k)の確率密度関数は,x(k)≦xとなることとx1,・・・,xnのうちk個以上がx以下になることと同値であり,

  P{x(k)<=x}=ΣnCkF(x)^k{1-F(x)}^(n-k)

より

  g(x)=n!/(k-1)!(n-k)!F(x)^(k-1){1-F(x)}^(n-k)f(x)

で与えられます.

  n!/(k-1)!(n-k)!

は2項係数nCk=n!/k!(n-k)!を用いてknCk,ベータ関数を用いて1/B(k,n-k+1)と表せますから

  g(x)=knCkF(x)^(k-1){1-F(x)}^(n-k)f(x)

  g(x)=1/B(k,n-k+1)F(x)^(k-1){1-F(x)}^(n-k)f(x)

などとも書くことができます.

===================================

[1]x1,・・・,xnが互いに独立に区間(0,1)の一様分布:F(x)=xに従っているとき,x(k)の確率密度関数は

  g(x)=1/B(k,n-k+1)x^(k-1){1-x}^(n-k)

すなわちベータ分布:Beta(k,n-k+1)であることがわかります.

 したがって,

  E[x(k)]=k/(n+1)

  V[x(k)]=k(n-k+1)/(n+1)^2/(n+2)

となります.最大値の分布に関して

  E[x(n)]=n/(n+1)

ですから,nが無限に大きくなるとx(n)は1に確率収束することを意味しています.これは直感的にも自明です.

===================================

[2]次に,2変数の場合で考えて見ましょう.x,yがパラメータλの指数分布

  F(x)=1−exp(-λx)

にしたがい,互いに独立なとき,最小値の累積分布関数は

  1-{exp(-λx)}^2 =1-exp(-2λx)

ですから,最小値の分布はパラメータ2λの指数分布になります.

 n変数の場合の最小値の分布関数は

  1-exp(-nλx)

すなわちパラメータnλの指数分布になります(平均:1/nλ,分散:1/(nλ)^2).しかし,最大値の分布は{1-exp(-λx)}^nですから指数分布にはなりません.

 具体的な分布型は煩雑になりますが,指数分布の順序統計量の平均・分散に関しては,それぞれ引数が整数のときのジガンマ関数・トリガンマ関数に帰着し,簡単な形になります.

  E[x(k)]=1/λΣ1/(n-k+1)

  V[x(k)]=1/λ^2Σ1/(n-k+1)^2

 したがって,n→∞のとき,最大値x(n)の分布の平均は無限に大きくなりますが,ほぼ

  1/λ・(logn+γ)  (γはオイラーの定数:0.57722・・・)

に等くなります.また,Σ1/k^2=π^2/6=ζ(2)ですから,分散は

  1/λ^2・π^2/6

に収束します.

===================================

[3]正規分布:

 標準正規分布

  f(x)=1/(2π)^(1/2)exp(-x^2/2)

の場合,

n=2:E[x(2)]=-E[x(1)]=1/π^(1/2)

n=3:E[x(3)]=-E[x(1)]=3/2π^(1/2),E[x(2)}=0

n=4:E[x(4)]=-E[x(1)]=6arctan(2^(1/2))/π^(3/2)

    E[x(3)}=-E[x(2)]=6/π^(1/2)-18arctan(2^(1/2))/π^(3/2)0

n=5:E[x(5)]=-E[x(1)]=15arctan(2^(1/2))/π^(3/2)-5/2π^(1/2)

    E[x(4)}=-E[x(2)]=10/π^(1/2)-30arctan(2^(1/2))/π^(3/2)

    E[x(3)]=0

 一般に

  φ(x)=1/(2π)^(1/2)σexp(-(x-μ)^2/2σ^2)

の場合,最大値の分布は

  G(x)={Φ((x-μ)/σ)}^n

  g(x)=n{Φ((x-μ)/σ)}^(n-1)φ((x-μ)/σ)/σ

  E[x(n)]=μ+e1σ   (e1はnについての増加関数)

  V[x(n)]=e2σ^2    (e2はnについての減少関数)

最小値の分布は

  G(x)=1-{1-Φ((x-μ)/σ)}^n

  g(x)=n{1-Φ((x-μ)/σ)}^(n-1)φ((x-μ)/σ)/σ

  E[x(1)]=μ-e1σ   (e1はnについての増加関数)

  V[x(1)]=e2σ^2    (e2はnについての減少関数)

と表すことができます.

===================================

[4]半円分布:f(x)=(1-x^2)^(1/2) (-1≦x≦1)の場合,

F(x)=1/2[x(1-x^2)+arcsinx]+π/4

ですから,最大値x(n)の累積分布関数G(x)は

  G(x)={1/2[x(1-x^2)+arcsinx]+π/4}^n

となり,具体的な分布型は煩雑です.

===================================