■ランダム行列(その4)

【1】積率(モーメント)

 関数h(x)の期待値をE[h(x)]で示すことにします.Eは期待値(expectation)の頭文字をとったものです.ここで,

E[h(x)]=∫(-∞,∞)h(x)f(x)dx  連続変数の場合

    Σh(x)p(x)       離散変数の場合

で定義されます.ただし,∫(-∞,∞)|h(x)|f(x)dx<∞の条件が仮定されます.

 とくに,h(x)=(x-m)^kの場合をmまわりのk次積率と呼び,h(x)=xの場合が母平均μ=E[x]=∫(-∞,∞)xf(x)dx,h(x)=(x-μ)^2の場合が母分散μ2=E[(x-μ)^2]=∫(-∞,∞)(x-μ)^2f(x)dxです.E[(x-μ)2]は分散(variance)の頭文字をとって,V[x]あるいはvar[x]とも表されます.V[x]=E[(x-μ)^2]

 積率を用いると,母平均は原点まわりの1次積率,母分散は平均値まわりの2次積率と言い換えることもできます.平均値まわりの積率μkは中心積率(central moment)とも呼ばれます.左右対称な連続分布では,奇数次の中心積率は(それば存在すれば)0になります.一方,原点まわりの積率μ'kにはダッシュをつけて平均値まわりの積率と区別する規約になっています.

原点まわりのk次積率:h(x)=x^k μ'k=E[x^k]

μ'0=E[x0]=∫(-∞,∞)x^0f(x)dx=1

μ'1=E[x1]=∫(-∞,∞)x^1f(x)dx=μ

μ'2=E[x2]=∫(-∞,∞)x^2f(x)dx

μ'3=E[x3]=∫(-∞,∞)x^3f(x)dx

μ'4=E[x4]=∫(-∞,∞)x^4f(x)dx

平均値まわりのk次積率:μk=E[(x-E(x))^k]

μ0=E[(x-μ)0]=∫(-∞,∞)(x-μ)^0f(x)dx=1

μ1=E[(x-μ)1]=∫(-∞,∞)(x-μ)^1f(x)dx=0

μ2=E[(x-μ)2]=∫(-∞,∞)(x-μ)^2f(x)dx=σ2

μ3=E[(x-μ)3]=∫(-∞,∞)(x-μ)^3f(x)dx

μ4=E[(x-μ)4]=∫(-∞,∞)(x-μ)^4f(x)dx

ここでμ'kとμkの関係を示しておきます.

  xk=(x-μ+μ)^k=Σ(k,j)(x-μ)^(k-j)μ)^j

より,μ'k=ΣkCjμk-jμ^j  (2項級数)

逆計算すると

μk=ΣkCjμ'k^j(-μ)^j  (交代2項級数)

が得られます.

これらの関係を用いて4次モーメントまでの関係を求めると次のとおりです.

μ2=μ'2-μ^2(すなわち,2乗の平均−平均の2乗)

μ3=μ'3-3μ'2+2μ^3

μ4=μ'4-4μ'3μ+6μ'2μ^2-3μ^4

μ'2=μ2+μ^2

μ'3=μ3+3μ2+μ^3

μ'4=μ4+4μ3μ+6μ2μ^2+μ^4

 ガウス分布N(0,σ)では奇数次モーメントは0,偶数次モーメントについては

  μ2k=(2k)!/2^kk!・σ^k

===================================

【2】キュムラント(cumulant)

 積率と似たものにキュムラントがあります.5次までのキュムラントと平均値まわりの積率の関係は次のとおりです.

κ1=μ1

κ2=μ2

κ3=μ3

κ4=μ4-3μ2^2

κ5=μ5-10μ3μ2

すなわち,最初の2つのキュムラントκ1,κ2は平均,分散と同じものです.

 左右対称な連続分布では,κ1を除き,奇数次のキュムラントは0になります.また,正規分布では3次以上のキュムラントが0になりますから,任意の分布と正規分布の距離を表現するためには,積率よりもキュムラントのほうが便利です.キュムラントは半不変量(semi-invariant)とも呼ばれますが,キュムラントがモーメントより重要視されるのはこの性質のためです.

 また,高次積率をもつ分布の特性関数を正規分布の特性関数のまわりで展開すると,係数としてキュムラントが現れます.これを利用したものにエッジワース展開があります.

===================================

【3】中心極限定理

 キュムラント母関数を用いて,

「独立な確率変数xiがいずれも同一の平均値μと分散σ2をもつような任意の分布に対して,その標本平均の確率分布はn→∞の極限で正規分布N(μ,σ2/n)になる.」を証明してみましょう.

 このような内容の定理を「中心極限定理」といい,自然界における正規分布の普遍性を説明する1つの根拠とされています.中心極限定理にはいろいろなバリエーションがあり,s=(x1+x2+・・・+xn)とすると,標本平均s/nが適当な条件のもとで正規分布N(μ,σ2/n)に,s/√nがN(√nμ,σ2)に,あるいはsがN(nμ,nσ2)に収束することを示したものの総称です.

(証明)

 独立な確率変数xiがいずれも同一の平均値μ,分散σ2と積率母関数M(t)をもつものとすると,n個の変数の和s=(x1+x2+・・・+xn)の積率母関数は,

M(t)=[Mx(t)]^n

したがって,z=s/√(n)とすると,その積率母関数は

Mz(t)=[Mx(t/√(n))]^n

 これよりzのキュムラント母関数は

nlogMx(t/√(n))=n{κ1t/√(n)+κ2/2t^2/n+κ3/6(t/√(n))^3+・・・}

=√(n)μt+σ2/2t^2+κ3/6t^3/√(n)+・・・

r次のキュムラントはκrn^(-r/2+1)となって,n→∞のとき,3次以上のキュムラントが0に近づく.すなわち,s/√nはN(√nμ,σ2)に収束する.(厳密な証明ではありません)

===================================