■πとeの話(その10)

 今回のコラムでは,積率(モーメント)と累積率(キュムラント)の話をしたい.

===================================

[1]積率(モーメント)

 関数h(x)の期待値をE[h(x)]で示すことにします.Eは期待値(expectation)の頭文字をとったものです.ここで,

E[h(x)]=∫(-∞,∞)h(x)f(x)dx  連続変数の場合

    Σh(x)p(x)       離散変数の場合

で定義されます.ただし,∫(-∞,∞)|h(x)|f(x)dx<∞の条件が仮定されます.

 とくに,h(x)=(x-m)^kの場合をmまわりのk次積率と呼び,h(x)=xの場合が母平均μ=E[x]=∫(-∞,∞)xf(x)dx,h(x)=(x-μ)^2の場合が母分散μ2=E[(x-μ)^2]=∫(-∞,∞)(x-μ)^2f(x)dxです.E[(x-μ)^2]は分散(variance)の頭文字をとって,V[x]あるいはvar[x]とも表されます.

V[x]=E[(x-μ)^2]

 積率を用いると,母平均は原点まわりの1次積率,母分散は平均値まわりの2次積率と言い換えることもできます.平均値まわりの積率μkは中心積率(central moment)とも呼ばれます.左右対称な連続分布では、奇数次の中心積率は(それば存在すれば)0になります.

 一方,原点まわりの積率μ'kにはダッシュをつけて平均値まわりの積率と区別する規約になっています.

原点まわりのk次積率:h(x)=x^k μ'k=E[x^k]

μ'0=E[x0]=∫(-∞,∞)x^0f(x)dx=1

μ'1=E[x1]=∫(-∞,∞)x^1f(x)dx=μ

μ'2=E[x2]=∫(-∞,∞)x^2f(x)dx

μ'3=E[x3]=∫(-∞,∞)x^3f(x)dx

μ'4=E[x4]=∫(-∞,∞)x^4f(x)dx

平均値まわりのk次積率:μk=E[(x-E(x))^k]

μ0=E[(x-μ)0]=∫(-∞,∞)(x-μ)^0f(x)dx=1

μ1=E[(x-μ)1]=∫(-∞,∞)(x-μ)^1f(x)dx=0

μ2=E[(x-μ)2]=∫(-∞,∞)(x-μ)^2f(x)dx=σ2

μ3=E[(x-μ)3]=∫(-∞,∞)(x-μ)^3f(x)dx

μ4=E[(x-μ)4]=∫(-∞,∞)(x-μ)^4f(x)dx

 ここでμ'kとμkの関係を示しておきます.

  xk=(x-μ+μ)^k=Σ(k,j)(x-μ)^(k-j)μ)^j

より

  μ'k=ΣkCjμk-jμ^j  2項係数

逆計算すると

  μk=ΣkCjμ'k^j(-μ)^j  交代2項級数

が得られます.

 これらの関係を用いて4次モーメントまでの関係を求めると次のとおりです.

μ2=μ'2-μ^2(すなわち,2乗の平均−平均の2乗)

μ3=μ'3-3μ'2+2μ^3

μ4=μ'4-4μ'3μ+6μ'2μ^2-3μ^4

μ'2=μ2+μ^2

μ'3=μ3+3μ2+μ^3

μ'4=μ4+4μ3μ+6μ2μ^2+μ^4

[2]歪度と尖度

 積率は分布の位置と形を表す統計量で,1次積率は平均,2次積率は分散と関係していました.平均と分散で話がおわりというわけではありません.この2つは「積率」の最初の2項にすぎません.このほかに,高次の項があって,分布のより微妙な点を表現します.

 3次以上の高次積率では奇数次積率は歪度(skewness)と,偶数次積率は尖度(kurtosis)と関係があります.高次のものほど意味付けが少なくなりますから,分布特性値としては3次積率・4次積率が重要です.

 歪度は分布の非対称度を表す指標であり,歪度係数(coefficient of skewness)は√β1=μ3/μ2^3/2と定義されます.正規分布やロジスティック分布のような対称分布では√β1=0,カイ2乗分布のような非対称で右に長い裾をもつ分布では√β1>0になります.

 一方,尖度はどれくらい速く裾が0に近づくかを示す,すなわち分布の裾の広がりを表す指標になります.尖度係数(coefficient of kurtosis)β2はβ2=μ4/μ2^2で定義されます.たとえば,正規分布の尖度は3,ロジスティック分布の尖度は4.2であり,ロジスティック分布のほうが長い裾をもっていることがわかります.尖度という用語からは分布の尖り具合をイメージさせられますが,これはあまり適当な用語ではありません.

 また,変動係数(coefficient of variation)は√μ2/μで定義されます.これは,標準偏差が平均と比べてどれ位の大きさかという相対的なばらつきを示す指標になっています.変動係数,歪度,尖度の定義は,それぞれμk/μ2^k/2(k=2,3,4)と表わすことができます.

[3]キュムラント(cumulant)

 積率と似たものにキュムラントがあります.5次までのキュムラントと平均値まわりの積率の関係は次のとおりです.

κ1=μ1

κ2=μ2

κ3=μ3

κ4=μ4-3μ2^2

κ5=μ5-10μ3μ2

すなわち,最初の2つのキュムラントκ1,κ2は平均,分散と同じものです.

 左右対称な連続分布では,κ1を除き,奇数次のキュムラントは0になります.また,正規分布では3次以上のキュムラントが0になりますから,任意の分布と正規分布の距離を表現するためには,積率よりもキュムラントのほうが便利です.キュムラントは半不変量(semi-invariant)とも呼ばれますが,キュムラントがモーメントより重要視されるのはこの性質のためです.

 また,高次積率をもつ分布の特性関数を正規分布の特性関数のまわりで展開すると,係数としてキュムラントが現れます.これを利用したものにエッジワース展開があります.

[4]歪度と尖度(その2)

  歪度=κ3/σ^3

  尖度=κ4/σ^4

と定義すれば,歪度は[2]で定義したものと一致し,尖度は[2]で定義したから3を引いたものと一致する.

===================================