分布特性値（その１）

■分布特性値（その１）

　確率分布の分布状態を表すには，基本的な数種類の特性値が考えられています．とりわけ，確率分布の平均値や分散・標準偏差についてはどの教科書でも必ず取り上げられます．前者は位置情報の指標であり，後者は尺度情報（ばらつき）の指標となるからです．ありきたりのことは書きたくないので，できれば触れないで済ませたいところですが，分布特性値は積率を利用した確率分布の母数推定法（積率法）にとって極めて重要な事項であり，避けては通れない宿命になっています。

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

【１】母平均と母分散

　分布の中心位置を表す代表的な特性値が母平均μであり，

　　μ=∫(-∞,∞)xf(x)dx

と計算されます．

　一般に関数f(x)の物理的重心は∫(-∞,∞)xf(x)dx/∫(-∞,∞)f(x)dxとなりますが，確率密度関数f(x)の場合，この分母は１ですから，母平均μは確率分布の物理的重心に相当します．重心では，

　　∫(-∞,μ)xf(x)dx=∫(μ,∞)xf(x)dx

が成り立ちます．すなわち，時計回り，反時計間回りの回転力の釣り合うところが重心になり，天秤棒が平衡を保つ点が母平均というわけです．

　一方，確率分布の広がりの表す特性値の１つが母分散μ2であり，

　　μ2=∫(-∞,∞)(x-μ)^2f(x)dx

で計算されます．母分散μ2はしばしばμ2=σ^2と書き表され，母分散の平方根σ=√σ^2は母標準偏差と呼ばれます．

　母分散は，力学との相関でいうと慣性モーメントに対応していて，慣性モーメントが大きいほどまわりにくいが，いったん回りだすととまりにくくなることに対応しています．

　また，平均値まわりの分散は最小であることは簡単に示すことができます．

　　∫(-∞,∞)(x-μ)^2f(x)dx<=∫(-∞,∞)(x-ｍ)^2f(x)dx

すなわち，平均値はそのまわりの分散が最小な点として特徴づけられ，このことから，回転運動では重心を中心として回転することが理解されます．

［１］正規分布Ｎ（μ，σ^2）の式

　　f(x)=1/√2πσexp{-(x-μ)^2/2σ^2}

では

　　∫(-∞,∞)xf(x)dx=μ，∫(-∞,∞)(x-μ)^2f(x)dx=σ^2

になりますから，位置母数μ，尺度母数σはそれぞれ正規分布の母平均と母標準偏差の意味をもっていることがわかります．

［２］平均・分散のない分布

　トリッキーに思われるかもしれませんが，母平均や母分散は常に存在するとは限りません．たとえば，

　　f(x)=1/π(1+x^2) -∞<x<∞

を取り上げてみましょう．この関数は∫f(x)dx=1/π[arctan(x)]=1ですから確かに確率分布（コーシー分布）です．しかし，この確率分布は偶関数だから平均は０であると単純に考えてはいけません．０は中央値ではあっても，この分布は平均をもたないのです．

　実際，∫xf(x)dxのリーマン積分は1/π*1/2log(1+x^2)であり，積分∫xf(x)dxは不定形∞－∞となるから定義されません．平均値が定義されないならば，もちろん，分散も定義されないということになります．

　コーシー確率変数が平均値０をもつという命題は，確率論の観点からすると，コーシー分布に対しても中心極限定理が成立することになり，正しくないだけでなく危険でもあります．繰り返しになりますが，重要なことですのでもう少し，考察してみましょう．

　コーシー分布では，グラフの対称性から，その平均値が０であると定義するのは自然と思えます．実際，対称性を利用して有限区間を無限区間まで拡張して考えると，その値は０となります．

　　lim(a→∞)∫(-a,a)xf(x)dx=0

　このことから，いかなる平均値ももたないと主張することのほうが大袈裟だと思われるかもしれません．しかし，リーマン積分では，a,bを独立に無限大としたときの極限値

　　lim(a→-∞,b→∞)∫(a,b)xf(x)dx

が収束することを要請しているのであって，この値は不定形∞－∞となるから発散すなわち平均は存在しないと考えるのです．

　コーシー分布以外の確率分布では，レヴィ分布（ブラウンノイズ関数）

　　f(x)=1/√(2π)x^(-3/2)exp(-1/2x)

アノン分布：f(x)=(1-cosx)/πx^2 -∞<x<∞

も，平均値をもたない分布として知られています．

　また，離散分布でも，平均値の存在しない確率分布があり，たとえば，

　　p(x)=6/π^2x^2　(x=1,2,3,･･･）

の平均値は

　　6/π^2(1/1+1/2+1/3+･･･)

調和級数となるため，無限大に発散してしまいます．

【補】調和級数

　　Ｈ∞＝１／１＋１／２＋１／３＋１／４＋・・・

は非常にゆっくりとですが大きくなり，ついには無限大に発散します．調和級数Ｈ∞はゼータ関数ζ（１）に相当し，ゼータ関数は調和級数を一般化したものと考えることができます．

　なお，離散型，連続型以外の特異型分布関数もあり，たとえば，カントル階段関数は特異型分布関数の１例です．特異分布に対してはルベーグ積分の概念が必要になることもあります．

　ここではその種の議論を必要としないので，さしあたってリーマン積分で十分であろうと思われますが，実用上用いられる密度関数は連続関数であり，ルベーグ積分とリーマン積分は一致します．したがって，コーシー分布やブラウンノイズ関数に対してはルベーグ積分であってもうまくいかないことを申し添えておきます．

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

【２】積率（モーメント）

　関数h(x)の期待値をE[h(x)]で示すことにします．Eは期待値（expectation）の頭文字をとったものです．ここで，

E[h(x)]=∫(-∞,∞)h(x)f(x)dx　　連続変数の場合

　　　　Σh(x)p(x)　　　　　　　離散変数の場合

で定義されます．ただし，∫(-∞,∞)｜h(x)｜f(x)dx＜∞の条件が仮定されます．

　とくに，h(x)=(x-m)^kの場合をｍまわりのｋ次積率と呼び，

h(x)=xの場合が母平均μ=E[x]=∫(-∞,∞)xf(x)dx，h(x)=(x-μ)^2の場合が母分散μ2=E[(x-μ)^2]=∫(-∞,∞)(x-μ)^2f(x)dxです．E[(x-μ)^2]は分散（variance）の頭文字をとって，V[x]あるいはvar[x]とも表されます．

V[x]=E[(x-μ)^2]

　積率を用いると，母平均は原点まわりの１次積率，母分散は平均値まわりの２次積率と言い換えることもできます．平均値まわりの積率μkは中心積率（central moment）とも呼ばれます．左右対称な連続分布では、奇数次の中心積率は（それば存在すれば）０になります．

　一方，原点まわりの積率μ'kにはダッシュをつけて平均値まわりの積率と区別する規約になっています．

原点まわりのｋ次積率：h(x)=x^k μ'k=E[x^k]

μ'0=E[x0]=∫(-∞,∞)x^0f(x)dx=1

μ'1=E[x1]=∫(-∞,∞)x^1f(x)dx=μ

μ'2=E[x2]=∫(-∞,∞)x^2f(x)dx

μ'3=E[x3]=∫(-∞,∞)x^3f(x)dx

μ'4=E[x4]=∫(-∞,∞)x^4f(x)dx

平均値まわりのｋ次積率：μk=E[(x-E(x))^k]

μ0=E[(x-μ)0]=∫(-∞,∞)(x-μ)^0f(x)dx=1

μ1=E[(x-μ)1]=∫(-∞,∞)(x-μ)^1f(x)dx=0

μ2=E[(x-μ)2]=∫(-∞,∞)(x-μ)^2f(x)dx=σ2

μ3=E[(x-μ)3]=∫(-∞,∞)(x-μ)^3f(x)dx

μ4=E[(x-μ)4]=∫(-∞,∞)(x-μ)^4f(x)dx

　ここでμ'kとμkの関係を示しておきます．

　　xk=(x-μ+μ)^k=Σ(k,j)(x-μ)^(k-j)μ)^j

より

　　μ'k=ΣkCjμk-jμ^j　　２項係数

逆計算すると

　　μk=ΣkCjμ'k^j(-μ)^j　　交代２項級数

が得られます．

　これらの関係を用いて４次モーメントまでの関係を求めると次のとおりです．

μ2=μ'2-μ^2（すなわち，２乗の平均－平均の２乗）

μ3=μ'3-3μ'2+2μ^3

μ4=μ'4-4μ'3μ+6μ'2μ^2-3μ^4

μ'2=μ2+μ^2

μ'3=μ3+3μ2+μ^3

μ'4=μ4+4μ3μ+6μ2μ^2+μ^4

［１］歪度と尖度

　積率は分布の位置と形を表す統計量で，１次積率は平均，２次積率は分散と関係していました．平均と分散で話がおわりというわけではありません．この２つは「積率」の最初の２項にすぎません．このほかに，高次の項があって，分布のより微妙な点を表現します．

　３次以上の高次積率では奇数次積率は歪度（skewness）と，偶数次積率は尖度（kurtosis）と関係があります．高次のものほど意味付けが少なくなりますから，分布特性値としては３次積率・４次積率が重要です．

　歪度は分布の非対称度を表す指標であり，歪度係数（coefficient of skewness）は√β1=μ3/μ2^3/2と定義されます．正規分布やロジスティック分布のような対称分布では√β1=0，カイ２乗分布のような非対称で右に長い裾をもつ分布では√β1>0になります．

　一方，尖度はどれくらい速く裾が０に近づくかを示す，すなわち分布の裾の広がりを表す指標になります．尖度係数（coefficient of kurtosis）β2はβ2=μ4/μ2^2で定義されます．たとえば，正規分布の尖度は３，ロジスティック分布の尖度は４．２であり，ロジスティック分布のほうが長い裾をもっていることがわかります．尖度という用語からは分布の尖り具合をイメージさせられますが，これはあまり適当な用語ではありません．

　また，変動係数（coefficient of variation）は√μ2/μで定義されます．これは，標準偏差が平均と比べてどれ位の大きさかという相対的なばらつきを示す指標になっています．変動係数，歪度，尖度の定義は，それぞれμk/μ2^k/2(k=2,3,4)と表わすことができます．

［２］キュムラント（cumulant）

　積率と似たものにキュムラントがあります．５次までのキュムラントと平均値まわりの積率の関係は次のとおりです．

κ1=μ1

κ2=μ2

κ3=μ3

κ4=μ4-3μ2^2

κ5=μ5-10μ3μ2

すなわち，最初の２つのキュムラントκ1,κ2は平均，分散と同じものです．

　左右対称な連続分布では，κ1を除き，奇数次のキュムラントは０になります．また，正規分布では３次以上のキュムラントが０になりますから，任意の分布と正規分布の距離を表現するためには，積率よりもキュムラントのほうが便利です．キュムラントは半不変量（semi-invariant）とも呼ばれますが，キュムラントがモーメントより重要視されるのはこの性質のためです．

　また，高次積率をもつ分布の特性関数を正規分布の特性関数のまわりで展開すると，係数としてキュムラントが現れます．これを利用したものにエッジワース展開があります．

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝