■ガウス関数の積分と不等式(その48)
【1】2項分布
2項分布は1回の実験で2通りの結果のいずれか1つのみが生ずるn回の試行における最も基本的なモデルです.離散分布の解説ではしばしばポリアの壷と呼ばれるモデル(urn model)が用いられますが,ここでは不良品の含まれたロットで代用することにします.不良率pの製品のロットから,n個の製品を抽出して調べる場合について考えてみましょう.
1回ずつもとに戻して調べる復元抽出では,取り出した1個の製品について不良品である確率がp,良品である確率がq=1-pですから,x個が不良品(n-x個が良品)になる確率は
p(x)=nCxp^x(1-p)^(n-x) x=0,1,2,・・・,n
で表されます.
この分布の形状はp=1/2のとき対称,p<1/2のとき正に,p>1/2のとき負にゆがみます.したがって,一般には平均値は最頻値とは異なります.しかし,p≠1/2でもnが十分大きい場合には非対称性は減少し,2項分布は正規分布で近似できるほぼ対称的な形になることが知られています(2項分布のガウス近似).
母平均=np
母分散=npq
より,母平均はつねに母分散より小さくなります.また,変動係数の平方をつくってみると
μ2/μ1^2=(1-p)/np
これより,変動係数そのものはnの平方根に逆比例しますから,観測数を増加させれば誤差が小さくなることを示していて,このことは常識的にも了解できるでしょう.
[1]2項分布の再生性
同じ確率pをもつ独立な2項確率変数の和の分布は2項分布になります.
xi〜B(ni,p) Σxi〜B(Σni,p)
なお,差の分布は2項分布にはならず,ベッセル関数を用いて表される分布になります.
[2]2項分布の正規近似
nが十分大きいとき2項分布は正規分布で近似できます(ド・モアブル=ラプラスの定理).これは中心極限定理の特別な場合にあたり,エーレンフェストのふるいという簡単な実験装置を用いると視覚的にもそれを確認することができます.
nが20を超えると2項分布の計算は面倒になりますがが,ガウス分布なら計算は簡単ですから,nが大きいと2項分布がガウス分布で近似できるということは実用上きわめて有用です.2項分布は超幾何分布の代用としても応用されていますが,幾何分布,負の2項分布,ポアソン分布なども2項分布との関連が強い分布です.
===================================