■ビュフォンの針の問題(その33)
【2】ロジスティック分布
f(x)=exp(-(x-α)/β)/{1+exp(-(x-α)/β)}^2
=1/4β[sech{(x-α)/2β}]^2
F(x)=1/{1+exp(-(x-α)/β)}
=1/2[1+tanh{(x-α)/2β}]
mean=α (mode,medianとも)
variance=β^2π^2/3
ロジスティック分布は,n個の無作為抽出標本の最大値と最小値の平均(ミッドレンジ:mid-range)のn→∞のときの極限分布として,あるいは最大値と最小値の比の極限分布として得られたもので,極値分布と深く関係しています.極値分布の1種である二重指数分布(ガンベル分布)にしたがう変数の差の分布はロジスティック分布になることも記憶すべきことでしょう.
しかし,応用的にはロジスティック曲線との関連が重要であって,累積分布関数F(x)がロジスティック曲線になる分布がロジスティック分布といえます.
人口の変化を前もって十分に想定し正しく見積もることは未来予測するために非常に重要な課題です.ロジスティック曲線とは成長曲線の一種で,人口の増加法則の研究から導かれた仮説「人口は等比級数的に増加すると同時に,人口の大きさに比例するような抵抗を受ける」をモデル化したものです.
1798年,イギリスの経済学者マルサスは「人口論」のなかで人口の増加率は総人口Nに比例するというモデル(dN/dt=k0N:すなわち,人口は指数関数的に増加するN=N0exp(k0t))をたてました.しかし,マルサス・モデルでははじめはその動向が一致するのですが,モデルのままでは人口が無限大に発散してしまい,すぐに実情に合わなくなってしまいます.つまり,このモデルは人口予測にあまり役にたちません.
実際には人口の過密が起こると食糧問題,エネルギーの供給不足,住宅環境問題などいろいろな抑制要因のため,指数関数的・等比数列的な増加はとうてい起こりえないのです.そこで,人口過密の要因を考慮に入れて,1837年,オランダの数理生物学者フェルフルストは,人口の増加率は人口に比例しかつ人口の上限Bが定まっており,各時点での人口が最大人口に飽和するまでの余裕(B−N)にも比例するという修正モデルを提案しました.
dN/dt=kN(B−N)=kBN−kN^2
この式が人口増加のロジスティックモデルであり,Nは人口増加,B−Nはそれに歯止めをかける因子です.
実際のデータでは,kはkBに比べてかなり小さい数になりますから,Nの値が小さいときは非線形項kN^2はほとんど無視でき,dN/dt=kBNすなわちマルサス・モデルと同一になります.しかし,Nがある値以上になるとNの増加に抑制力が加わり,その効果はN^2に比例して効いてきます.フェルフルストの人口モデルは,換言すれば,人口の大きさに比例する抵抗を受けるモデルです.
この微分方程式は高次項y^2を含むので非線形現象を表していますが,変数分離型なので簡単に解けて,
y=a/(1+bexp(cx)) (a>0,b>0,c<0)
という解が得られます.
フェルフルスト・モデルを表わす曲線は,のちに,アメリカの生物学者パールによってロジスティック曲線と名づけられました.2本の漸近線y=a,y=0をもち,最初は指数的に増加し,y=a/2(50%)まで増加しますが,それ以後はしだいに増加率が低下してゆき,x→∞のときy→aに収束します.また,勾配の最大値のところが変曲点で,変曲点に対して点対称のS字型曲線(シグモイドカーブ)を描きます.
ロジスティック曲線は,その後,生物,社会,経済現象にもフィットすることが実証され,新製品の需要予測や高齢者の死亡率の推定などにしばしば適用されています.また,化学分野では自己触媒反応のモデルになっています.
これが累積分布関数F(x)であるためにはa=1でなければなりませんから,
F(x)=1/{1+exp(-(x-α)/β)}
=1/2[1+tanh{(x-α)/2β}]
実際に微分してみると確率密度関数
f(x)=exp(-(x-α)/β)/{1+exp(-(x-α)/β)}^2
=1/4β[sech{(x-α)/2β}]^2
が得られます.
α=0,β=1の場合が標準ロジスティック分布
f(x)=exp(-x)/{1+exp(-x)}^2
でその平均値0,分散はπ^2/3となります.ロジスティック分布も裾の重い分布の1つで(−2,2)の外の確率が0.2384,(−3,3)の外の確率が0.0949です.尖度は正規分布が3に対してロジスティック分布が4.2です.
===================================
[1]ロジット解析への応用
これまで導出過程で見てきたようにロジスティック分布には
f(x)=F(x)[1-F(x)]
x=log[F(x)/{1-F(x)}]
F^-1(x)=α+βlog{x/(1-x)}
なる性質があります.ロジットlog{x/(1-x)}が線形になる性質をうまく利用して,2値反応モデルなど質的データの解析ではロジット解析がしばしば行われます.このように,ロジスティック分布は確率密度関数が正規分布と類似していること,また累積分布関数および分位点関数が明示的に書き表せることなどの数学的な取り扱いやすさから,ロジット解析は確率分布として正規分布を仮定するプロビット解析よりも多用されています.
[2]正規分布の代用として
正規分布もロジスティック分布もベル型曲線を描きますが,正規分布
f(x)=1/√2πexp(−x^2/2)
の粗い近似式として平均値0,分散1に規格化したロジスティック分布
f(x)=exp(-πx/√3)/{1+exp(-πx/√3)}^2
もしばしば用いられます.しかし,この分布の裾の重さはほぼ自由度8〜9のt分布に相当します.√3ではなく1.7にすると正規近似の精度がよくなります.
f(x)=exp(-πx/1.7)/{1+exp(-πx/1.7)}^2
===================================