■少数の法則(その3)

 1時間のあいだにある道路を通タクシーの平均台数Nがわかっている.だからといって,どの1分をとってもすべて同じ台数が通るとは限らない.

 逆にすべて同じ台数ならば何かランダムにならない原因がおきているはずである.それよりも,1台も通らない時間もあれば2台続けて通る時間もある可能性が高い.

 平均がわかっているならば,ポアソン分布から1分間に0台のタクシー,1台のタクシー,2台のタクシー,・・・が通る時間がどれくらいの割合になるか計算することができるのである.

===================================

 それではN台のタクシーに通し番号1,2,・・・,Nが付けられているとする.道路を観察し,通り過ぎるタクシーのナンバーを記録する.たとえば,

  414,189,102,769,600

となった.このデータからNについて何か予測することができるだろうか?

[1]N>769はすぐわかるが,系統誤差のない予測をするために最小値102を用いる.N−769と102−1は統計理論上対称になるはずである.

  N−769=102−1 → N=769+102−1=870

[2]さらによい予測値を求めるには,観察データ数5と最大値769を用いるものである.それは,

  N=(769^6−768^6)/(769^5−768^5)=922

で与えられるという.

 たった5台のタクシーナンバーからこれくらいのことが予測できるのである.

===================================