■幾何分布と誕生日の問題(その28)

 誕生日のクイズのトリックは,2人が同じ誕生日である確率は,1/365と小さいけれども,30人もいれば,30人の中から2人を選び出す組合せ数(30,2)は,30×29/2=435通りもあることである.これであれば,同じ誕生日に生まれたペア数の平均値は435/365となるから,一組以上のペアができると期待できるのである.一般に,1年はd日とし,構成員をn人とするとペア数の期待値はn(n−1)/2dになっていることに注意されたい.

 式を誘導するため,次のような定式化をおこなってみよう.

1番目の人と2番目の人が異なる誕生日である確率は1−1/dである.

また,3番目の人が1番と2番の人と誕生日が異なる確率は,2番目の人は1番目の人と異なる日に生まれたとして,1−2/dである.

したがって,n人全員が異なる誕生日である確率pnは,

  pn=(1−1/d)×(1−2/d)×・・・×(1−(n−1)/d)

となる.求めたい確率pは少なくとも2人同じ誕生日の人がいる確率であるから,

  p=1−pn

 d=365について,n=23では求める確率は0.5073,n=30では0.71,n=40では0.89にもなる.したがって,n=30〜40だったら少なくとも2人は同じ誕生日であるほうに賭けるほうが賢明であることがわかる.

 また,nがdに比べて小さければ,テイラー展開より

  1−k/d〜exp(−k/d)

  Π(1−k/d)〜exp(−Σk/d)

Σk=n(n−1)/2であるから,

  p〜1−exp(−n(n−1)/2d)

となる.

 ここで,先ほど説明したペア数の期待値n(n−1)/2dが再登場しているが,ペア数の分布は複雑であっても,その平均は単純であり,この近似計算はペア数の分布を平均n(n−1)/2dのポアソン分布で近似したものと考えることができる.電卓計算にはポアソン近似のほうが向いていて,たとえば,n=23,d=365であれば,p〜0.5000が得られ,真の値0.5073のよい近似となっていることが理解される.

 

n    20  23  30  40  50

正確な値 0.4114 0.5073 0.7063 0.8912 0.9704

近似値  0.4058 0.5000 0.6963 0.8820 0.9651

===================================