■幾何分布と誕生日の問題(その33)
誕生日のパラドックスは数多くの本で取り扱われた有名なものであるが,確かに,少なくとも2人同じ誕生日の人がいる確率の大きさには驚かされる.これを読んだ植木嬢(職場の同僚)が早速小生に疑問を投げかけてきた.ひとつには,この数字が女の直感に反するというものであり,もうひとつには,実際の計算方法を見るまではどうしても合点がいかないというものであった.
この序文には,おしつけがましく結果だけを書いてあるが,実際問題として,確率計算になれていないと,式の誘導は難しいだろう.とりあえず,信じるものは救われる.ホレ信じなさい.というわけであるが,天下り式で我慢できないかたは,以下の説明を参照しながら誘導を試みられたい.
===================================
このクイズのトリックは,2人が同じ誕生日である確率は,1/365と小さいけれども,30人もいれば,30人の中から2人を選び出す組合せ数(30,2)は,30×29/2=435通りもあることである.これであれば,同じ誕生日に生まれたペア数の平均値は435/365となるから,一組以上のペアができると期待できるのである.一般に,1年はd日とし,構成員をn人とするとペア数の期待値はn(n−1)/2dになっていることに注意されたい.
式を誘導するため,次のような定式化をおこなってみよう.
1番目の人と2番目の人が異なる誕生日である確率は1−1/dである.また,3番目の人が1番と2番の人と誕生日が異なる確率は,2番目の人は1番目の人と異なる日に生まれたとして,1−2/dである.
したがって,n人全員が異なる誕生日である確率pnは,
pn=(1−1/d)×(1−2/d)×・・・×(1−(n−1)/d)
となる.求めたい確率pは少なくとも2人同じ誕生日の人がいる確率であるから,
p=1−pn
d=365について,n=23では求める確率は0.5073,n=30では0.71,n=40では0.89にもなる.したがって,n=30〜40だったら少なくとも2人は同じ誕生日であるほうに賭けるほうが賢明であることがわかる.
また,nがdに比べて小さければ,テイラー展開より
1−k/d〜exp(−k/d)
Π(1−k/d)〜exp(−Σk/d)
Σk=n(n−1)/2であるから,
p〜1−exp(−n(n−1)/2d)
となる.
ここで,先ほど説明したペア数の期待値n(n−1)/2dが再登場しているが,ペア数の分布は複雑であっても,その平均は単純であり,この近似計算はペア数の分布を平均n(n−1)/2dのポアソン分布で近似したものと考えることができる.電卓計算にはポアソン近似のほうが向いていて,たとえば,n=23,d=365であれば,p〜0.5000が得られ,真の値0.5073のよい近似となっていることが理解される.
n 20 23 30 40 50
正確な値 0.4114 0.5073 0.7063 0.8912 0.9704
近似値 0.4058 0.5000 0.6963 0.8820 0.9651
===================================