■反直観公式(補遺7)
n人のクラスで,誕生日が一致する生徒が1組以上いる確率についての有名な問題である.
もし,ここに23人の構成員からなる集団があって,この中に誕生日の一致するペアが一組以上いる確率は50%を越える.つまり,サッカーの試合(選手22人と主審1人)ならば2人が同じ誕生日となる確率は50%である.これはコイントスして表が出る確率と同じであり,少なくとも2人同じ誕生日の人がいる確率の大きさ(あるいは構成員数の少なさ)には驚かされる.
それに対して
[Q]自分の誕生日のパーティーに大勢の人を招待することにする.自分の誕生日がそのうちのひとりと同じのなる確率が50%を超えるには何人招けばよいか?
という問題の答えは253人で,この数は直観的な値365/2=180よりかなり大きい.この構成員数の多さには驚かされる.
今回のコラムでは,少なくとも1組の同じ誕生日の3人がいる確率を考えてみよう.
===================================
トリオの場合は,正確な確率を求めることは難しいので,近似計算のほうを最初に掲げておく.ペアの場合の議論と同様,
3人の組合せ数(n,3)はn(n−1)(n−2)/6,
3人が同じ誕生日であることは確率1/d^2で起きるから,その期待値は
n(n−1)(n−2)/6d^2
となる.したがって,平均n(n−1)(n−2)/6d^2のポアソン分布で近似すると,
p〜1−exp(−n(n−1)(n−2)/6d^2)
この近似によれば,同じ誕生日のトリオがいる確率を1/2以上にするためには84人が必要であるが,正確には最低でも88人は必要である.以下,正確な値を得る方法を示すが易しくはない.発想の転換が必要とされる.
n人の中に同じ誕生日のトリオがいない確率pnは,同じ誕生日のペアがk組(k=0,・・・,n/2)いるが,トリオがいない確率pn,kの和となる.
pn=Σpn,k
多項分布により,
pn,k=Σn!/i1!・・・id!(1/d)^n
であるが,分数の分母のiは2の個数がk,1の個数がn−2k,残りが0であるから,
pn,k=(d,k)(d−k,n−2k)n!/2^k(1/d)^n
このことから,漸化式
pn,k=(n−2k+2)(n−2k+1)/2k(d−n+k)pn,k-1
を得ることができる.求める確率pは1−pnである.
n 60 80 88 100 120
正確な値 0.2072 0.4182 0.5111 0.6459 0.8280
近似値1 0.2265 0.4603 0.5612 0.7029 0.8785
近似値2 0.2043 0.4095 0.4996 0.6305 0.8099
===================================
【まとめ】
前述の近似値(1)
p〜1−exp(−n(n−1)(n−2)/6d^2)
の誤差は小さくなく,精度に問題がある.近似値(2)はポアソン近似の改良版であるが,近似値(1)より真の値に接近していることがわかる.その求め方は説明しなかったが,演習問題として残しておくことにする.
[挑戦問題]もし187人の人が同じ部屋の中にいれば,そのなかの4人の誕生日が一致する確率は50%を超えるのだそうである.(無論,4つ子はいない場合である.)
===================================