■反直観公式(補遺7)

 n人のクラスで,誕生日が一致する生徒が1組以上いる確率についての有名な問題である.

 もし,ここに23人の構成員からなる集団があって,この中に誕生日の一致するペアが一組以上いる確率は50%を越える.つまり,サッカーの試合(選手22人と主審1人)ならば2人が同じ誕生日となる確率は50%である.これはコイントスして表が出る確率と同じであり,少なくとも2人同じ誕生日の人がいる確率の大きさ(あるいは構成員数の少なさ)には驚かされる.

 それに対して

[Q]自分の誕生日のパーティーに大勢の人を招待することにする.自分の誕生日がそのうちのひとりと同じのなる確率が50%を超えるには何人招けばよいか?

という問題の答えは253人で,この数は直観的な値365/2=180よりかなり大きい.この構成員数の多さには驚かされる.

 今回のコラムでは,少なくとも1組の同じ誕生日の3人がいる確率を考えてみよう.

===================================

 トリオの場合は,正確な確率を求めることは難しいので,近似計算のほうを最初に掲げておく.ペアの場合の議論と同様,

3人の組合せ数(n,3)はn(n−1)(n−2)/6,

3人が同じ誕生日であることは確率1/d^2で起きるから,その期待値は

  n(n−1)(n−2)/6d^2

となる.したがって,平均n(n−1)(n−2)/6d^2のポアソン分布で近似すると,

  p〜1−exp(−n(n−1)(n−2)/6d^2)

 この近似によれば,同じ誕生日のトリオがいる確率を1/2以上にするためには84人が必要であるが,正確には最低でも88人は必要である.以下,正確な値を得る方法を示すが易しくはない.発想の転換が必要とされる.

 n人の中に同じ誕生日のトリオがいない確率pnは,同じ誕生日のペアがk組(k=0,・・・,n/2)いるが,トリオがいない確率pn,kの和となる.

  pn=Σpn,k

 多項分布により,

  pn,k=Σn!/i1!・・・id!(1/d)^n

であるが,分数の分母のiは2の個数がk,1の個数がn−2k,残りが0であるから,

  pn,k=(d,k)(d−k,n−2k)n!/2^k(1/d)^n

 このことから,漸化式

  pn,k=(n−2k+2)(n−2k+1)/2k(d−n+k)pn,k-1

を得ることができる.求める確率pは1−pnである.

n    60  80  88  100 120

正確な値 0.2072 0.4182 0.5111 0.6459 0.8280

近似値1 0.2265 0.4603 0.5612 0.7029 0.8785

近似値2 0.2043 0.4095 0.4996 0.6305 0.8099

===================================

【まとめ】

 前述の近似値(1)

  p〜1−exp(−n(n−1)(n−2)/6d^2)

の誤差は小さくなく,精度に問題がある.近似値(2)はポアソン近似の改良版であるが,近似値(1)より真の値に接近していることがわかる.その求め方は説明しなかったが,演習問題として残しておくことにする.

[挑戦問題]もし187人の人が同じ部屋の中にいれば,そのなかの4人の誕生日が一致する確率は50%を超えるのだそうである.(無論,4つ子はいない場合である.)

===================================