■測度論(その7)

 先頭の数字がどのような確率で出現するかを考えましょう.単純に各数字(0〜9)の出現確率が同じと考えれば,同じ確率1/9で現れるはずですが,実際には1から始まる数値が圧倒的に多く30%くらいもあります.たとえば,簡単な例として,2のベキ乗2^nを順に並べてそれぞれの最大桁の数を取り出すと

  2,4,8,16,32,64,128,256,512,1024,2048,・・・

  →2,4,8,1,3,6,1,2,5,1,2,・・・

となっているのですが,倍にした数が9で始まるためには,その前の数字が45−49で始まっていなければなりません.それに対して,5−9で始まる数はどれも倍にすると1で始まる数になります.

===================================

【1】ベンフォードの法則

 1938年,GEの物理学者ベンフォードは対数表の対数表の最初が残りの部分よりもひどく汚れていることに気づき,「1ではじまる数が多いのはなぜか」という問題に説明を与えました.

それによるとして,0でない先頭の数字がdになる確率は,n→∞のとき,

    P(d)=log10(1+1/d)

に収束することが知られています.

  d=1→P=0.301   d=6→P=0.067

  d=2→P=0.176   d=7→P=0.058

  d=3→P=0.126   d=8→P=0.051

  d=4→P=0.097   d=9→P=0.046

  d=5→P=0.079

最大桁の頻度は1が一番高く逆に,9から始まる数値は4.5%程度まで落ちるのです.

自然に発生するデータの数値では1で始まる数が多い,すなわち,一様分布するのではないというのがベンフォードの法則(1938年)です.その確率は何と30%にもなるというわけです.0は最上位桁にはなれないので,一様に分布するのであれば1/9=11%のはずですから,はるかに多い割合です.このことは計算尺を見れば1で始まる数が全体の約30%を占めることとまったく同じであることがわかります.

===================================