■ベンフォードの法則のための発見的議論(その4)

【1】ベンフォードの法則

 膨大な数字が並んでいる冊子(例えば会計報告書)には,ランダムに数値が並んでいるように思えますが,意外なことに1ではじまる数が多いというのです.

 先頭の数字がどのような確率で出現するかを考えましょう.単純に各数字(0〜9)の出現確率が同じと考えれば,同じ確率1/9で現れるはずですが,実際には1から始まる数値が圧倒的に多く30%くらいもあります.

 逆に,9から始まる数値は4.5%程度まで落ちるのですが,これはベンフォードの法則

  p(k)=log10((k+1)/k)

として知られる法則です.

===================================

  1→log102=0.3010,

  2→log103/2=0.1761,

  3→log104/3,

  ・・・・・・・・・,

  9→log1010/9=.0458

  [参]松葉育雄「複雑系の数理」朝倉書店

にしたがえば,N桁の数字までの累積分布をP(N)とすると

  p(k)=∫(k,k+1)P(N)dN

と表されるのですが,ベンフォードの法則はP(N)としてベキ指数1のジップ分布

  P(N)〜1/N

を仮定することにより

  p(k)=∫(k,k+1)P(N)dN=log10((k+1)/k)

と再現できるというのです.

===================================

この確率の和が1に等しくなることを示します。

Σlog10((k+1)/k)=log2+log(3/2)+log(4/3)+・・・+log(10/9)

=log10=1

===================================