■ベンフォードの法則のための発見的議論(その4)
【1】ベンフォードの法則
膨大な数字が並んでいる冊子(例えば会計報告書)には,ランダムに数値が並んでいるように思えますが,意外なことに1ではじまる数が多いというのです.
先頭の数字がどのような確率で出現するかを考えましょう.単純に各数字(0〜9)の出現確率が同じと考えれば,同じ確率1/9で現れるはずですが,実際には1から始まる数値が圧倒的に多く30%くらいもあります.
逆に,9から始まる数値は4.5%程度まで落ちるのですが,これはベンフォードの法則
p(k)=log10((k+1)/k)
として知られる法則です.
===================================
1→log102=0.3010,
2→log103/2=0.1761,
3→log104/3,
・・・・・・・・・,
9→log1010/9=.0458
[参]松葉育雄「複雑系の数理」朝倉書店
にしたがえば,N桁の数字までの累積分布をP(N)とすると
p(k)=∫(k,k+1)P(N)dN
と表されるのですが,ベンフォードの法則はP(N)としてベキ指数1のジップ分布
P(N)〜1/N
を仮定することにより
p(k)=∫(k,k+1)P(N)dN=log10((k+1)/k)
と再現できるというのです.
===================================
この確率の和が1に等しくなることを示します。
Σlog10((k+1)/k)=log2+log(3/2)+log(4/3)+・・・+log(10/9)
=log10=1
===================================