ベンフォードの法則にしたがう数としたがわない数（その１）

■ベンフォードの法則にしたがう数としたがわない数（その１）

整数のベキ乗やフィボナッチ数列はベンフォードの法則にしたがいますが、電話番号のような数は当てはまりません。

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

【１】ベンフォードの法則

　１９３８年，ＧＥの物理学者ベンフォードは対数表の対数表の最初が残りの部分よりもひどく汚れていることに気づき，「１ではじまる数が多いのはなぜか」という問題に説明を与えました．

　先頭の数字がどのような確率で出現するかを考えましょう．単純に各数字（０～９）の出現確率が同じと考えれば，同じ確率１／９で現れるはずですが，実際には１から始まる数値が圧倒的に多く３０％くらいもあります．

　たとえば，簡単な例として，２のベキ乗２^nを順に並べてそれぞれの最大桁の数を取り出すと

　　２，４，８，１６，３２，６４，１２８，２５６，５１２，１０２４，２０４８，・・・

　　→２，４，８，１，３，６，１，２，５，１，２，・・・

となっているのですが，倍にした数が９で始まるためには，その前の数字が４５－４９で始まっていなければなりません．それに対して，５－９で始まる数はどれも倍にすると１で始まる数になります．そして，最大桁がｋ（１≦ｋ≦９）である確率はｎ→∞のとき，

　　ｌｏｇ10（（ｋ＋１）／ｋ）

に収束することが知られています．

　したがって，最大桁の頻度は１が一番高く

　　１→ｌｏｇ10２＝０．３０１０，

以下，

　　２→ｌｏｇ10３／２＝０．１７６１，

　　３→ｌｏｇ10４／３，

　　・・・・・・・・・，

　　９→ｌｏｇ10１０／９＝．０４５８

の順になるというわけです．

　このことは計算尺を見れば１で始まる数が全体の約３０％を占めることとまったく同じで，逆に，９から始まる数値は４．５％程度まで落ちるのです．この現象はベンフォードの法則として知られていますが，実はアメリカの天文学者ニューカムが１８８１年に発見したのが最初ということです．

［補］フィボナッチ数の１０００項までの最高位の数もこの法則に従っていることがわかります．

数　　　　　１　　　２　　　３　　４　　５　　６　　７　　８　　９

頻度　　３０１　１７７　１７７　９６　８０　６７　５６　５３　４５

　フィボナッチ（Fibonacci）数列は，項比が黄金比に近づくという性質がなかに隠されている慨指数関数的増加数列なのですが，黄金比がギリシア文字のφで表されることから，phi-bonacci数列と呼ぶ人さえいます．

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

【２】ベンフォードの法則＝尺度不変性

　１９６１年，数学者ビンカムは「尺度不変性があれば，ベンフォードの法則が成立する」ことを証明しました．尺度不変性（scale invariance）＝パワー則ですが，驚いたことにベンフォードの法則はパワー則の表れ，すなわち，この世界には指数的に増加するものが多いということになります．

　　［参］Havil著，新妻弘監訳「オイラーの定数ガンマ」共立出版

にしたがえば，Ｎ桁の数字までの累積分布をＰ（Ｎ）とすると

　　ｐ（ｋ）＝∫(k,k+1)Ｐ（Ｎ）ｄＮ

と表されるのですが，ベンフォードの法則はＰ（Ｎ）としてベキ指数１のジップ分布

　　Ｐ（Ｎ）～１／Ｎ

を仮定することにより

　　ｐ（ｋ）＝∫(k,k+1)Ｐ（Ｎ）ｄＮ＝ｌｏｇ10（１＋１／ｋ）

と再現できるというのです．

　それでは，最高位から２番目の数の出現頻度はどうなるか調べてみましょう．最高位の数がｋ1，次の位の数がｋ2となる確率は

　　ｌｏｇ10（１＋１／ｋ1ｋ2）

ですから，

　　Σｌｏｇ10（１＋１／ｋiｋ2）

で与えられます．

　最高位から２桁目の数がｋ2である確率は

　　０→０．１１９７，

　　１→０．１１３９，

　　２→０．１０８８，

　　３→０．１０４３，

　　・・・・・・・・・，

　　９→０．０８５０

となって，２桁目に最もよく出てくる数字は０ですが，個々の数字の出現確率にはあまり差がないことがわかかります．（第３の数字の確率はほとんど同じになり，第４桁以下は違いは認められないほどになる．）

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝

【３】ワイルの均等分布定理

　まず，ｌｏｇ10２が無理数であることを証明する．有理数，したがって

　　ｌｏｇ10２＝ｐ／ｑ

と書けると仮定すると

　　ｑｌｏｇ10２＝ｐ→２^q＝１０^p＝２^p・５^p

同じ数について２通りの素因数分解ができることになり矛盾．

　２^Nの最初の桁がのとき，

　　ｄ×１０^n≦２^N＜（ｄ＋１）×１０^n

　　０≦ｌｏｇ10ｄ≦ｌｏｇ10（２^N／１０^n）＜ｌｏｇ10（ｄ＋１）≦１

　　ｎ＝［ｌｏｇ10２^N］

　　ｌｏｇ10ｄ≦［ｌｏｇ10２^N］＜ｌｏｇ10（ｄ＋１）

　ここで，ワイルの均等分布定理

　「任意の無理数αについて，｛ｎα｝＝ｎα－［ｎα］は均等分布する」

より，

　　Ｐ（ｌｏｇ10ｄ≦［ｌｏｇ10２^N］＜ｌｏｇ10（ｄ＋１））＝ｌｏｇ10（ｄ＋１）－ｌｏｇ10ｄ＝ｌｏｇ10（（ｄ＋１）／ｄ）

が得られる．

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝