格子上の確率論（その４）

　前回のコラムでは，３次元立方格子・４次元超立方格子状におけるランダムウォークの数え上げプログラムを利用して，再帰確率を数値的に計算してみました．その際，３次元では最初の２００項まで加算して0.32，４次元では１００項までで0.19という結果が得られました．

ですから，同じ項数で比較すると３次元のほうが収束が遅いことが理解されます．したがって，３次元ランダムウォークの再帰確率の精度を上げるためには，より多くの項数まで計算することが必要です．

を求めてみて適当な項数で計算を打ち切りましたが，初等的な数え上げであっても，時間さえかければもっと精度よく計算できるものと思われます．しかし，計算に時間がかかるので，パソコンを用いたとしても第１０００項（ｕ2000）の計算などは相当に厄介です．

　ところで，前回のコラムに掲げたプログラムでは，アルゴリズムの把握のしやすさを優先させたため，余分な計算時間のかかるプログラムになってしまいました．そこで，今回のテーマとしては，計算所要時間が短くて済むようなものに改良したいと思います．たまにはプログラム演習を試みるのも如何でしょうか．

　項数を増やすことによって，計算所要時間は雪だるま式に急増するため，精度を上げるには１０倍も速い計算方法を考え出さなくてはなりません．そのためには，まず，配列を使った再帰確率の計算プログラムを取り上げます．

　前回のコラムに掲げたプログラムは，あまりにも真正面から馬鹿正直に組んでしまったため，対数計算が二度手間，三度手間になり，効率が悪いのが欠点でした．そこで，あらかじめ，階乗の対数値をメモリに取り込んでおけば，対数計算に要する時間を大幅に節約することができます．以下のプログラムは原型となるプログラムをわずか数カ所変更しただけですが，項数を増やすほど計算速度のアドバンテージが得られますから，改良前に比べて１０倍以上も計算速度が速くなっています．

　３次元酔歩ではｕ2nとΣｕ2nを求めるためには３重のfor･･･nextループ，４次元酔歩では４重のfor･･･nextループが必要になりましたが，２次元酔歩では２重のfor･･･nextループは必要ありません．そのため，３次元・４次元に比べて，１次元・２次元のランダムウォークの数え上げプログラムは格段に易しい問題となります．以下に，配列に用いて正攻法で組んだ１次元・２次元酔歩の数え上げプログラムを掲げます．

　ところで，MS-DOS版のN88BASICでは，配列の大きさはいくらでも大きくできるわけではありません．６４ＫＢの限界値が規定され，そのため，単精度実数型配列の添字の最大値は１６３８３が上限となっています．配列を用いる限り，第２００００項（ｕ40000）の計算は不可能なのです．

を利用することにします．すなわち，ｕ2(n-1)が計算済みであれば，ｕ0＝１から始めて，ｕ2，ｕ4，・・・と次々と計算していけばよいことになります．

　２次元酔歩の場合でも，１次元酔歩と同様の考え方により，ｕ0＝１を初めに求めておいて，後は次々にｕ2，ｕ4，・・・と求めていけばよいのです．

　これらの計算は，漸化関係を使ってデータが入力されるごとに更新しながら求めるものです．精度がよく，データの走査も１回だけですから，計算機向きの数値計算法といえます．以下に計算結果を示しますが，第２００００項まででもあっという間に計算が完了します．なお，この計算は収束せず，いずれ∞に発散してしまいます．

　では，Σ１／（ｉ！ｊ！ｋ！）^2はどうしたらよいのでしょうか？　この部分は芋ヅル式のようにスマートにはいかず，タコ足式のダサイ書式になってしまうのでしょうか．多項分布の周辺度数を固定して計算することになるのですが，この部分も配列を使わないで，漸化式を使うことにこだわって書いてみました．

　漸化式を使ってコーディングする際，いくつかの書式・書法が考えられました．実はもっと技法的に凝って速度優先（記述の冗長さにこだわらないで，少々まどろっこしくても計算速度が速いもの）としたものも考えられたのですが，ここには簡潔であることをモットーにして書いたものを掲げました．漸化式を使ったものとしては，多分これ以上簡潔には書けないものと思われます．

　また，計算速度に関しては配列を利用したプログラムのほうが数倍速いと思われますが，漸化式を利用したプログラムではメモリ制限がないため，より多くの項数まで計算するのに向いています．

　１歩あたりεだけ移動する１次元酔歩では，ｎステップにおける位置ｘnの平均と分散は，２項分布より，

で与えられますが，ド・モアブル=ラプラスの定理から，ｎ回のステップののち，その人がｘ＝ｋのところにいる確率は，ｎを十分大にすると平均０，分散σ2=ｎの正規分布Ｎ（０，ｎ）に近づくことを示しています．したがって，原点からの距離が√ｎの領域内に納まる確率は６８．３％，２√ｎの領域内に納まる確率は９５．４％と計算されます．

　１次元酔歩が√ｎの領域に入っていることが示されましたが，これは拡散現象では一般的にいえることです．ｄ次元酔歩が互いに独立な１次元酔歩ｄ個から構成されると考えると，ｎステップののち，

ですから，原点（０，０，，・・・，０）を中心として拡散し，原点からの距離が√ｎの領域内に納まると考えられます．

　格子上のランダムウォークは，ブラウン運動などの拡散モデルとしてよく知られていますが，格子のモデルはブラウン運動の離散化とみなすことができるので，局所的にみると離散的過程であっても，大域的にみると連続空間に分布した連続的なガウス分布とみることができます．

　ここで，Ｘはデータベクトル，μは平均ベクトル，Σはｄ×ｄ次の分散共分散行列を指しますが，具体的に書くと，周辺分布がともに平均０，分散σ2の正規分布となる２次元正規分布は

　多重ガウス積分は不完全ガンマ関数とになることから，原点からの距離がλ＝√ｎの超球内に納まる確率は自由度ｄのχ2分布で与えられることが計算されます．（この詳細についてはコラム「ｎ次元楕円の陰と影」を参照願います．）

　それによると，２次元酔歩の場合，自由度２のχ2分布はすなわち指数分布ですから，全体のｐ％がその内側に入るような超球の半径ｃは

　例えば，ｃ＝λのときｐ＝０．３９４，ｃ＝２λのときｐ＝０．８６５となり，半径が２λの円を描くとその内側には８６．５％が含まれることになります．これらは，それぞれ１辺が２λ，４λの正方形の内側に入る確率，