■0^0は不定形である(その2)

  「コーシー分布の平均値は不定形である」

[補]コーシー分布の密度曲線は,古くから知られている幾何学曲線(x^2y=c^2(c-y))と同一で,山形をしています.この曲線は「変曲点をもつ曲線」の誤訳から以降「アグネシの魔女(witch of Agnesi)」と別名でよばれるようになった割合有名な曲線です.witchから迂弛線(うちせん)ともよばれますが,最近はこのような古めかしい呼び方は多分しないと思います.

===================================

【1】平均・分散のない分布

 トリッキーに思われるかもしれませんが,母平均や母分散は常に存在するとは限りません.たとえば,

  f(x)=1/π(1+x^2) -∞<x<∞

を取り上げてみましょう.この関数は∫f(x)dx=1/π[tan-1(x)]=1ですから確かに確率分布(コーシー分布)です.しかし,この確率分布は偶関数だから平均は0であると単純に考えてはいけません.0は中央値ではあっても,この分布は平均をもたないのです.

 実際,∫xf(x)dxのリーマン積分は1/π*1/2log(1+x2)であり,積分∫xf(x)dxは不定形∞−∞となるから定義されません.平均値が定義されないならば,もちろん,分散も定義されないということになります.

 コーシー確率変数が平均値0をもつという命題は,確率論の観点からすると,コーシー分布に対しても中心極限定理が成立することになり,正しくないだけでなく危険でもあります.繰り返しになりますが重要なことですので,もう少し考察してみましょう.

 コーシー分布では,グラフの対称性からその平均値が0であると定義するのは自然と思えます.実際,対称性を利用して有限区間を無限区間まで拡張して考えると,その値は0となります.

  lim(a→∞)∫(-a,a)xf(x)dx=0

このことから,いかなる平均値ももたないと主張することのほうが大袈裟だと思われるかもしれません.しかし,リーマン積分では,a,bを独立に無限大としたときの極限値

  lim(a→-∞,b→∞)∫(a,b)xf(x)dx

が収束することを要請しているのであって,この値は不定形∞−∞となるから発散すなわち平均は存在しないと考えるのです.

−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−

 コーシー分布以外の確率分布では,レヴィ分布(ブラウンノイズ関数)

  f(x)=1/√(2π)x^(-3/2)exp(-1/2x)

アノン分布

  f(x)=(1-cosx)/πx^2 -∞<x<∞

も平均値をもたない分布として知られています.

 また,離散分布でも平均値の存在しない確率分布があり,たとえば,

  p(x)=6/π^2x^2 (x=1,2,3,・・・)

の平均値は

  6/π^2(1/1+1/2+1/3+・・・)

調和級数となるため,無限大に発散してしまいます.

 なお,離散型・連続型以外の特異型分布関数もあり,たとえば,カントル階段関数は特異型分布関数の1例です.特異分布に対してはルベーグ積分の概念が必要になることもあります.ここではその種の議論を必要としないので,さしあたってリーマン積分で十分であろうと思われますが,実用上用いられる密度関数は連続関数であり,ルベーグ積分とリーマン積分は一致します.したがって,コーシー分布やブラウンノイズ関数に対してはルベーグ積分であってもうまくいかないことを申し添えておきます.

===================================

【2】コーシー分布

  f(x)=1/π・β/(β^2+(x−α)^2)

その累積分布関数は

  ∫f(x)dx=1/π・[arctan(x−α)/β]=1/2+1/πarctan(x)

となります.平均・分散は存在せず,mode=α,median=α.

 コーシー分布は光の分散と関係して導出された,歴史的背景が興味深いもの分布です.任意の点に垂直軸のまわりを水平に回転できるような銃を固定し,−π/2≦θ≦π/2の範囲の任意に選ばれた角度で固定した壁に向けて発砲するとき,発砲角度が一様分布にしたがえば銃弾の命中点の分布は上式で表されます.そのため,コーシー分布は,種々の放射線の線スペクトルの強度分布など共鳴現象を表わすのにしばしば用いられていて,原子核物理の分野では,ローレンツ分布ともブライト・ウィグナー分布とも呼ばれます.

 コーシー分布は正規分布と同じような山型の分布をして,一見,正規分布と似ていますが,数学的にははなはだ異なった性質を示し,コーシー分布は平均さえもたないのに対し,正規分布はすべての次数の積率をもっているという違いがあります.

 また,正規分布は頂点が丸くて裾の減退が速いのに対し,コーシー分布は頂点が鋭くて分布の両すそが正規分布に比べかなり長く,中心から遠くまで広がっています.すなわち,コーシー分布はいわゆる裾の重い(heavy tailed)分布で,大きい(小さい)値をとる確率がなかなか0に近づかず,累積分布関数より[α−β,α+β],[α−2β,α+2β],[α−3β,α+3β]の外の値はなんと50%,30%(0.2952),20%(0.2048)も観察されることがわかります.

 一方,正規分布では[μ−σ,μ+σ],[μ−2σ,μ+2σ],[μ−3σ,μ+3σ]の外の値が観測されるのは32.7%,5%(0.0455),0.3%(0.0027)ですから,正規分布はxの絶対値が大になるにつれて指数関数的減衰するのに対し,コーシー分布は代数関数的に減衰する分布関数で,逆にいうと,代数関数的減衰に比較して指数関数的減衰がいかに急減であるかがよくわかります.

(特性)

[1]平均や分散をもたない確率分布!

 コーシー分布はt分布において自由度1としたものであり,平均値は定まらず分散が無限大になる厄介な分布です.なぜなら,対応する積分が発散するからです.したがって,コーシー分布は中央値と4分位偏差(第3四分位数Q3 と第1四分位数Q1 の差)で特徴づけられます.コーシー分布の分散は発散しますが,4分位偏差のように存在の保証された分布の幅の測度sで置き換えると

  s=s1+s2

が成り立ちます.

[2]中心極限定理が成立しない分布

 コーシー分布にしたがう確率変数の線形結合Σaxはコーシー分布になります.また,確率変数がコーシー分布に従うとき,その標本分布も再びコーシー布に従うため,何回測定を繰り返したとしても,標本平均値の分散は無限大で標本平均値の精度は少しもよくなりません.

 このように,コーシー分布はいくつかのパラドックスの源泉になっていて,しばしば,たちの悪い分布の代表として用いられます.さらに次のような性質ももっています.

[3]正規分布する確率変数同士の商の分布

 F分布はχ^2分布の比の分布となりますが,自由度1のχ^2分布の比の平方根分布は半コーシー分布,したがって,正規分布する確率変数同士の商の分布はコーシー分布になることが示されます.

[4]コーシー確率変数の逆数もコーシー分布

  α→α/(α^2+β^2),β→β/(α^2+β^2)

[5]コーシー乱数発生法

rを区間(0,1)の一様乱数とするとtan(π(r-1/2))は標準コーシー分布に従います.

===================================