コラム
「ポアソン配置とワイブル分布(雑然か整然か)」
「最近接距離分布(ウィグナー分布)」
では,直線上,平面上または空間中に無作為に配置(ポアソン配置)した点の集団があるとして,ある点からその最も近い点(最近接点:nearest neighbor)に至るまでの距離rの分布を考えた.その結果,任意の次元における最近接点間の距離の分布はワイブル分布になることが一般的な形で誘導された.
それでは,n−1次元球面Sn-1上にポアソン配置した点の集団があるとき,最近接距離分布はどうなるのだろうか? 今回のコラムでは球面上の最近接球面距離分布について導出を試みたい.
===================================
【1】球帽の面積
Sn-1球面上の2点x,yに対して,θ=∠xoyを球面距離という.また,球面上の円を球帽という.ここでは点Pからの球面距離がθ(0≦θ≦π)であるような球面上の点全体の集合を考えるが,球面半径θの球帽の面積をC(θ)で表すことにする.
球面上の最近接球面距離分布を導出するために,まず最初に球帽の面積C(θ)を求めてみることにする.
(1)n=2のとき,C(θ)=2θ
(2)n=3のとき,y=f(x)>0のグラフをx軸を中心に回転させてできる曲面の面積は
S[y]=2π∫y(1+(y')^2)^1/2dx
で与えられる.y=(1-x^2)^(1/2)とおくと
C[θ]=2π∫(cosθ,1)dx=2π(1-cosθ)
(3)n>3のとき
n>3は簡単には求められないが,x=(x1,x2,・・・,xn)を単位球面Sn-1上で一様分布する点とすると,xn^2の分布はベータ分布Beta(1/2,(n-1)/2)となることが証明されている.→コラム「高次元のパラドックスとスターリングの公式(その2)」参照
そこで,Sn-1球面の極(0,・・・,0,1)の周りに球面半径θの球帽を設けて,ここに含まれる確率を求めてみることにする.すなわち
P{x<Sn-1:cosθ≦xn≦1}
=1/2P{x<Sn-1:(cosθ)^2≦xn^2≦1}
=1/2(1−P{x<Sn-1:0≦xn^2≦(cosθ)^2})
ベータ分布の確率密度関数は
f(x)=x^(p-1)(1−x)^(q-1)/Β(p,q)
であるが,その分布関数は不完全ベータ関数と密接に関係していて,ガウスの超幾何関数2F1を使って以下のように表現される.
F(x)=1/px^p2F1(p,1-q,p+1,x)/Β(p,q)
=1/px^p(1−x)^q2F1(p+q,1,p+1,x)/Β(p,q)
P{x<Sn-1:0≦xn^2≦(cosθ)^2}=F((cosθ)^2)
であるから
C(θ)=(Sn-1の面積)×(1−F((cosθ)^2))/2
と求められる.
球に相当するn次元の図形を超球と呼ぶ.n次元単位超球{x1^2+x2^2+・・・+xn^2≦1}の体積をvnとすると,単位超球の表面積sn-1はnvnとなる.ただし,
vn=π^(n/2)/Γ(n/2+1)
n Vn n Vn n Vn
1 2 6 5.168 11 1.884
2 3.142 7 4.725 12 1.335
3 4.189 8 4.059 13 0.911
4 4.934 9 3.299 14 0.599
5 5.264 10 2.550
なお,超球の体積はn=5のとき最大であり,nが大きくなると急激に0に近づく.しかもそれは直径を1辺とする超立方体と比べて無視できるほど小さくなる.nvnが最大になるのはn=7のときである(16π^3/15).
したがって,
C(θ)=nvn(1−F((cosθ)^2))/2
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
p=1/2,q=(n-1)/2であるから,ベータ分布の確率密度関数と分布関数は
f(x)=x^(-1/2)(1−x)^((n-3)/2)/Β(1/2,(n-1)/2)
F(x)=2x^(1/2)(1−x)^((n-1)/2)q2F1(n/2,1,3/2,x)/Β(1/2,(n-1)/2)
とくに
(1)n=2のとき,ベータ分布は逆正弦分布
f(x)=1/π・{x(1-x)}^(1/2)
で,U字型の形状をとる.対応する累積分布関数は
F(x)=2/π・arcsin(x^(1/2))
となるから,
F((cosθ)^2)=1−2θ/π
より
C(θ)=2θ
(2)n=3のとき,ベータ分布はベキ乗分布
f(x)=1/2・x^(-1/2)
でJ字型分布となる.分布関数は
F(x)=x^(1/2)
であるから
F((cosθ)^2)=cosθ
より
C(θ)=2π(1−cosθ)
となって前述の式に一致する.
(3)n>3のとき,C(θ)を簡潔な形に表すことはできない.
===================================
【2】球面距離の分布関数と確率密度関数
C(θ)/(Sn-1の面積)=C(θ)/nvnはθの分布関数であるから,θで微分すると,球面距離θの確率密度関数が得られる.
(1)n=2のとき,C(θ)=2θ
θの分布関数:θ/π
θの確率密度関数:1/π
θの平均値:∫(0,π)θ/πdθ=π/2
(2)n=3のとき,C(θ)=2π(1−cosθ)
θの分布関数:(1−cosθ)/2
θの確率密度関数:sinθ/2
θの平均値:∫(0,π)θsinθ/2dθ=π/2
(3)n>3のとき,C(θ)=nvn(1−F((cosθ)^2))/2
θの分布関数:(1−F((cosθ)^2))/2
θの確率密度関数:(sinθ)^(n-2)/Β(1/2,(n-1)/2)
θの平均値:∫(0,π)θ(sinθ)^(n-2)dθ/Β(1/2,(n-1)/2)=π/2
[参]1/2B(p,q)=∫(0,π/2)(sinθ)^(2p-1)(cosθ)^(2q-1)dθ
∫(0,π/2)(sinθ)^(n-2)dθ=1/2B((n-1)/2),1/2)
===================================
【3】最近接球面距離分布
ここからが本題である.球面上のランダム点配置の最近接距離分布を求めてみることにするが,基本的な考え方は平面上での議論と同様になる.
球面上にポアソン配置した点の集団があるとして,この点の密度をδとすると,面積sの図形の中に落ちる点の数の期待値λは
λ=sδ
で与えられる.
仮定により,面積sの図形の中に落ちる点の数xは,平均λ=sδのポアソン分布に従う(あるいは近似できる)から,
B(x)=(sδ)^x/x!exp(-sδ) x=0,1,2,・・・
と書くことができる.
さて,任意の1点をとったとき,最近接点に至るまでの球面距離をθ,そしてθとθ+dθの間に落ちる確率をp(θ)dθとし,この確率を求めてみよう.このとき,2つの条件
1)ある点から球面半径θの球帽内には全く他の点が存在しない
2)ある点を中心として球面半径θとθ+dθの球帽で区切られた微小な環状面積に少なくとも1個の点が存在する
を満足させる必要がある.
条件1)からはs=C(θ),x=0とおいて,
B(0)=exp(-C(θ)δ)
条件2)からはs=C’(θ)dθとおいて,この面積中に1個も落ちない確率B(0)を1から引けばよいから,
1−B(0)=1−exp(-C’(θ)δdθ)〜C’(θ)δdθ
条件1)2)とも満たす確率は両者の積で与えられるから,
p(θ)dθ=C’(θ)δexp(-C(θ)δ)dθ
すなわち,最近接球面距離分布は
p(θ)=C’(θ)δexp(-C(θ)δ)
となり,ワイブル分布と同様,指数分布の族に属する分布であることがわかる.
また,
∫(0,π)p(θ)dθ=exp(-C(0)δ)−exp(-C(π)δ)
=1−exp(-nvnδ)=C
とおくと,関数p(θ)/Cは全体の面積を1とした規格化が行われる.p(θ)/Cは積分すると1になる関数であるから,確率密度関数となる条件を満たすことになる.
p(θ)/Cを改めて
p(θ)=C’(θ)δexp(-C(θ)δ)/(1−exp(-nvnδ))
とおくことにするが,このとき,球面距離θの分布関数P(θ),平均値θmと分散θvは
P(θ)=∫(0,θ)p(t)dt
=(1−exp(-C(θ)δ))/(1−exp(-nvnδ))
θm=∫(0,π)θp(θ)dθ
θv=∫(0,π)(θ−θm)^2p(θ)dθ
で与えられることになる.
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
C(θ)=nvn(1−F((cosθ)^2))/2
をθで微分して
C’(θ)=nvnf((cosθ)^2)cosθsinθ
したがって,最近接球面距離分布は
p(θ)=C’(θ)δexp(-C(θ)δ)/(1-exp(-nvnδ))
=nvnδf((cosθ)^2)cosθsinθexp(-nvnδ(1-F((cosθ)^2))/2)/(1-exp(-nvnδ))
P(θ)=(1−exp(-nvnδ(1-F((cosθ)^2)/2))/(1−exp(-nvnδ))
ただし,0≦θ≦π
f(x)=x^(-1/2)(1−x)^((n-3)/2)/Β(1/2,(n-1)/2)
F(x)=2x^(1/2)(1−x)^((n-1)/2)q2F1(n/2,1,3/2,x)/Β(1/2,(n-1)/2)
とくに
(1)n=2のとき
C(θ)=2θ
C’(θ)=2
p(θ)=2δexp(-2δθ)/(1-exp(-2πδ))
P(θ)=(1-exp(-2δθ))/(1-exp(-2πδ))
これより,円(1次元球面)における最近接点間の球面距離の分布は切断指数分布(truncated exponential distribution)になることがわかる.
(2)n=3のとき
C[θ]=2π∫(cosθ,1)dx=2π(1-cosθ)
C'[θ]=2πsinθ
p(θ)=2πδsinθexp(-2πδ(1-cosθ))/(1-exp(-4πδ))
P(θ)=(1-exp(-2πδ(1-cosθ))/(1-exp(-4πδ))
−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−
nvnδ,すなわち(表面積)×(密度)=Nとおくと,Nは球面上にポアソン配置した点の総数と考えることができる.
(1)n=2のとき,
p(θ)=N/πexp(-N/πθ)/(1-exp(-N))
P(θ)=N/πexp(-N/πθ)/(1-exp(-N))
(2)n=3のとき,
p(θ)=Nsinθ/2exp(-N(1-cosθ)/2)/(1-exp(-N))
P(θ)=(1-exp(-N(1-cosθ)/2))/(1-exp(-N))
(3)n>3のとき,
p(θ)=Nf((cosθ)^2)cosθsinθexp(-N(1-F((cosθ)^2))/2)/(1-exp(-N))
P(θ)=(1-exp(-N(1-F((cosθ)^2))/2))/(1-exp(-N))
===================================
【4】内積の分布
これまでの議論で,X=xn^2=(cosθ)^2の密度関数がベータ分布Beta(1/2,(n-1)/2)にしたがうこと,すなわち,
f(x)dx=x^(-1/2)(1−x)^((n-3)/2)/B(1/2,(n-1)/2)dx
はすでに述べたとおりであるが,(cosθ)^2の分布を介してθの分布が導出されたことになる.
Sn-1球面上の任意の2点x,yのうち,点yは極(0,・・・,0,1)として差し支えない.点x=(x1,x2,・・・,xn)の極(0,・・・,0,1)からの球面距離をθとすると,ベクトルx,yの内積は
x・y=xn=cosθ
それではX=xn^2=(cosθ)^2の密度関数がベータ分布Beta(1/2,(n-1)/2)にしたがうとき,内積:Y=xn=cosθの分布はどうなるのだろうか? ベータ分布に従う確率変数の平方根の分布ということになるが,確率変数を変数変換した関数の分布は簡単に求めることができる.
f(x)dx=x^(-1/2)(1−x)^((n-3)/2)/B(1/2,(n-1)/2)dx
において,x=y^2とおくとdx=2ydy
g(y)dy=2(1−y^2)^((n-3)/2)/B(1/2,(n-1)/2)dy
また,x=y^2の逆関数は単調増加関数ではなく,2価関数であることに注意すると,
P{x<Sn-1:cosθ≦xn≦1}=1/2P{x<Sn-1:(cosθ)^2≦xn^2≦1}
より,密度関数
g(y)=(1−y^2)^((n-3)/2)/B(1/2,(n-1)/2)
−1≦y≦1,g(−y)=g(y)
が得られる.
分布関数G(y)は,
G(y)=1−∫(y,1)g(y)dy
y=cosθとおくと
G(y)=1−∫(0,arccosθ)(sint)^(n-2)dt/B(1/2,(n-1)/2)
となる.
===================================