■ガウス関数+ローレンツ関数=フォークト関数

 
 左右対称の連続型確率分布というと,正規分布,コーシー分布,t分布,ロジスティック分布,両側指数分布(ラプラス分布)などがあげられますが,これらはそれぞれ異なった統計的意味と物理的意味をもっています.また,統計的性質に関していえば,正規分布が非常に扱いやすい性質をもっているのに対して,コーシー分布はしばしばたちの悪い分布の代表として用いられます.
 
 ところで,X線,γ線などの電磁波はそれぞれの線スペクトルに固有の幅と分布をもっていて,光の線スペクトルのようなコーシー分布を示すものを分光器で測定したとすると,分光器には固有の分解能があり,それは正規分布で近似できることが多いわけですから,測定したスペクトルの分布はコーシー分布と正規分布を合成したものになります.
 
 そこで,今回のテーマとしては,ガウス関数(Gaussian,正規分布):
  f(x)=1/√2πσexp(-(x-μ)^2/2σ^2)
とローレンツ関数(Lorentzian,コーシー分布):
  g(x)=1/π・β/(β^2+(x-α)^2)
の畳み込み(convolution):
  h(z)=∫(-∞,∞)f(z-y)g(y)dy
    =∫(-∞,∞)g(z-x)f(x)dx
    =1/πσ∫(0,∞)exp(-t^2/2-βt/σ)cos{(α+μ-z)/σt}dt
を取り上げることにしました.
 
 この関数はフォークト関数(Voigt)と呼ばれ,分光学の分野では,実測のスペクトルデータを curve fitting するときにもっぱら使われるます.しかし,フォークト関数の密度関数は積分関数を含んでおり,このままでは実際のスペクトル線の信号解析が困難です.
 
 この件に関しては,東北大学大学院薬学研究科・生物構造化学分野の外山 聡先生より情報が寄せられ,
  (1)計算時間を短くするためには複素誤差関数の級数展開で近似値を得る必要があるが,精度の点で問題があること,
  (2)実験データとのカーブフィットを行う際,関数の微分(Jacobian行列)を求めると都合がよいのであるが,Voigt関数の微分が簡単には求められないので,数値微分することになるが,それでは精度がでないこと,
  (3)また,Voigt関数の積分を求めたい場合も数値積分によらなければならないこと,
等々,問題点を窺い知ることができました.
 
 これらの点を解決すべく,精度が高く計算時間が短くてなおかつコーディングしやすい方法がないかと探したり考えたりしてみて,超幾何関数に行き当たったのですが,・・・.
 
 試行錯誤編は次回に譲り,今回のコラムではスペクトル解析の背景にある基本的な事柄について解説することにします.
 
===================================
 
【1】確率変数の和の分布
 
 x,yが独立な確率変数でそれぞれ確率密度関数f(x),g(y)をもつとします.このとき,z=x+yの確率密度関数h(z)を求めてみましょう.
 
 形式的ではありますが,z=x+y,w=y(x=z-w,y=w)と変数変換して,(x,y)平面から(z,w)平面の1対1写像を考えてみると,そのヤコビアンは
  J=∂(x,y)/∂(z,w)=|∂x/∂z,∂x/∂w|=|1,-1|=1
           |∂y/∂z,∂y/∂w| |0, 1|
で与えられます.
 
 したがって,
  dxdy=∂(x,y)/∂(z,w)dzdw
となり,(z,w)の同時確率密度関数p(z,w)は
  p(z,w)dzdw=f(x)g(y)dxdy=f(z-w)g(w)∂(x,y)/∂(z,w)dzdw
これより,
  p(z,w)=f(z-w)g(w)
が求める同時確率密度関数となります.
 
 zの確率密度関数は,その周辺分布として与えられますから
  h(z)=∫(-∞,∞)f(z-y)g(y)dy
となります.このhをfとgのたたみ込みまたは合成積(convolution)といい,h(z)=f*g(z)と書きます.まったく同様に
  h(z)=∫(-∞,∞)g(z-x)f(x)dx
ですから,h(z)=g*f(z).
 
 すなわち,たたみ込みでは交換法則が成り立ちます.たたみ込みの積分計算は難しくなることがありますが,その場合には掛ける順序を入れ替えて計算すると簡単になります.
 
 また,h(z)の累積分布関数H(z)は
  H(z)=∫(-∞,z)h(z)dz
    =∫(-∞,∞)g(y)dy∫(-∞,z)f(z-x)dz
    =∫(-∞,∞)g(y)dy∫(-∞,z-y)f(x)dx
    =∫(-∞,z)F(z-x)dG(y)
と表されます.ここで,dG(y)=g(y)dyの関係を利用しました.この場合も,
  H(z)=F*G(z)=G*F(z)
が成り立つことが容易にわかります.
 
(例題)
 x1,x2,・・・,xnが正規分布N(μ,σ^2)にしたがうとき,y=Σxの分布を求めたい.
 
 まず,y=x1+x2の密度関数はf(x)=1/√2πσexp{-(x-μ)^2/2σ^2}ですから
  h(y)=f(x1)*f(x2)=∫(-∞,∞)f(y-x)f(x)dx
    =1/2πσ^2∫(-∞,∞)exp(-Q/2σ2)dx
 ここで,
Q=(y-x-μ)^2+(x-μ)^2
 =2x^2-2yx+(y-μ)^2+μ^2
 =2(x-y/2)^2-1/2y^2+(y-μ)^2+μ^2
 =2(x-y/2)^2+1/2(y-2μ)^2
より
 h(y)=1/2πσ^2exp{-1/4σ^2(y-2μ)^2}∫(-∞,∞)exp(-(x-y/2)^2/σ^2)dx
   =1/√(2π)√(2)σexp{-1/4σ^2(y-2μ)^2}
となります.これは正規分布N(2μ,2σ2)に従うことがわかります.
 
 さらに,「n個の独立な確率変数の和z=x1+x2+・・・+xnの確率密度関数はn回畳み込みh(z)=f(x1)*f(x2)*・・・*f(xn)である.」から,実際に畳込みを繰り返すことによってy=Σxの分布は正規分布N(nμ,nσ2)となることが理解されます.すなわち,正規分布の和の分布は再び正規分布となりますが,これを正規分布の再生性といいます.
 
 また,このことより,正規分布する母集団から得られた標本平均x=Σxi/nの分布は正規分布N(μ,σ2/n)であることも理解されます.
 
(例題)
 さらに,x1,x2,・・・,xnが標準正規分布にしたがう独立な確率変数とすると,y=Σx2=snの分布は自由度1のχ2分布の確率密度関数をもとに
  Sn=Sn-1+xn^2
として,畳込み
  Tn*T1=Tn+1
を繰り返すことで帰納的に求められ,
  p(y)=2^(-n/2)/Γ(n/2)y^(n/2-1)exp(-y/2)
となります.これは自由度nのχ2分布の確率密度関数です.
 
(例題)
 同様に,指数分布f(x)=λexp(-λ)のn回合成積はアーラン分布となることも帰納法で示すことができます.
  f1(x)=λexp(-λ)
  f2(x)=∫(0,x)f1(x-t)f1(t)dt=λ2xexp(-λx)
  f3(x)=∫(0,x)f2(x-t)f1(t)dt=λ3x^2/2exp(-λx)
  ・・・・・・・・・・・・・・・・・・・・・・・・
  f10(x)=∫(0,x)f9(x-t)f1(t)dt=λ10x^9/9!exp(-λx)
 
 なお,自由度2のχ^2分布は指数分布となり,さらにまたχ^2分布もアーラン分布もガンマ分布の1種です.
 
===================================
 
【補】無限分解可能な分布
 
 以上により,独立な確率変数の和の分布は,合成積で与えられることがわかりましたが,合成積は無限分解可能な分布(infinitely divisible distribution)という概念を与えてくれます.すなわち,例題のごとく,すべてのnに対して,ある分布からの大きさnの標本の和として表される分布を無限分解可能といいます.
 
  fn(x)=f1(x)*・・・*f1(x)(n個の合成積)
 
 なお,特性関数を用いると
  φ(t)=[φn(t)]^n
となるφn(t)が存在する分布が無限分解可能な分布です.無限分解可能な連続分布には,正規分布,コーシー分布,ガンマ分布などがあります.
 
【補】確率変数の差・積・商の分布
 
 一般に,分布のたたみ込みは
  p*q(x)=∫(-∞,∞)p(x-t)q(t)dt
として定義されますが,これは確率変数の和の分布に対応しています.それでは差・積・商の分布はどのようにして求めたらよいのでしょうか?
 
 差の分布のヤコビアンはz=x-y,w=y(x=z+w,y=w)より
  J=∂(x,y)/∂(z,w)=|∂x/∂z,∂x/∂w|=|1,1|=1
           |∂y/∂z,∂y/∂w| |0,1|
 したがって,差の分布は
  h(z)=∫(-∞,∞)f(z+y)g(y)dy
と表されます.
 
 商の分布では,z=x/y,w=y,すなわち,x=z*w,y=wよりヤコビアンは
  J=∂(x,y)/∂(z,w)=|w,z|=w
           |0,1|
 従って,
  p(z,w)=f(z*w)g(w)J=f(z*w)g(w)w
となることがわかります.積の分布のヤコビアンについては演習問題とします.
 
===================================
 
【2】正規分布
 
  f(x)=1/√2πσexp(-(x-μ)^2/2σ^2)
 
 年齢を固定したときの人間の身長の分布など,連続な値をとる測定値に対してヒストグラムを作成したときには単峰性で左右対称な形になることが多いのですが,その場合,ヒストグラムにあてはまる関数として上式がよく想定されます.この式は正規分布の確率密度関数と呼ばれます.
 
 正規分布はガウス分布とも呼ばれ,歴史的にはド・モアブルが誤差のモデルとして導き,のちにラプラスとガウスが最小2乗法との関連で,それぞれ同じ曲線を再発見したといわれています.また,観測値の誤差が小さな多数の誤差の素から成り立っているという考え方を最初に示したのは,ヤングであるといわれていますが,ヤングのあとハーゲンらはこの考え方を基礎にして,正規分布をたくさんの微小量がランダムに組み合わさったときに現れる一般的な誤差の分布関数として導きだしました(ハーゲンのモデル).
 
 測定値は近似的に正規分布にしたがうと仮定されていますが,実際の測定結果は必ずしも正規分布にしたがうものではありません.しかしながら,母集団が正規分布でないときであっても,中心極限定理により,標本平均値の分布は測定回数が増えるにつれて正規分布に近づきます.中心極限定理は正規分布のもつ重要性を物語っていて,正規分布は数理統計学,誤差論などの分野で最も重要な分布とみなされ,卓越した地位を占めるにいたっているのです.
 
[形状]
 
 母平均がμ,母分散がσ^2の正規分布はN(μ,σ^2)と書き表わされますが,μを位置母数,σを尺度母数として左右対称で左右に長くすそをひく釣り鐘型の分布曲線になります.そのグラフは山の高さがσに反比例して小さくなり,山の裾がσに比例して広がります.本質的な意味での形状母数に相当するものはありません.
 
 静かな水面にインクを一滴たらすとインクで染められた部分がどんどん拡散していきますが,この濃度分布は正規分布においてσ^2を時間tに置換した式になっていて,この分布はインク分子が一定時間内に移動する距離の確率分布としても用いられます.すなわち,典型的な拡散過程では,時刻tには初期値から√tのオーダー離れた場所にいることを示しています.
 
 また,
  f'(x)=(-(x-μ)/σ^2)f(x)
  f"(x)=-1/σ^2(1+(x-μ)/σ)(1-(x-μ)/σ)f(x)
であることから,f(x)はx=μで最大値をとり,x=μ±σで変曲点となります.正規分布では,区間[μ−σ,μ+σ]に68.3%,[μ−2σ,μ+2σ]に95.4%,[μ−3σ,μ+3σ]に99.7%の観測値が入ります.ほとんどの観測値が[μ−3σ,μ+3σ]に入ることを利用して,工場では品質管理を行っています.それが3σ法で,有用なQCテクノロジーの1つになっています.
 
 なお,正規分布は負から正にわたって変動しうる量に適用されるものであるため,正の値のみをとり負になりえない変数では正規分布の仮定が難しいとされます.しかし,あまりうるさいことを言わないなら,平均値付近にデータが集中しほぼ左右対称になるような場合には正規分布で近似してもそれほど違いを生じないと思われます.
 
[特性]
 
 x1,・・・,xnをN(μ,σ^2)からの標本とすると,標本平均Σxi/nの分布はN(μ,σ^2/n)になりますが,この逆についても,標本平均の分布が,N(μ,σ^2/n)になるのは,母集団分布がN(μ,σ^2)の場合に限られます.
 
 一方,標本分散をu^2とすると,(n−1)u^2/σ^2の分布はカイ2乗分布χ^2(n-1)となりますが,この逆についても,xiの分布はN(μ,σ^2)でなければなりません.以下,正規分布の重要な性質を簡単におさらいしておきます.
 
[1]中心極限定理
 「正規分布に限らず,独立な確率変数xiがいずれも同一の平均値μと分散σ^2をもつような任意の分布に対して,その標本平均の確率分布はn→∞の極限で正規分布N(μ,σ^2/n)になる.」
 
 正規分布では,標本平均の分布が正規分布N(μ,σ2/n)になることを簡単に示すことができますが,一般の分布についても,和の分布の極限を考えると正規分布で近似される(漸近正規性をもつ)というのが中心極限定理であり,自然界における正規分布の普遍性を説明する1つの根拠とされています.
 
[2]加法に関して不変
 「2つの正規変数の和は正規分布になり,和変数の平均(分散)は個々の平均(分散)の和と等しくなる.」
  μ=μ1+μ2     (μに関する再生性)
  σ^2=σ1^2+σ2^2  (σ^2に関する再生性)
 
 また,2つの正規変数の差も正規分布になり,
  μ=μ1-μ2     (μに関する再生性)
  σ^2=σ1^2+σ2^2  (σ^2に関する再生性)
が成り立ちます.
 
 独立変数の和に対して,平均値と分散の加法性は成り立っても,差に対しては確率分布までが保存されるとは限りませんから,これぞ正規分布の最も好ましい性質になっています.なお,一般に正規分布変数の線形結合Σaxは正規分布N(Σaμ,Σa^2σ^2)になります.
 
[3]正規分布から派生した分布
 正規分布と関連があり,しかも統計的な道具として広く利用される分布に,χ^2分布,t分布,F分布があります.
 
a)χ^2分布
 確率変数xが標準正規分布N(0,1^2)に従うとき,x^2の分布は自由度1のχ^2分布,また,n個の変数xiがすべてN(0,1^2)に従うならば,Σxi^2は自由度nのχ^2分布になります.すなわち,
  x〜N(0,1) →x^2〜χ^2(1)
  xi〜N(0,1)→Σxi^2〜χ^2(n)
 
 通信系内部に発生する雑音は正規分布になりますが,その平均パワーの分布がχ^2分布になるのはこのためです.
 
b)F分布
 F分布はχ^2確率変数の比の分布であり,
  y1〜χ^2(m),y2〜χ^2(n)→(y1/m)/(y2/n)〜F(m,n)
と表されます.このことから,x1,x2〜N(0,1)とするとき,(x1/x2)^2はF(1,1)にしたがうことがわかります.さらに,これより,その平方根x1/x2はコーシー分布にしたがうことが簡単に計算されます.
 
c)t分布
 xがN(0,1),yが自由度nのχ^2分布に従うとき,t=x/√(y/n)は自由度nのt分布に従うことは,t分布の統計的性質として重要です.すなわち,
  x〜N(0,1),y〜χ^2(n)→x/√(y/n)〜t(n)
 
d)商x1/x2はコーシー分布にしたがい,また,積y=x1*x2の確率密度関数は第2種の変形ベッセル関数となります.さらに,積の和と差y=x1*x2±x3*x4はラプラス分布にしたがいます.
 
e)さらに,exp(-1/2(x1^2+x2^2)),1/2πtan^(-1)(x1/x2)は区間(0,1)の一様分布に従うことも導かれます.
 
===================================
 
【3】コーシー分布
 
  確率密度関数:f(x)=1/π・β/(β^2+(x-α)^2)
  累積分布関数:∫f(x)dx=1/2+1/πtan^(-1){(x-α)/β}
 
 任意の点に,垂直軸のまわりを水平に回転できるような銃を固定し,−π/2≦θ≦π/2の範囲の任意に選ばれた角度で固定した壁に向けて発砲するとき,発砲角度が一様分布にしたがえば,銃弾の命中点の分布は上式で表されます.そのため,コーシー分布は,種々の放射線の線スペクトルの強度分布など共鳴現象を表わすのにしばしば用いられていて,原子核物理の分野では,ローレンツ分布とも,ブライト・ウィグナー分布とも呼ばれます.
 
 コーシー分布の密度曲線は,古くから知られている幾何学曲線(x^2y=c^2(c-y))と同一で,山形をしています.この曲線は「変曲点をもつ曲線」の誤訳から,以降「アグネシの魔女(witch of Agnesi)」と別名でよばれるようになった割合有名な曲線です.witchから迂弛線(うちせん)ともよばれますが,最近はこのような古めかしい呼び方は多分しないと思います.
 
[形状]
 
 コーシー分布は正規分布と同じような山型の分布をして,一見,正規分布と似ていますが,数学的にははなはだ異なった性質を示し,コーシー分布は平均さえもたないのに対し,正規分布はすべての次数の積率をもっているという違いがあります.
 
 また,正規分布は頂点が丸くて裾の減退が速いのに対し,コーシー分布は頂点が鋭くて分布の両すそが正規分布に比べかなり長く,中心から遠くまで広がっています.すなわち,コーシー分布はいわゆる裾の重い(heavy tailed)分布で,大きい(小さい)値をとる確率がなかなか0に近づかず,累積分布関数より,[α−β,α+β],[α−2β,α+2β],[α−3β,α+3β]の外の値はなんと50%,30%(0.2952),20%(0.2048)も観察されることがわかります.
 
 一方,正規分布では[μ−σ,μ+σ],[μ−2σ,μ+2σ],[μ−3σ,μ+3σ]の外の値が観測されるのは32.7%,5%(0.0455),0.3%(0.0027)ですから,正規分布はxの絶対値が大になるにつれて指数関数的減衰するのに対し,コーシー分布は代数関数的に減衰する分布関数で,逆にいうと,代数関数的減衰に比較して指数関数的減衰がいかに急減であるかがよくわかります.
 
[特性]
 
[1]平均や分散をもたない確率分布!
 コーシー分布はt分布において自由度1としたものであり,平均値は定まらず分散が無限大になる厄介な分布です.なぜなら,対応する積分が発散するからです.したがって,コーシー分布は中央値と4分位偏差(第3四分位数Q3と第1四分位数Q1の差)で特徴づけられます.コーシー分布の分散は発散しますが,4分位偏差のように存在の保証された分布の幅の測度sで置き換えると
  s=s1+s2
が成り立ちます(stable distribution).
 
[2]中心極限定理が成立しない分布!
 特性関数を利用して,正規分布とコーシー分布からの標本平均の分布を調べてみます.x1,x2,・・・,xnがすべて同じコーシー分布
  f(x)=1/π・β/(β^2+(x-α)^2)
に従うとき,コーシー分布の特性関数は
  φ(t)=exp(iαt-β|t|)ですから,
標本平均の特性関数は,
  [φ(t/n)]^n=[exp(iαt/n-β|t/n|)]^n=exp(iαt-β|t|)
すなわち,もとの分布とまったく同じです.このことはコーシー分布に従う変量を測定するとき,何回測定を繰り返したとしても,分散は小さくならないことを意味しています.
 
 この結果から,コーシー分布に従う変数については中心極限定理が成立しないことがわかります.ほとんどすべての分布に対して,中心極限定理は成り立つのですが,コーシー分布のように分散が無限大になる分布に対しては適用できないのです.
 
 コーシー分布にしたがう確率変数の線形結合Σaxはコーシー分布(Σaα,Σ|a|β)になります.また,確率変数がコーシー分布に従うとき,その標本分布も再びコーシー布に従うため,何回測定を繰り返したとしても,標本平均値の分散は無限大で標本平均値の精度は少しもよくなりません.
 
 このように,コーシー分布はいくつかのパラドックスの源泉になっていて,しばしば,たちの悪い分布の代表として用いられます.さらに次のような性質ももっています.
 
[3]正規分布する確率変数同士の商の分布
 F分布はχ^2分布の比の分布となりますが,自由度1のχ^2分布の比の平方根分布は半コーシー分布,したがって,正規分布する確率変数同士の商の分布はコーシー分布になることが示されます.
 
[4]コーシー確率変数の逆数もコーシー分布
 
===================================
 
【補】安定分布(stable distribution)
 
 話は少し脱線しますが,2つの正規変数の和の分布は別の正規分布に従います.これを正規分布は加法に関して不変(invariant)であるといいます.このとき,和変数の分散σ^2は個々の変数の分散σ1^2とσ2^2の和と等しくなります.すなわち,
  σ^2=σ1^2+σ2^2
です.加算は2乗の世界(分散)で成立し,1乗の世界(標準偏差)では成立しません.このような加算が成り立つ分布は正規分布が唯一です.
 
 正規分布では標準偏差σを4分位偏差sで置き換えても
  s^2=s1^2+s2^2
は成立します.
 
 コーシー分布は標準偏差・分散をもたない分布をして知られていますが,quantile(fractile)の存在は保証されます.コーシー分布も加法に関して不変で,コーシー変数の和の分布は再びコーシー分布になります.そして,4分位偏差に関して
  s=s1+s2
すなわち,1乗の世界での加算が成り立ちます.
 
 同様にして,ブラウンノイズ関数については,1/2乗の世界での加算
  s^(1/2)=s1^(1/2)+s2^(1/2)
が成り立ちます.
 
 以上まとめると
  s^k=s1^k+s2^k
    k=2 :正規分布
    k=1 :コーシー分布
    k=1/2:ブラウンノイズ関数
となります.
 
 すべての分布について,中心極限定理が成立するというわけではなく,平均や分散が発散するときには,中心極限定理は成立しません.たとえば,コーシー分布やブラウンノイズ関数はその例です.
 
 しかし,0≦k<2をパラメータとして,それらの和をn^(1/k)で規格化した極限が存在する分布があります.モーメントがk次を境として収束,発散を異にする場合,指数kの安定分布といいます.すべての安定分布は無限分解可能な分布であり,とくに,指数k=1の対称な安定分布がコーシー分布なのです.
 
===================================
 
【4】t分布
 
  f(x)=Γ{(n+1)/2}/{√(nπ)Γ(n/2)}{1+x^2/n}^(-(n+1)/2)
 
 自由度nの標準t分布は,上式で表わされます.これを位置=尺度母数モデルに一般化するためには,位置母数αと尺度母数βをつけて,x=(y−α)/βとおいてxからyへの変数変換を行なえば,
  f(x)=Γ{(n+1)/2}/{√(nπ)Γ(n/2)β}・{1+(x-α)^2/β^2/n}^(-(n+1)/2)
が得られます.
 
[形状]
 
 t分布は,n=1の場合に,
  f(x)=1/πβ・{1+(x-α)^2/β^2}^(-1)
    =1/π・β/(β^2+(x-α)^2)
すなわち,コーシー分布になります.同様にして
  f(x)=√2/4β・{1+(x-α)^2/β^2/2}^(-3/2)  (n=2)
  f(x)=2√3/3πβ・{1+(x-α)^2/β^2/3}^(-2)  (n=3)
  f(x)=3/8β・{1+(x-α)^2/β^2/5}^(-5/2)   (n=4)
 
 n→∞とするとき,
  (1+x^2/n)^(-(n+1)/2)→exp(-x^2/2)
また,スターリングの公式より
  Γ{(n+1)/2}/√(nπ)Γ(n/2)→1/√(2π)
が示されます.すなわち,自由度が無限大のt分布は正規分布になりますから,t分布は正規分布を一般化したものと考えることができます.
 
 また,t分布は正規分布とカイ2乗分布(ガンマ分布)の密度関数の混合によって導出することもできますから,正規分布より裾が重い釣り鐘型分布になります.
 
 正規分布(自由度が無限大のt分布)は頂点が丸くすその減退が速いのに対し,コーシー分布(自由度1のt分布)は頂点が鋭くすそが広く,両者は両極端の形をしています.
 
[特性]
 
[1]t分布の統計的意味
 「statistics」は統計学と訳されていますが,古典統計学においては文字どおり国家論という意味であって,元来は国状を記述するための方法でした.検定・推定論を中心とした現代統計学の幕開けは,1908年にゴセットがスチューデントという筆名で発表したt分布の発見であるとみなされています(いわゆる精密標本論の始まり).
 
 それを洗練された形に改良したのがフィッシャーですが,フィッシャーはn個の観測値の標本平均と母平均の差(距離)を不偏標本標準偏差の平方根で割った統計量tの分布をn次元ユークリッド空間を使って導きだし,これらをスチューデントの定理としてまとめました.すなわち,未知のパラメータμ,σ^2をもつ正規分布N(μ,σ^2)に関して,
1)E[u^2]=σ^2
2)標本平均mと標本不偏分散u^2は任意のμ,σ^2について独立である.
3)t=√n(x−μ)/uはμ,σ^2に独立な分布(自由度n−1のt分布)をもつ.
 
[2]t分布の物理的意味
 スペクトル曲線はローレンツ型(コーシー分布)でもガウス型(正規分布)でもなく,両者が混合した中間の形(フォークト型)が多くなりますが,フォークト関数の密度関数は積分関数を含んでおり,このままでは実際のスペクトル線の信号解析が困難です.そこで,苦肉の策として,自由度2か3か4のt分布を使って代用する方法も考えられます.
 
 また,t分布は,このような物理的性質から移動通信の解析などにも用いられています.
 
===================================
 
【5】半値幅(FWHM:full-width at half-maximum)
 
 半値幅とはピークの高さの半分における幅を示しており,分布のばらつきを表わすものとして実用上便利な目安になっています.コーシー分布の場合で説明すると,コーシー分布では,x=αのとき最大値1/βπ,x=α±βのとき1/(2βπ)となりますから,f(α±β)は分布曲線の最大値の半分に相当します.そのためα−βとα+βの距離2βを半値幅といいます.また,正規分布の半値幅は2√2ln2σ=2.35σになります.
 
 コーシー分布では4分位偏差は2βであり,区間[α−β,α+β]にデータの50%が集中し,正規分布ではμ±1.17741σの区間にデータの76%が集中することになります.
 
 スペクトルの解析では,バックグラウンド・ノイズなどによって,裾の部分が正規分布やコーシー分布からしばしばずれることがあります.この部分は物理的に意味のある信号が少ないと考えることができるので,スペクトルデータの解析では半値幅(FWHM:full-width at half-maximum)が物理的な意味をもつことになり,重要な指標になっているのです.
 
 半値幅をw,頂点のx座標,y座標をそれぞれx0,y0とすると,コーシー分布ではw=2βより
  y=y0/{1+4(x-x0)^2/w^2}
正規分布ではw=2σ√2ln2より
  y=y0exp{-4ln2(x-x0)^2/w^2}
となります.
 
 また,自由度nのt分布では,w=2β{n(2^(2/(n+1))−1)}^(1/2)より
  y=y0{1+4(2^(2/(n+1))-1}^(-(n+1)/2)
で表すことができます.
 
 なお,ここで説明した半値幅は「全値半幅」と呼ばれるものですが,「半値半幅」を使う場合は係数4を省くことができます.
 
===================================