■非正規分布統計学のすすめ「麦」


近日発売予定!!

■適用機器とシステム構成

 稼働には以下のシステム構成が必要です。

パソコン本体:NEC PC-9801シリーズ
NEC PC98-21シリーズ
他機種+98ーエミュレータ
OS:MSーDOS
言語:NEC N88BASIC

mugi.lzh / 312KB / 2004.7.16 Download ←ここをクリックすると、プログラムのソースリスト(テキスト形式)をダウンロードできます(無料)。


■機能の概要

 「麦」では,標本から母分布の形を最大尤度推定法(以下,最尤法と略す)を用いて推定することによって,正規分布という呪縛から解放し,正規分布からの脱却をめざしています.
 研究者・技術者・統計学を学んでいる学生にとってすぐに役立つプログラムとなるように,ほとんど(約200種類)の確率分布に対応した最尤法(maximum likelihood method)の計算プログラムを用意しましたので,これを機会にぜひともこれからの統計学「非正規分布統計学」に対する理解を深めてください.
 
  →関連記事:コラム26『ある学会にて』
 

■設計思想

 現在ある統計理論の主流は正規分布およびそれから派生した分布(χ2分布,t分布,F分布)を中心として組み立てられたもので,これまで数々の成果を上げてきたことは説明するまでもありません.正規分布の確率密度関数は複雑そうに見えますが,一般的な誤差の分布関数として導かれたものであって,自然界において普遍的な分布とされています.また,母集団分布が正規分布でなくても標本が大きくなると標本平均値の分布は次第に正規分布に近づく(中心極限定理)や正規分布をする変数どうしの和と差はまた正規分布になる(再生性)など,非常に扱いやすい性質をもっており,これに代わるものを探すのは難しいですし,実際,この分布で多くの現実のデータが近似できます.
 
 そのため,数理統計の多くの分野において,母集団分布は正規分布であることが暗黙の前提となっているのですが,実際のデータ解析では正規分布が適合しないということがしばしば経験されます.たとえば,試験の得点分布は正規分布になると考えられているようですが,試験成績のように上限・下限が存在してしかも対称形になるとは限らないデータではむしろベータ分布などを適用すべきとする意見もあります.データの分布がいつでも正規分布に従うことを仮定してしまうことは危険であり,また,誤差の分布に関しても,何の実験もなしに最初から正規分布に従うとアプリオリに決められているのではありません.
 
 このように,正規分布は,便利さの反面,氏素性がはっきりしない分布に対しても盲目的に適用されるなど,正規分布神話の盲信ともいうべき好ましくない風潮が指摘されています.そのため,データ解析に関わる実務家であれば,データを正規分布以外の何らかの理論分布関数で規定したいなど,確率分布のあてはめに関する要求をもっています.何らかの結論をデータから導きだすために,正規分布のような単純な関数を用いると,無理やり単純な式に還元することによって,データのもつ情報を十分には活用できなくなる危険性をはらんでいるからです.
 
 その際,自分で新たな分布を考案することも可能ですが,それよりもまずは世の中に出回っている分布にあたるほうが能率的ですし,分布にはそれぞれの意味や由来があり,それを知っておけば選択しやすくもなります.実用に供せられるべき多くの連続型および離散型確率分布があるのですが,自分で知っている確率モデルは限られており,数少ない確率モデルのなかからありきたりのものを選ばざるを得ないという悲しむべき状況が発生します.どのようにして確率モデルを選定するかという以前に,どのような確率分布があるのかを知っておくことは,研究に仕事に統計学を用いているすべての人にとってプリミティブな問題になっているのです.
 
 これらの点をふまえて,「麦」で取り上げる確率分布関数は,次のような独自の基準で選択しました.
(1)応用上重要なもの:
たとえば,電波の伝搬分布であるレイリー分布やライス分布は電気通信分野では有用な分布として知られている.これらの分布は,生物など他の分野にも応用領域が拡大可能であるにも関わらず,これまで取り上げられることが少なかった.
(2)導出された歴史的背景が興味深いもの:
たとえば,プランク分布は量子力学誕生の端緒となった分布であるし,ワルド分布はブラウン運動と,コーシー分布は光の分散と関係した分布である.
(3)話題性のあるもの:
ゆらぎ現象との関連で,ジップの法則として有名になったジップ分布など
(4)統計解析に深く関わるもの:
正規分布など
 
  →関連記事:コラム25『プランク分布と量子化の概念』
  →関連記事:コラム30『標的問題の解とχ分布』
 

■種本

 「麦」の種本には,Johnson, Kotz らの「continuous univariate distributions-I,II」,「univariate discrete distributions」 (John Wiley & Sons Inc.)を使用しています.その第2版は33章,2000ページを超える大部となっていて,決して,一朝一夕に書かれたものではなく,内容的にみても日々丹精して累積した原稿を整理した学術書と思われます.応用統計の教科書として定評のあるこの本は数学的観点からみて,それ程高級なことが書かれてあるわけではありませんが,初歩的なことからわかりやすくかいてあるし,それに何より応用面に配慮されているところがよいと感じられる良書です.
 
 わが国の統計の教科書はきわめて教科書的であってどの本をみても内容的に似たりよったりでさしたる特徴がなく,知識の羅列に堕落しているものが大部分といえますが,そのような出版環境のなかで,この本に巡り会えたことは幸運でした.教科書は,知識を学ぶよりも,眠っていた感性と才能を呼び覚ますこと,すなわち新しい興味をかきたてたり,物をつくる達成感や自分で問題を考える能力を養う向きへ方向転換させることこそが大切なのであって,さすがはよくできた教科書だと思った次第です.
 
 当該の種本は,著者の仕事には非常に役立ってくれていて,その経験をもとにして,オリジナルの内容を加えて発展的に再構成してあります.既成の教科書では学び得なかった確率分布のおもしろさを知って頂ければ幸甚です.