■悪名高き論争

 科学上の発見については、時が熟してあるアイデアが異なる場所で同時に(ほぼ時を同じくして)独立に出現することはよくあることです。ニュートンとライプニッツがほぼ同じ時期に微分積分学を各々独立に創設したという偶然の一致には、どのような時代的・社会的背景があったのか興味深く感じられます。「微分は微かに分かる。積分は分かった積もり。」という言葉もあるほどで、微分積分によってずいぶん悩ませられた人も多いかと思いますが、今でも科学技術の発展に大きな役割を果たしています。

 ところが、1710年にはじまるニュートンとライプニッツの微積分の発見の先取権をめぐるプライオリティー論争は、自分の先行性を主張するのみならず相手のひょう窃をも立証する目的で行われた感情的でなりふり構わぬ論争として悪名高きものです。このように有名な科学者には悪評がつきものです。

 今回はピアソンとフィッシャーのいささか生臭い話を取り上げます。とくに、カール・ピアソンの悪評について書きますが、実は、ガウスやコーシーも保守派の老大家として、その時代の若者たちに快く思われていませんでした。当代随一の数学者で、アルキメデス、ニュートンと並んで数学の3巨人の一人とされるガウスはアーベルやボヤイに冷たかったし、ガロアが革命的な論文を出したとき、その論文を狂人の作品としてはねつけ、握りつぶすことによってそれを故意に無視したコーシーも非難される側にあります。このすれ違いは歴史の戯れなのかもしれませんが、アーベル、ガロア、ボヤイのつぶやきや独り言(ぼやき?)が聞こえるようでもあり、彼らの挫折物語は数学少年の夢をかきたてるのに十分でありましょう。


(第1幕)

 19世紀末までは決定論的な世界像が支配的であったのに対し、確率論的な世界像が体系的に展開されるようになったのは、まさに20世紀前半の偉大な成果です。したがって、20世紀前半における科学の進歩を特徴づけるものを、科学方法論の中で探すならば統計科学の確立という画期的な成果を見逃すわけにはゆきません。

 統計学は、観察データに基づく記述統計学と、実験に基づく小標本により母集団のパラメータを推測する推測統計学に二分されます。前者は進化論で有名なダーウィン(自然淘汰説)に礎をおき、カール・ピアソンにより大成されたものです。また、後者は遺伝の法則を導いたメンデル(遺伝学説)の流れをくみ、フィッシャーにより大成されました。

 統計学を応用数学の一部門の水準まで高めること、統計学の応用領域を拡大創建することが、二人の終生の念願でありました。ところが、ピアソンとフィッシャーは両者とも強い個性の持ち主であったようで、生涯に何度も有名な論争をしています。観察データに理論分布を適合させる手段として積率法を導入したピアソンに対して、積率法の代わりに最尤法を使って分布曲線をあてはめようとしたフィッシャーの批判については拙著「最小2乗法その理論と実際」などで書いたとおりですが、他の争点をいくつかあげてみることにします。

a.相関係数の確率誤差

 通常の相関係数はピアソンの積率相関係数とも呼ばれますが、相関の強さを解析するためには母相関係数の信頼区間の推定を行います。ピアソンは相関係数の確率誤差が二変量正規分布に従うと考えていたようですが、母相関係数の絶対値が大きければその分布は極端に歪むことになります。ピアソンの錯覚、すなわち正規分布万能主義はフィッシャーによって批判されることになり、フィッシャーは非対称性を補正するためにはz変換したらよいことを示唆しています。

b.適合度検定

 分割表に対するχ2 検定はピアソンの適合度検定と呼ばれ、1900年にピアソンのよって示されたものです。ピアソンはr×c分割表に対してχ2 検定を適用する際の自由度をrcとしていますが、フィッシャーはrcの代わりに(r−1)(c−1)+1とすべきことを主張しています。

c.分散を求める公式

 ピアソンが母分散をnで割った標本分散で代用していたのに対し、フィッシャーは分散に対する適切な公式は、nで割ったものではなく、n−1で割った不偏分散であることを示しています。実際、小標本すなわちデータが少数の場合、「nで割る公式」は本来の分散より小さい方に偏った答を与える傾向があります。そのため、実験データを扱うときには「n−1で割る公式」を使うのが普通です。

 ピアソンは記述統計学の始祖であり、一流の業績を残し、大きな影響力を持っていました。学界の権威主義的な体質はいずことて同じなのでしょうが、フィッシャーが既成の学説を破る新説を発表したとき、大御所とその取りまき連中からうけた非難は大変なものだったようです。当初、フィッシャーの提案は賛同者が少なかったのですが、今日の知識では、いずれの争点も小標本による母数推定の洗練された数学的推量の改良を目指したフィッシャーのほうが正しく、フィッシャーの方法により実験的に得られる少数データに基づく母集団の推測が可能になります。ピアソンのやり方を踏襲した人々もやがてフィッシャー流の検定方式を受け入れていくことになりました。

 小標本論(精密標本論)がフィッシャーによって次第に形成されつつあった時代でしたが、老ピアソンの小標本論に対する態度は著しく保守的でありました。しかし、責任はフィッシャーにもあり、頑強に自説を守り、妥協を許さぬきびしさは無収束の論争を引き起こし、終生相容れませんでした。いま少し柔軟性がほしかったと思います。


(第2幕)

 カール・ピアソンとフィッシャーの大きな違いは大標本を扱うか小標本を扱うかの違いであり、技術的に細かい点を論争していて、うんざりするような益するところのない論争なのですが、ダーウィニズムとメンデリズムの代理戦争という一面をもっています。ピアソンとフィッシャーの論争は、次第に、過度の感情的ないさかいにまでエスカレートして、ピアソンの後継者である弟子や息子の代まで及ぶことになります。

 カール・ピアソンの死後、母数について何も事前にわかっていないということは事前分布が一様になるということを意味するとはいえないとしてベイズの定理を認めない立場のフィッシャーは、カール・ピアソンの息子E.S.ピアソンと弟子ネイマンとの間で、仮説検定の棄却域境界を作る原理(第一種過誤を望み通り抑え、同時に第二種過誤を抑えるために判定基準:いわゆるネイマン・ピアソン基準という仮説検定論)や乱塊法配置とラテン方格法配置の優劣などをめぐって対立し、攻撃と反撃を展開しています。

 統計的仮説検定では標本から得られた統計量が仮説とどれくらい乖離すると、仮説を棄却しうるかという境界を設けることになりますが、その際、われわれは2種類の判定ミスを犯します。「仮説が真であるのにそれを棄却する」誤りを第1種の過誤、「仮説が偽であるのにそれを採択する」誤りを第2種の過誤といいます(→【補】)。たとえば、医学統計の場合では、第1種の過誤とは病気の人を健康と判断してしまうこと、第2種の過誤とは健康な人を病気と判断してしまうことに対応します。第1種の過誤確率は状況を考えて選ばなければなりません。医療診断のように誤りが重大な結果をもたらす場合には第1種の過誤確率は非常に小さくとる必要があります。

 これら2タイプの判定ミスは、競合的かつ背反的で、一方を減らすと他方が増えるというトレードオフの関係にあります。これら2つの判定ミスを同時に減少させることはできないわけですが、検定では、「危険率は小さく、検出力は大きく」が要請されます。不幸にもこの2条件は互いに矛盾することになります。そこで、統計検定では妥協策として第1種の過誤を中心としていろいろなルールが設定されています。検定の論理は「背理法」ですから、否定したい仮説をいったん設定し、得られたデータから、確率論的に仮説の矛盾を導こうとするものです。そうでないことを示すためにわざわざ仮定する仮説を帰無仮説、矛盾と見なす確率が有意水準と呼ばれます。

 有意水準を前もって指定しておき、危険率がこの水準を越えない範囲で検出力がなるべく大きくなるように棄却域を定めるようにした検定基準がネイマン・ピアソン基準といわれるものです。すなわち、一定の第1種の過誤確率について、第2種の過誤確率を最小にするような棄却域の選び方がネイマン・ピアソン基準で、医学統計の問題に再び戻れば、病気の人が健康とみなされる確率(もちろんこの確率はできるだけ小さくしたい)が与えられたとき、健康な人が病気とみなされる確率を最小にする判定基準を求めることに相当します。

 確率論を利用した推計学はフィッシャーに始まります。それまでは、いくつかの標本から得られたことはそのまま真理であるとみなされたのですが、フィッシャーは標本はあくまで標本にすぎず、真理は標本から推し計るしかないと考え、推計学の概念に到着したのです。統計的結論は原理的に絶対に真実ということはなく、ある確率で正しいだけなのです。推計学はいまだ若く未完成の部分も多いのですが、しかし、その適用範囲の広さには測り知れないものがあるのです。


【補】第3種の過誤

 統計的仮説検定に際して、得られたデータが有意となるような間違った検定を選ぶ誤りを「第3種の過誤」と呼びます。最近では第1,2種の過誤よりも第3種の過誤の問題が大きくクローズアップされています。以上の詳細について知りたい場合は、「科学技術計算と実験データ解析」・「実験ノートのグラフ化技法と最新解析法」(佐藤郁郎著、いずれも山海堂)などをご覧ください。