■Dr. Chameleon's conjecture

 
 「ドクトル・カメレオン」とは,畏敬すべき学兄・石原信夫先生が大学院生であった頃の小生を「カメレオン」と呼んだことに端を発する小生のニックネームである.彼曰く,それは「何事にも興味を示す奇妙な動物」という意味の愛称であって,親しみが込められているというのだが,当時,同じ教室には「ペンギン」や「サル」それに「イカ」という輩もいて,その真偽は定かではない.
 
 「ペンギン」というのは超がつくほど短足という意味であることは実物の「ペンギン」さんをご存知ない方でも容易に想像がつくであろう.その論法でいけば,さしづめ「カメレオン」の場合もおそろしく話し下手な,すなわち「舌足らずのカメレオン」という「逆説」的な意味だと解釈するほうが当たっているに違いない.
 
 現在「ペンギン」「サル」「イカ」はそれぞれ某国立大学の教授職にあるが,私の場合は「舌足らず」が災いしたのか,いまだ地方の研究所でくすぶり続けているのである.
 
 さて,conjectureというのは「予想」という意味のれっきとした数学用語である.たとえば「佐藤予想」というと,佐藤幹夫先生が提出された(いまだ証明されていない)有名な問題のことを指すが,小生の立てた予想のことを,畏友・阪本ひろむ氏が「ドクトル・カメレオン予想」と名づけてくれた.
 
 「佐藤予想」と呼ぶには僭越不遜であまりにもおこがましいし,それに「佐藤予想」とは問題が属する分野も難易度もまったく異なる予想であるというのが銘々の由来であり,その所以たるところであろう.
 
===================================
 
 今回のコラムでは,最小2乗法に関連する「ドクトル・カメレオン予想」を取り上げるが,それを数学的に記述すると以下のようになる.
 
 分散・共分散行列:{cov(θi,θj)}={σij}=Δ   (i,j:1〜m)
 偏微分ベクトル:(df/dθ1,df/dθ2,・・・,df/dθm)=(g1,g2,・・・,gm)=g
とおくと,
 
【第1予想】  Πσii≧|Δ|
【第2予想】  Σσiigi^2≧ΣΣσijgigj=gΔg’
 
 第1予想は母数空間における対角成分の積と行列式の値の関係を述べたもので,「母数同士の相関を考えることによって,母数空間の大きさは小さくなる」ことを数式で表現したものである.また,第2予想は標本空間における2次形式の評価であるが,簡単にいうと「母数間の相関を考慮すると,考慮しない場合よりも推定誤差が小さくなる」ということを意味している.すなわち,相関を考えることで,母数空間も標本空間も小さくなるというのが「ドクトル・カメレオン予想」の骨子である.
 
 なお,いうまでもないことだが,分散・共分散行列の対角要素σiiは非負,σii≧0であるが,非対角要素σij=σjiは正のことも負のこともある.また,ΣΣσijxixjの形の式を2次形式というが,ここで重要なのはこの2次形式が非負,すなわち,任意のxi,xjに対して
  ΣΣσijxixj≧0
という性質をもっているということである.
 
 すべての実数に対して,負とならない最も簡単な2次形式は,
  a>0,D=b^2−4ac≦0のときのax^2+bxy+cy^2
であるが,分散・共分散行列は非負2次形式に対応していて,このような行列は非負定値行列と呼ばれる.2次形式が非負であるための必要十分条件は,首座小行列式の値が非負となることである.
 →【補】判別式,基本対称式におけるニュートンの方法
 
===================================
 
【ドクトル・カメレオンの第1予想】
 
 第1予想:Πσii≧|Δ|が正しいかどうかを考える前に,この予想がどのようにして発想されたものか? まず,それについて述べてみたいと思います.
 
 パラメータθjの信頼区間がt分布
  θj±t(α/2,n−m)√V(θj)
で与えられるとき,母数空間
  Θ=(θ1,θ2,・・・,θm)
は直方体領域で与えられるのではなく,F分布によって規定される楕円体領域となります.ちなみに,パラメータの信頼区間が正規分布ならば,対応する母数空間はχ^2分布で規定される楕円体領域となります.直方体は楕円体領域の近似解にすぎないのです.
 →【参】コラム「正規楕円とt楕円」,「n次元楕円の陰と影」
 
 そして,相関係数が0に近いときには長方形が第0近似解となるような太った楕円が与えられますが,相関が大きいほど細長い楕円になりますから,相関が考慮されることによって,誤差は一回り減少することがわかります.
 
 さて,母数空間におけるこの直観的な幾何学的表現をもう少し解析的に評価してみることにしましょう.
 
 相関を考慮しない場合の信頼楕円は,半径√σiiの楕円体に相当しますから,その体積は分散・共分散行列Δの主対角要素の積の平方根のm乗
  (σ11*σ22*・・・*σmm)^(m/2)
に比例します.
 
 一方,分散・共分散行列の固有値をλ1,・・・,λmとすると,楕円体の半径は√λiになりますから,その体積は
  (λ1*λ2*・・・*λm)^(m/2)
に比例することになります.
 
 分散・共分散行列は正定値行列ですから,すべての固有値は正であり,また,分散・共分散行列の行列式の値は
  |Δ|=λ1*λ2*・・・*λm
で与えられますから,相関を考慮に入れることによって,楕円体の体積は
  |Δ|^(m/2)
すなわち,行列式の値|Δ|の平方根のm乗と書かれることが理解されるでしょう.
 
【補】トレースと行列式
 
 固有多項式の根と係数の関係より,トレース(対角線の項の和)=固有値の総和,すなわち,
  σ11+・・・+σmm=λ1+・・・+λm
が成り立つ.トレースは全固有値の和であり,行列式は全固有値の積:
  |Δ|=λ1*λ2*・・・*λm
なのである.
 
===================================
 
 幾何学的に説明すると,行列式の値|Δ|はm次元単体の体積のm!倍ですから,m=2なら三角形の面積×2=平行四辺形の面積,m=3なら三角錐の体積×6=平行六面体の体積となります.このように,行列式が平行六面体(平行四辺形)の体積(面積)に関係していることが理解できると,第1予想は平行六面体と直方体はどちらが大きいかで決着がつきそうな気配になってきました.
 
 すなわち,行列式は平行六面体の体積であり,対角行列の行列式が直方体の体積になることが分かったわけですから,その線で考えを進めていけば,
 第1予想: Πσii≧|Δ|   (等号は直交行列のとき)
を証明することは「3辺の長さが与えられたとき,平行六面体の体積は直方体のときに最大となる」をm次元に拡張して証明することと同等の問題に帰着されます.
 
 「すべての辺の長さが等しい平行六面体格子(菱形体格子)をつくってみると,辺が互いの60°の角度をなすようにすると,平行六面体の体積は最小値となる」ことは自明ではありませんが,「3辺の長さが与えられたとき,平行六面体の体積は直方体のときに最大となる」ことは自明のように思われます.
 
===================================
 
  σ11*・・・*σmm≧λ1*・・・*λm=|Δ|   (等号は直交行列のとき)
であることを証明したいのですが,ところで,正定値対称行列において,主対角線の項の積と行列式の値(または固有値の積の値)のどちらが大きいかは線形代数学の基礎的な知識(常識)になっているのでしょうか?
 
 その際,自分で新たに証明法を考案することも可能ですが,それよりもまずは世の中に出回っている教科書にあたるほうが能率的ですし,もし,第1予想が本当ならば教科書には当然載っているはずです.そこで,手持ちの本をあたっていたところ「線形作用素への誘い」古田孝之著(培風館)p20に,「アダマールの不等式」を発見しました.
 
 アダマールの定理は,平行六面体の体積はノルムの積によって上から抑えられるという非常に興味深い事実を示しているのであって,それによると第1予想はアダマールの不等式そのものであって,したがって,第1予想→Yesであることが肯定的に解決されたことになります.
 
【補】固有値の意味
 
 ところで,固有値は幾何学的に何に対応しているのでしょうか?
→単位キューブを線型写像で変換したときの各辺の長さと思えばよい.そうすると,行列式=体積=固有値の積であることが分かる.
 
===================================
 
【ドクトル・カメレオンの第2予想】
 
 母数空間では,アダマールの定理より,
  対角要素の積≧|Δ|
であること,すなわち,母数間の相関を考えることによって母数空間が小さくなることがわかったわけですから,標本空間においても
  Σσiigi^2≧ΣΣσijgigj=gΔg’
すなわち「母数間の相関を考慮すると,考慮しない場合よりも推定誤差が小さくなる」も成り立つと予想するのは当然の成りゆきと思われます.
 
 最小2乗法における回帰曲線の推定誤差は
  (Δy)^2=gΔg’   (2次形式)
のように見やすい形に表現されます.また,コラム「積分値の誤差と誤差の積分値」のなかでは,
  ∫gΔg’dx≧GΔG’
すなわち,誤差の積分値≧積分値の誤差であることを「ベクトルの内積はノルムの積より小さい」という「シュワルツの不等式」を使って証明したのですが,第2予想の証明には同じ手が通用しそうにありません.
 
 最小2乗法の場合の本質的なところだけを抜き書きすると,評価関数:s=Σ(y-f(x,θ))^2に対して,Δは[d^2s/dθidθj]の逆行列として得られます.最尤法の場合であっても評価関数sの形が異なってくるだけで,本質的な部分に変わりはありません.
 
 また,gは関数ベクトル[df/dθ1,・・・,df/dθm]で表されます.すなわち,gはxの関数になるのですが,xのすべての範囲にわたって
  Σσiigi^2≧ΣΣσijgigj=gΔg’
が成り立つことは経験的にも直観的にも正しいのですが,果たして第2予想は本当に成り立つのでしょうか?
 
===================================
 
 Δ=[d^2s/dθidθj]^(-1)
 g=[df/dθ1,・・・,df/dθm]
は一般の行列を取り扱うより条件がきついと思われるので,そこで,一般の正のm次対称行列A={aij}と一般的なベクトルx=(x1,・・・,xm)を取り扱うことにしました.しかし,そうすると第2予想を覆す反例ができてしまうのです.
 
(反例)aij,xi,xj≧0のとき,
  ΣΣaijxixj≧Σaiixixi
となって,左辺は右辺よりも小さくなるとは限らない.
 
 このように,一般的な2次形式として証明しようとすると反例(第2予想→No)が得られるのですが,最小2乗法で(経験的に)
  Σaiixixi≧ΣΣaijxixj=xAx’
が成り立つ理由は,最小2乗法では,aijとxi,xjは互いに関連しあっていて
  aij>0のとき,xixj<0
  aij<0のとき,xixj>0
という関係があるものと思われます.このような関係にあれば
  Σaiixixi≧ΣΣaijxixj=xAx’
は明らかです.
 
 実際,分散・共分散行列Δ={σij}と呼ばれるものは,
  σij=E[(θi-θi0)(θj-θj0)]
で定義されます.また,最小2乗法では線形近似
  f(x,θ)=f(x,θ0)+Σdf/dθk(θk-θk0)
と書けるのですが,収束点付近では
  Σdf/dθk(θk-θk0) 〜 0
ですから,これより,
  (df/dθi)(df/dθj)>0のとき,σij<0
  (df/dθi)(df/dθj)<0のとき,σij>0
でなければなりません.しかし,このような証明は厳密さを欠いていて,数学的な証明と呼ぶにはほど遠いのです.
 
===================================
 
 最小2乗法で得られたデータを用いると,非対角要素を含んだ2次形式ΣΣσijxixjのほうが例外なく小さくなることが経験されるのですが,上のように考えると,これは数学的性質というよりも,統計の対象の性質(たとえば,統計で扱う行列は対角成分以外が小さい疎行列なのでは?)のような気がしないではありません.
 
 すなわち,人間の年齢なら負の値はとらないとか(一般常識),水の温度は0℃以上100℃以下とか(物理学的性質)と同様の常識で説明できるのではないかという気もするのですが,第2予想はどの統計の本にも記載されていませんし,ましてやその証明も読んだことはありません.
 
 正規直交基底に関するベッセルの不等式を,エルミート形式にまで拡張すればあるいは証明できるのでは?等々,天地逆転の方針変換も必要と思われるのですが,いまのところ,第2予想は私にとっての未解決問題のひとつであり,厳密な数学的証明ができないでいます.一般的な2次形式xAx’のAとxに,最小2乗法のような付帯条件をつけてやれば,
  Σaiixixi≧ΣΣaijxixj=xAx’
が成り立つことは限りなくYesに近いのですが,これが成り立つような一般的条件を求めることは難しいことなのでしょうか?
 
===================================
 
【補】判別式
 
 n次方程式:
 f(x)=a0x^n+a1x^(n-1)+・・・+an=a0Π(x−αi)=0
が重根をもつためには,判別式:
  D(f)=a0^(2n-2)Δ^2=0
が必要十分条件である.ここで,
  Δ=Π(αi−αj)  (1<=i<j<=n)
はα1,・・・,αnの差積を表す.
 
 Δ^2は対称式であるから,基本対称式
  σ1=α1+・・・+αn
  σ2=α1α2+・・・+αn-1αn
  σ3=α1α2α3+・・・+αn-2αn-1αn
  ・・・・・・・・・・・・・・・・・・・
  σn=α1α2α3・・・αn   (σkはnCk個の項をもつ)
の多項式として表されることが証明されている(対称式の基本定理:ウェアリング).すなわち,
  f(α1,・・・,αn)=g(σ1,・・・,σn)
 
 2次方程式f(x)=ax^2+bx+c=0の判別式は,
  D=a^2(α1−α2)^2=a^2{(α1+α2)^2−4α1α2}
この場合の根と係数の関係は
  α1+α2=−b/a,α1α2=c/a
が成り立つから,
  D=b^2−4ac
はf(x)=ax^2+bx+cの判別式である.
 
 同様に,根と係数の関係
  α1+・・・+αn=−a1/a0
  α1α2+・・・+αn-1αn=a2/a0
  ・・・・・・・・・・・・・・・・・・・
  α1α2α3・・・αn=(−1)^nan/a0
より,f(x)=x^3+px+qの判別式は
  D=−(4p^3+27q^2),
 f(x)=x^n+px+qの判別式は
  D=(-1)^(n(n-1)/2){(-n+1)^(n-1)p^n+n^nq^(n-1)}
で表される.
 
 fの次数が高い場合,その判別式を計算するのは容易ではないし,2次方程式のように実根,虚根,重根の判別ができるわけではない.
 
 なお,ベータ関数を一般化すると,
  ∫(a,b)(x-a)^m(b-x)^ndx=m!n!/(m+n+1)!(b-a)^(m+n+1)
が得られる.
  ∫(a,b)(x-a)(x-b)dx=-1/6(b-a)^3
  ∫(a,b)(x-a)(x-b)^2dx=1/12(b-a)^4
はそれぞれ2次関数,3次関数とx軸に囲まれる図形の面積を計算するときの公式である.4次関数では
  ∫(a,b)(x-a)(x-b)^3dx=-1/20(b-a)^5
  ∫(a,b)(x-a)^2(x-b)^2dx=1/30(b-a)^5
となることが理解されるであろう.
 
===================================
 
【補】基本対称式におけるニュートンの方法
 
 対称式の基本定理より,n変数のどんな対称式も基本対称式を用いて表すことができる.たとえば,2変数の場合,
  α1^2+α2^2=(α1+α2)^2−2α1α2
  α1^3+α2^3=(α1+α2)^3−3(α1+α2)α1α2
  α1^2α2+α1α2^2=(α1+α2)α1α2
など.
 
 次に,n変数対称式:
  pj=α1^j+α2^j+・・・+αn^j
を基本対称式:
  σ1=α1+・・・+αn
  σ2=α1α2+・・・+αn-1αn
  σ3=α1α2α3+・・・+αn-2αn-1αn
  ・・・・・・・・・・・・・・・・・・・
  σn=α1α2α3・・・αn
を用いて表してみることにしよう.
 
 f(t)=Π(1+tαi)=1+σ1t+σ2t^2+・・・+σnt^n
とおくと,
 f'(t)/f(t)=d/dtlogf(t)=Σαi/(1+tαi)=ΣΣ(-1)^kαi^(k+1)t^k
      =Σ(-1)^kp(k+1)t^k
 
 ゆえに,
 f’(t)=f(t)Σ(-1)^kp(k+1)t^k
となり,
 σ1+2σ2t+・・・+nσnt^(n-1)
=(1+σ1t+σ2t^2+・・・+σnt^n)(p1−p2t+p3t^2−・・・)
 
 両辺の係数を比較することによって,順次
  p1=σ1
  p2=σ1p1−2σ2
  p3=σ1p2−σ2p1+3σ3
  ・・・・・・・・・・・・・・・・・・
  p(k+1)=σ1pk−σ2p(k-1)+・・・+(-1)^(k-1)σkp1+(-1)^k(k+1)σ(k+1)
が得られる.
 
 このことから「α1,α2,・・・,αnの基本対称式は,累乗和:α1^j+α2^j+・・・+αn^jの有理数を係数とする整式で表される」という結果が導き出される.ここで述べた方法はニュートンに拠るとされるもの(ニュートンの公式)であるが,アーベルはニュートンの公式を援用して方程式論を形成したことになる.
 
 突飛な連想であるが,ニュートンの結果を使って,受験参考書に必ず書いてある
  a^2+b^2+2ab=(a+b)^2
  a^3+b^3+c^3−3abc=(a+b+c)(a^2+b^2+c^2−ab−bc−ca)
という公式の高次元化を考えてみたい.その際,基本対称式と累乗和を使った
  a^3+b^3+c^3−3abc
=(a+b+c)(a^2+b^2+c^2−ab−bc−ca)
のような因数分解を考えることにし,
  a^3+b^3+c^3−3abc
=(a+b+c){(a−b)^2+(b−c)^2+(c−a)^2}/2
あるいは
  a^3+b^3+c^3−3abc
=(a+b+c)(a+bω+cω^2)(a+bω^2+cω)
などは除外することにする.
 
 2次式,3次式はうまく因数分解できたが,ところが,左辺=p(k+1)−(-1)^k(k+1)σ(k+1)が基本対称式と累乗和だけを使って因数分解できるのもここまでで,4次式:
  a^4+b^4+c^4+d^4+4abcd
は同様の因数分解ができない.そのため,受験参考書には決して登場しないのである.
 
 なお,対称式の計算は,ヤング図形を用いて見通しよく行うことができる.ヤング図形は対称式の計算に役立つだけでなく,「群の表現論」と呼ばれる分野でも用いられ,テンソル積の計算など非常に便利なものになっている.群の表現論は現在も活発に研究され進歩している分野である.
 →【参】硲文夫「代数学」森北出版
 
===================================