楕円近似について（その５）

　通常用いられる最小２乗法は，計算を単純にするため「縦軸のデータだけに誤差がある場合で，横軸のほうの誤差は全くないかあるいは無視できるものと見なすことができる」という前提をおいて，目的関数を

とし，誤差はあくまでもｙのみに含まれるものとしています．それとは逆に，ｘのみに誤差がある場合は従属変数と独立変数を入れ替えるだけで，この解析法がそのまま適用できます．

　プログラム・パッケージに入っている最小２乗法は，通常，ｙのみに誤差があることを前提とした最小２乗法ですから，ｘのみに誤差がある場合やｘ，ｙ双方に誤差があり，その比があまり１から離れない範囲の場合はそのまま用いると誤った結論に陥ってしまうことになりかねません．実際問題としてｘ，ｙのどちら側にも誤差があるほうが当り前ですから，今回のコラムではｘ，ｙ双方に誤差があるときの最小２乗法の取り扱いについて考えてみます．

　ｘ側，ｙ側どちらにも誤差がある場合は独立変数，従属変数の区別がなく対等と考えられますから，ｆ（ｘ，ｙ）＝０のように陰関数表現しておく方が楕円のような多価関数となるデータに対しても曲線のあてはめができるので何かと都合がよくなります．そのような方法に，青山学院大学理工学部・物理を定年退官された粟屋隆先生による２次元フィッティングの方法があります．

　粟屋の方法は，品質管理・計量管理で有名なデミング（Deming）のクラシカルな方法を改良したものですが，デミングの方法が反復計算にそぐわない１回限りの計算法であるのに対し，粟屋の方法は反復計算によって精度を逐次高めていくことが可能になっています．

　この２次元フィッティングは実に念の入った膨大なものであり，未知数が多くなって計算はかなり複雑になります．この解法については

に詳しいのですが，特殊な問題にはこのような考察が必要になり，拡張した取り扱いを然るべく行なえば解が得られることをアウトラインだけでも知っておいたほうがよいと思われます．

　そのすべてをここに記すことは量的に無理であり，また小生の能力を超えたところも少なくないので，詳細は省略し理論の要点のみを記しておきます．

　粟屋の方法ではラグランジュの未定係数法が使われていますが，ラグランジュの未定係数法は，たとえば，「ｘ^3－３ｘｙ＋ｙ^3＝０の条件のもとでｘ^2＋ｙ^2の極値を求めよ」といった条件つき極値問題や制約条件付きの最小２乗法などの解を得るために導入された方法です．

　制約条件付きの最小２乗法は１９世紀の測量士たちのおこなった三角測量でもっともよく用いられましたが，以下にその簡単な例を示します．

　「三角形の三つの内角を等精度で測定し，α＝５４°０５′，β＝５０°０１′，γ＝７６°０６′を得た．内角の和は２直角になるべきであるが，測定誤差のため１８０°１２になった．」

　このような場合に内角の最確値ｘ，ｙ，ｚおよび確率誤差を求めるにはどうしたらよいかを考えてみましょう．ｘ＋ｙ＋ｚ＝πが要請されている条件です．また，測定精度は等しいので荷重をｗi ＝１とします．

としてｓを最小にするｘ，ｙ，ｚおよびλを求めます．極値の必要条件により，　　∂ｓ／∂ｘ＝２（ｘ－α）－λ＝０・・・・・（１）

が求める解となります．すなわち，等精度で三角形の内角を測定したときの各補正量は測定値の和と１８０°との差を３等分したものです．

　このように，制約条件のある最小２乗問題を解くには未定係数λを導入して，未知のパラメータと未定係数λについて方程式を解けばよいことになり，制約条件のない場合の手法を用いて容易に解くことができることが理解されるでしょう．

　２次元フィッティングでは，取り扱う陰関数をパラメータも含めｆ（ｘ，ｙ，ａ）＝０と書くことにします．ここで，データ（ｘi，ｙi）の真の値を（ｘi0，ｙi0），真の係数を示すベクトルａ0＝（ａ10，・・・，ａm0）とすると，

が恒等的に成り立ちます．したがって，制約条件式にはｆ（ｘi0，ｙi0，ａ0）＝０を用いることになります．

　　　＝ΣΣ（ｘi－ｘi0）^2／２σxi^2＋Σ（ｙi－ｙi0）^2／２σyi^2－Σλiｆ（ｘi0，ｙi0，ａ0）　　　　　　（λi ：ラグランジュの未定係数）

　ここで解くべき連立方程式の未知数は，ｘi0，ｙi0，λiがｎ個ずつ，ａj0がｍ個で合計３ｎ＋ｍ個となり，未知数が多すぎて計算は大変複雑となります．そこで，まずλiを消去することを考えます．以下，表記を簡単にするため，

　アプロ－チの途中を省略しますが，誤差伝播の法則より，ｚ＝ｆ（ｘ，ｙ）の母分散σz^2は，分布形にかかわらず，

　　ｆ（ｘ＋Δｘ，ｙ＋Δｙ）＝ｆ（ｘ，ｙ）＋Δｘｆx＋Δｙｆy＋１／２（Δｘ^2ｆxx＋２ΔｘΔｙｆxy＋Δｙ^2ｆyy）＋・・・・・

　ニュートン法の漸化式ではｆ（ｘ＋Δｘ，ｙ＋Δｙ）＝０とおいてΔｘ，Δｙを求めるわけですから，残差の近似値に相当するのがｆi0＋（ｘi－ｘi0）ｆxi＋（ｙi－ｙi0）ｆyiになり，結局，

　　Ｆj≡Σｗi｛ｆi0＋（ｘi－ｘi0）ｆxi＋（ｙi－ｙi0）ｆyi｝ｆji＝０　　　（ｊ＝１～ｍ）

　これをガウス・ニュートン法と同様の方法で整理することにします．真の値ｘi0，ｙi0，ａ10，・・・，ａm0の近くの点（ｘi，ｙi，ａ1，・・・，ａm）で関数ｆ（ｘi0，ｙi0，ａ0）＝０をでテイラー展開し，１次までの項をとると

　多価関数に対する取り扱い（２次元フィッティング）において，パラメータを計算するには最初に未知のパラメータの初期値を与えなくてはいけないことはガウス・ニュートン法と同じですが，粟屋の方法ではさらに測定値の真の値も与えなければなりません．測定値の真の値の初期値には測定値自身を用いることにし，パラメータと測定値の真の値の第１近似値を与えてやって逐次近似解法により漸近連立方程式を解きます．

　粟屋の方法の欠点は計算に時間がかかるということです．未知数が多すぎることがその原因です．そこで，以下には粟屋の方法の原型となったデミングの方法による円近似プログラムを掲げます．

に譲りますが，（その４）に掲げた非線形最小２乗法プログラムの粟屋の方法の簡易版と比べて変わっているのは，重みをつけたこと（2290行～2370行）と正規方程式の右辺の式（2860行）など数カ所を手直ししただけであって，変更点はごくわずかです．

　残差２乗和は，測定点（ｘ，ｙ）からあてはめるべき円に下ろした垂線の長さ（データから円までの最短距離）

　　ｘ1＝｛ｘｒ＋ａ（√｛（ｘ－ｘ0）^2 ＋（ｙ－ｙ0）^2｝－ｒ）｝／√｛（ｘ－ｘ0）^2 ＋（ｙ－ｙ0）^2｝

　　ｙ1＝｛ｙｒ＋ａ（√｛（ｘ－ｘ0）^2 ＋（ｙ－ｙ0）^2｝－ｒ）｝／√｛（ｘ－ｘ0）^2 ＋（ｙ－ｙ0）^2｝

が確かめられますが，円の場合，垂線の足の座標を求めることが楕円に比べてかなり簡単というわけです．

　ところが，この計算を実行すると最初は残差２乗和が減少するものの，その後，増加に転じてしまいます．そのため，プログラムでは反復計算を残差２乗和の減少が増加に転じる直前で打ち切っています（2540行～2570行）．もともとデミングの方法は反復計算法ではなく１回限りの計算法なのですが，このプログラムでは無理矢理，反復計算にもちこんでいるのです．

と比較して，計算所要時間がはるかに短くて済むわりには，まあまあよい近似値と誤差が求められたといってもよいでしょう．

　もちろん，粟屋先生が開発された方法のほうが，収束安定性も高いことから安心して使うことができます．粟屋の手法の根拠は最尤法にあり，実にみごとな計算手法で特別な職人芸的技巧を必要とせず，しかも，made in Japan （純国産）の方法ですから，読者が粟屋の方法に興味をもち使って下さることを願ってここで宣伝しておきます．