■シンプソンのパラドックス
統計学では層別データが指示する仮説とそれらを合わせたときに指示する仮説が違っていることが違うという現象がみられることがある.この現象はシンプソンのパラドックスと呼ばれるが,このパラドックスが生ずるのは
a/b>c/d,p/q>r/s
だとしても
(a+p)/(b+q)>(c+r)/(d+s)
とは限らないことによっている.
a,b,c,d,q,r,sを一定にして,pの上限,下限を求めてみると,
qr/s<p<(c+r)(b+q)/(d+s)−a
となるが,a=1,b=2,c=3,d=7,q=5,r=1,s=6
とすればp=1,すなわち,
1/2>3/7,1/5>1/6
だが
(1+1)/(2+5)=2/7<4/13=(3+1)/(7+6)
となって,このような小集団であってもパラドックスを生じてしまうのである.
[参]ハヴィル「世界で最も奇妙な数学パズル」青土社
===================================