カイ2乗検定

ymlab2005-12-24

学生のころ、ヒストグラムのfittingを、PAWでやっていたけど、
そのとき、出てくる表で、&chi 2 /ndf が、1に近かったら、
きれいにfittingされているよ。と大学院生に教えてもらったんだけど、
なんでかやっとわかりました。

\displaystyle \chi^{2}=\sum_{i} \frac{(N_{i}-n_{i})^{2}}{n_{i}}
なんだけど、
\displaystyle \chi^{2} \equiv \sum^{N}_{i=1} \left(  \frac{y_{i}-y(x_{i};a_{1}...a_{M})}{\sigma_{i}}\right)^{2}

ともかける(らしい)。
そういえば、[リデュースドカイスケア(Reduced chi square)]は、
実際シグマだから]とか意味のわからんことを2つ上の大学院生がいってたなぁ。やっと意味がわかりました。

で、\chi^2分布は、不完全ガンマ関数
\displaystyle P(a,x)\equiv \frac{\gamma(a,x)}{\Gamma(a)}\equiv \frac{1}{\Gamma(a)}\int^{x}_{0}e^{-t}t^{a-1}dt (a > 0)
の補関数
\displaystyle Q(a,x)\equiv 1-P(a,x)\equiv \frac{\Gamma(a,x)}{\Gamma(a)}\equiv \frac{1}{\Gamma(a)}\int^{\infty}_{x}e^{-t}t^{a-1}dt
に従う。

この関数から、
Q(a,0)=1と、Q(a,∞)=0
は、代入したら求められる。
で、
Q(\chi^{2}|\nu)は、観測されるカイ2乗の値が\chi^{2}より小さくなる確率として定義されており、やっぱり同様に、
Q(0|\nu)=1, Q(\infty |\nu )=0.

で、なんとさっきの不完全ガンマ関数とこんな関係をもつらしい。
なんで?ちょっと強引っすよ。

\displaystyle Q(\chi^{2}|\nu)=Q(\frac{\nu}{2},\frac{\chi^{2}}{2})
そりゃ、代入したら、上の式もなりたつけどさあ。と思ってしまいます。

まぁ、そんなこんなで、
\nu \approx \chi^{2}の場合、もっともQが、小さいので、よいということらしいです。
そりゃ、ν=χ2ということは、χ2/νが1に近ければいいということと、
同義だな。
あ、ちなみにνは自由度のことです。で、自由度を正しく書くと、
Number Degree Freedomなんで、下の画像は自由度のことをndfと書いているのです。