母比率の差の検定と分割表の独立性の検定が同じになること
次のように分割表が与えられたとき,
成功
失敗
合計
a
c
$n_1$
b
d
$n_2$
$m_1$
$m_2$
n
成功の確率の差について,Wald検定の検定統計量は,
$$
\begin{aligned}
U_0 &= \frac{(a/n_1 - b/n_2)}{\sqrt{(m_1/n)(m_2/n)(1/n_1+1/n_2)}}\\
&= \frac{n(n_2a-n_1b)}{\sqrt{n_1 n_2 m_1 m_2}}
\end{aligned}
$$
と表せる.これは正規近似を使った検定統計量なので両側検定のときは $U_0^2$ としてカイ二乗分布を利用してもいい(標準正規分布に従う確率変数の2乗が従う分布は自由度1のカイ二乗分布).
一方,分割表の独立性のカイ二乗検定の検定統計量は,独立性を仮定したときの分割表の理論度数が,
成功
失敗
合計
$n_1m_1/n$
$n_1m_2/n$
$n_1$
$n_2m_1/n$
$n_2m_2/n$
$n_2$
$m_1$
$m_2$
$n$
なので,
$T_0 = T_{11} + T_{12} + T_{21} + T_{22}$
である.各項を展開して整理すると,
$$
\begin{aligned}
T_{11}&=\frac{(a-n_1m_1/n)^ 2}{n_1m_1/n} \\
&= \frac{(n a - n_1m_1)^ 2}{nn_1m_1} \\
&= \frac{( (n_1+n_2) a - n_1m_1)^ 2}{nn_1m_1}\\
&= \frac{(n_2 a - n_1b)^ 2}{nn_1m_1},
\end{aligned}
$$
$$
\begin{aligned}
T_{12} &=\frac{(c-n_1m_2/n)^ 2}{n_1m_2/n}\\
&= \frac{(n c - n_1m_2)^ 2}{nn_1m_2}\\
&= \frac{( n(n_1-a) - n_1m_2)^ 2}{nn_1m_2} \\
& =\frac{( m_1n_1-an)^ 2}{nn_1m_2}\\
& = \frac{( m_1n_1-a(n_1+n_2))^ 2}{nn_1m_2}\\
& =\frac{(n_2 a - n_1b)^ 2}{nn_1m_1},
\end{aligned}
$$
$$
\begin{aligned}
T_{21} &=\frac{(b-n_2m_1/n)^ 2}{n_2m_1/n}\\
&= \frac{(n b - n_2m_1)^ 2}{nn_2m_1}\\
&= \frac{( (n_1+n_2) b - n_2m_1)^ 2}{nn_2m_1}\\
&= \frac{(n_2 a - n_1b)^ 2}{nn_1m_2},
\end{aligned}
$$
$$
\begin{aligned}
T_{22}&=\frac{(d-n_2m_2/n)^ 2}{n_2m_2/n} \\
&= \frac{(n d - n_2m_2)^ 2}{nn_2m_2}\\
&= \frac{( n(n_2-a) - n_2m_2)^ 2}{nn_2m_2} \\
&=\frac{( m_1n_1-an)^ 2}{nn_2m_2}\\
&= \frac{( m_1n_1-a(n_1+n_2))^ 2}{nn_2m_2}\\
&=\frac{(n_2 a - n_1b)^ 2}{nn_2m_2},
\end{aligned}
$$
なので,
$$
\begin{aligned}
T_0&=\frac{(n_2 a - n_1b)^ 2}{nn_1m_1}+\frac{(n_2 a - n_1b)^ 2}{nn_1m_2}+\frac{(n_2 a - n_1b)^ 2}{nn_2m_1}+\frac{(n_2 a - n_1b)^ 2}{nn_2m_2} \\
&= (n_2m_2+n_2m_1+n_1m_2+n_1m_1)\frac{(n_2 a - n_1b)^ 2}{nn_1m_1n_2m_2}\\
&= (Nm_2+Nm_1)\frac{(n_2 a - n_1b)^ 2}{nn_1m_1n_2m_2}\\
&= \frac{n(n_2a-n_1b)^ 2}{n_1 n_2 m_1 m_2}
\end{aligned}
$$
となり, $U_0^2$ と $$T_0$$ は一致する.