見出し画像

母分散の検定の検定統計量の証明

はじめに

母分散の検定の検定統計量は$${s}$$を不偏分散とすると

$$
\begin{aligned}
V &= \frac{(n - 1) s^2}{\sigma^2} \\{}\\
& =   \frac{\sum_{i} (X_i - \bar{X})^2}{\sigma^2}
\end{aligned}
$$

と表される

なんでこんな形になるか証明することで
丸暗記しなくても検定統計量を覚えることができるので
今回はこの検定統計量を例題も踏まえて証明していく

また検定統計量のざっくりイメージだけ知りたい場合は下記を参照

今回の仮定

t検定みたいに一般的な仮説検定だと確率変数は正規分布に従っているが
母分散の検定でも確率変数が正規分布に従っている

$$
\begin{aligned}
X \sim N(\mu, \sigma)
\end{aligned}
$$

またこの確率変数を標準化すると、
確率変数は標準正規分布に従う

$$
\begin{aligned}
\frac{X - \mu}{\sigma} \sim N(0, 1)
\end{aligned}
$$

この標準化された確率変数の二乗和は$${\chi^2_{n}}$$分布に従う

$$
\begin{aligned}
\sum_{i} \bigg(\frac{X - \mu}{\sigma}\bigg)^2 \sim \chi^2_{n}
\end{aligned}
$$

また見方を変えると、
$${\frac{X - \mu}{\sigma}}$$の二乗和が$${\chi^2_{n}}$$分布に従うので
$${\frac{X - \mu}{\sigma}}$$自体は分布の再生性により$${\chi^2_{1}}$$分布に従う

検定統計量の証明

まず検定統計量の式からはじめる
これを仮定で述べた確率分布の確率変数の形に変形していく

$$
\begin{aligned}
V &= \frac{(n - 1) s^2}{\sigma^2} \\{}\\
& =   \frac{\sum_{i} (X_i - \bar{X})^2}{\sigma^2} \\{}\\
& =   \frac{\sum_{i} (X_i - \mu - (\bar{X} - \mu))^2}{\sigma^2}\\{}\\
& =   \frac{\sum_{i} (X_i -\mu)^2 - 2\sum_{i}(X_i - \mu)(\bar{X} - \mu) + \sum_{i}(\bar{X} - \mu)^2}{\sigma^2}\\{}\\
& =   \frac{\sum_{i} (X_i -\mu)^2 - 2\sum_{i}(X_i - \mu)(\bar{X} - \mu) + \sum_{i}(\bar{X} - \mu)^2}{\sigma^2}\\{}\\
& =   \frac{\sum_{i} (X_i -\mu)^2 - 2(n\bar{X} - n\mu)(\bar{X} - \mu) + n(\bar{X} - \mu)^2}{\sigma^2}\\{}\\
& =   \frac{\sum_{i} (X_i -\mu)^2 }{\sigma^2} - \frac{n(\bar{X} - \mu)^2}{\sigma^2}\\{}\\
& =   \frac{\sum_{i} (X_i -\mu)^2 }{\sigma^2} - \bigg(\frac{\bar{X} - \mu}{\sqrt{\frac{\sigma^2}{n}}}\bigg)^2\\{}\\
\end{aligned}
$$

また仮定の章で述べていたように

第1項の$${\frac{\sum_{i} (X_i -\mu)^2 }{\sigma^2}}$$は$${\chi^2_{n}}$$に従う

また第2項の$${\bigg(\frac{\bar{X} - \mu}{\sqrt{\frac{\sigma^2}{n}}}\bigg)^2}$$は$${\chi^2_{1}}$$に従うので

$$
\begin{aligned}
V &= \frac{(n - 1) s^2}{\sigma^2} \\{}\\
&= \cdots \\{}\\
& =   \frac{\sum_{i} (X_i -\mu)^2 }{\sigma^2} - \bigg(\frac{\bar{X} - \mu}{\sqrt{\frac{\sigma^2}{n}}}\bigg)^2\\{}\\
& \sim   \chi^2_{n} - \chi^2_{1}\\{}\\
& =\chi^2_{n - 1}
\end{aligned}
$$

となるので確かに検定統計量が
自由度がn-1の$${\chi^2}$$分布に従っていることがわかった

検定統計量のイメージ

証明が追えたのでここから
なぜ母分散の検定統計量が自由度がn-1の$${\chi^2}$$分布に従っているか
丸暗記なしのイメージで解説していく

まず、標準化した確率変数(標準正規分布に従う)を考える

$$
\begin{aligned}
\frac{X_i - \mu}{\sigma} \sim N(0, 1)
\end{aligned}
$$

これを二乗して$${\chi^2_{1}}$$にする

$$
\begin{aligned}
\bigg(\frac{X_i - \mu}{\sigma}\bigg)^2 \sim \chi^2_{1}
\end{aligned}
$$

これを和にして、再生性により$${\chi^2_{n}}$$にする

$$
\begin{aligned}
\sum_{i}\bigg(\frac{X_i - \mu}{\sigma}\bigg)^2 \sim \chi^2_{n}
\end{aligned}
$$

母平均はわかっていないことが普通なので
$${\mu}$$を$${\bar{X}}$$にすることで
自由度を1減らすことができるので$${\chi^2_{n - 1}}$$となる

$$
\begin{aligned}
\sum_{i}\bigg(\frac{X_i - \bar{X}}{\sigma}\bigg)^2  = \frac{(n - 1) s^2}{\sigma^2} \sim \chi^2_{n - 1}
\end{aligned}
$$

この記事が気に入ったらサポートをしてみませんか?