見出し画像

【統計学】検定統計量をマスターしよう

統計検定2級・準1級の試験に必ず出てくる仮説検定の問題ですが、その問題を解くためには検定統計量を算出できる必要があります。
そして、一通り、勉強した人なら実感できると思うのですが、この検定統計量には、一定のパターンがあります。

試験は時間が限られており、理論的な理解から記憶を辿るとどうしても時間がなくなってしまいます。

頭の整理のためにも、これらのパターンを覚えてしまうのが早いと思いますので、(自分のためにも)整理していきたいと思います。


検定統計量って何?


仮説検定の問題を解くにあたり、後ろから考えてみましょう。

仮説検定は、帰無仮説と対立仮説をたてて、帰無仮説が棄却できるかどうかを検定する問題でした。

したがって、最終的には、帰無仮説の棄却限界値(有意水準)を考える必要があります。

この棄却限界値と比較するためには、正規分布やt分布など、何らかの確率分布(付表にある確率分布)を想定する必要があります。

与えられた問題の事象から、何がどのような確率分布に従うかを考える必要があり、この「何が」にあたる部分が検定統計量となるわけです。


標本1つの平均の検定(分散が既知の場合)


こちらは、z検定ですね。
母集団は平均μ、分散 $${σ^2}$$に従うとします
標本平均は、平均μ、分散$${\frac{σ^2}{n}}$$の正規分布に従いますので
検定統計量は、

$$
 Z = \frac{\bar{X} - μ}{σ/\sqrt{n}}  
$$

となります


標本1つの平均の検定(分散が未知の場合)


いわゆる分散が未知の正規分布の平均の検定になります。
まず、分散が未知なので、標本分散(分散の不偏推定量)を用いることになります。

標本分散は、

$$
s^2 = \frac{\sum_{i=1}^n(X_i - \bar{X} )}{(n-1)} 
$$

となります。
そして、検定統計量は、

$$
t = \frac{\bar{X} - μ}{s/\sqrt{n}} 
$$

となります。
検定統計量t は、自由度n-1のt分布に従います。
z検定に似ていますね。
注意すべきは、標本分散を使っているのですが、検定統計料においては分母を$${\sqrt{n}}$$で割ることですね。


標本2つの平均の差の検定(分散が既知の場合)

検定統計量は、

$$
Z = \frac{\bar{X_a} - \bar{X_b}-(μ_a - μ_b)}{\sqrt{\frac{σ_a^2}{n_a}+ \frac{σ_b^2}{n_b}}} 
$$

となります。
帰無仮説$${μ_a = μ_b}$$の時は、分子の$${(μ_a - μ_b)}$$がゼロになりますね。


なお、分散が異なる場合には、平均の差を検定する意味があるのか?という問題があります。これをベーレンス・フィッシャー問題といいます。


標本2つの平均の差の検定(分散が未知の場合)


まず、分散が未知なので、標本ごとの標本分散$${S_a^2, S_b^2}$$を考えます。

標本分散はそれぞれ、$${S_a^2=\frac{1}{n_a-1} \sum_{n=1}^n(X_ai -\bar{X_a}), S_b^2=\frac{1}{n_b-1} \sum_{n=1}^n(X_bi -\bar{X_b})}$$となります。

ここで、母分散$${σ_a^2 = σ_b^2 = σ^2}$$を仮定すると、二つの標本をプールした標本分散で表すことができます
プールした標本分散は、

$$
s^2 = \frac{(n_a-1)S_a^2 +(n_b-1)S_b^2}{n_a + n_b - 2}
$$

となります。
検定統計量は、

$$
T = \frac{\bar{X_a} - \bar{X_b}-(μ_a - μ_b)}{s\sqrt{\frac{1}{n_a}+ \frac{1}{n_b}}} 
$$

となります。
検定統計量Tは、自由度$${n_a + n_b -2}$$のt分布に従います。


標本1つの分散の検定

平均μは未知で、分散$${σ^2 = σ_0^2}$$と仮定します。
検定統計量は、

$$
V = \frac{(n-1)S^2}{σ_0^2} = \frac{\sum(X_i - \bar{X})^2}{σ_0^2} 
$$

となります。
検定統計量Vは、自由度n-1のカイ二乗分布に従います。

標本2つの分散の検定


平均$${μ_a,μ_b }$$は未知とし、分散$${σ_a^2 = σ_b^2}$$と仮定します。
検定統計量は、

$$
F =\frac{ \frac{\sum(X_a - \bar{X_a})^2} {(n_a-1)}}{\frac{\sum(X_b - \bar{X_b})^2}{(n_b-1)}} =\frac{s_a^2}{s_b^2}
$$

となります。
検定統計量Fは、自由度$${(n_a-1, n_b -1}$$のF分布に従います。

勉強頑張りましょうね!


この記事が気に入ったらサポートをしてみませんか?