見出し画像

t検定の検定統計量(丸暗記なし)



検定統計量は差を標準化しているだけ

私が最初に統計学を学び始めたとき検定統計量
ウゲって思ったことを思い出した

この式を覚えなきゃいけないなんて
なんてめんどくさいんだ
統計学なんて暗記ゲーやん

$$
t = \frac{\bar{x} - \mu}{\sqrt{\frac{s^2}{n}}}
$$

でもこの$${t}$$値をよくよく見てみると
分子が平均との差
分母が標準偏差になっていることがわかる

つまりこれは持っているデータたちを
平均$${0}$$
分散$${1}$$
に変換する標準化をしているだけである
(標準化について具体例は下記)

https://bellcurve.jp/statistics/course/19647.html

標準化で検定統計量を出す意味

なんでわざわざ検定統計量を出すのかというと
比較したいものとどれだけ差があるかを標準化して
公平に見るためである

例えば帰無仮説を
「50m走のタイムは7秒である」
「ハンドボール投げのスコアは30mである」
の2種類を確かめるとする

今持っている標本100名の平均について
「50m走の標本平均タイムは8秒である」
「ハンドボール投げの標本平均スコアは40mである」

と分かっているとする

単純に帰無仮説との差を取ると
50m走に関しては「1」秒の差
ハンドボール投げに関しては「10」mの差

になるのでハンドボールの帰無仮説の方が棄却されやすい
と決めていいのだろうか?

言い換えれば
ハンドボール投げの10mの違いと
50m走の10秒の違いは同じだろうか?

いや違うことは明白だろう

ということで差を同じ尺度見る必要があるので
平均を0分散を1に変換する標準化をしているのである

検定統計量の具体例

岐阜県のデータによると高校生の

50mの標準偏差は0.5くらいなので
t値は計算すると20になる

$$
t = \frac{8-7}{\frac{0.5}{10}}
= 20
$$

一方ボール投げ標準偏差は6.0くらいなので
t値を計算すると16.6になる

$$
t = \frac{40-30}{\frac{6.0}{10}}
= 16.6
$$

これで50m走とハンドボール投げの帰無仮説との差が
先ほどよりも小さくなり
帰無仮説が棄却されやすく変化した

他の検定統計量のざっくりイメージだけ知りたい場合は下記を参照


この記事が気に入ったらサポートをしてみませんか?