Freedmanで統計学を学びましょう Ch.6 測定誤差, Ch.7 座標平面

Freedman Statistics 4th Editionを読んでいくノートです。

第6章は、計測に含まれる誤差について、第7章は、中学数学で習う程度の座標平面の復習です。

まとめ

1. どんなに注意深く測定しても、必ずChance error(偶然誤差)が含まれる。研究者は、測定結果はどの程度の誤差を含むのかを事前に検討した上で、データを使用すべきである。誤差の見積りをするには、測定を繰り返すのがいい
2. 事前に同じ条件で測定した結果から標準偏差を求めることで、どれほどの誤差を含みうるかがわかる。
3. Bias(バイアス)とは、ある測定結果を用いたときに必ず生じてしまう誤差のことで、Systematic Error(システム誤差、系統誤差)とも言う。

観測値 = 真の値 + バイアス + 偶然誤差

4. 細心の注意を払っていても、Outliers(外れ値)は発生してしまうものである
5. 平均やSDは外れ値に強く影響を受け、ヒストグラムは正規分布曲線にうまくフィットしなくなる

議論

同じ条件で同じ重りの重量を同じ計測器で測れば、まったく同じ値になってほしいものです。しかし、現実には厳密に測ろうとすればするほど、測定毎に値がずれてしまいます。それをChance error(偶然誤差)とよびます

Freedman統計学では、National Bereau of Standards(米国国立標準技術研究所)が所有するNB10と呼ばれるニッケルでできた重りを何度も測定した値を用いて、偶然誤差を説明します。彼らの計測結果によると、6マイクログラム(1gの100万分の1)程度の標準誤差があるとのことです。このことから、毎回測り直したときに、多くとも10マイクログラム程度の誤差が含まれるだろうということを事前に見積もることができるようになります。

ただし、必ずしもすべての誤差が6マイクログラムで収まるわけでもありません。必ず、飛び抜けた値、つまり、Outliers(外れ値)も見つかるでしょう。この外れ値を観測した場合の対処について、Freedmanはこう記しています。

調査結果に外れ値があった場合の対応は頭を悩ませる。無視してしまうか、正規分布に従わないことを許容するか。通常の場合、正規分布の扱いやすさの方が優先される。つまり、理論が経験に優るというのだ。

また、同じ誤差は誤差でも、計測毎に混入する偶然誤差とは別に、特定の測定手法がもたらすBias(バイアス、系統誤差)についても、触れられています。こちらは何度計測しなおしても発見できるものではありません。バイアスに慎重になりたい場合には、同じ材料を全く別の測定手法を用いて計測し、結果を比較するしかありません。

第7章は、直交座標(デカルト座標)の説明です。点、直線、直線の傾きなど基本的なことがらのみで、ほとんどの方は中学・高校数学ですでに学習済みだと思います。

今回は、軽めの内容でした。次から、第3部「相関と回帰」に入っていきます。いよいよ統計学らしくなってきます。

この記事が気に入ったらサポートをしてみませんか?