基礎統計② ~推測統計~


以前基本的統計で平均だけでなくバラツキも見ることが大事ということを書きました。(参考)

ほかにも統計データを見るにあたって押さえておきたいポイントがあります。

推測統計のお話です。

何か調査やアンケートをする際、対象全体(母集団)を調査すれば良いわけですが、例えば調査対象が国民全員や20代の男性全員、働いている人全員、全世帯等全部を調査するのはコストがとてもかかるという場合も多いです。

そんな時、一部(標本、サンプル)を調査してそこから全体を推測しようというのが推測統計です。視聴率、内閣支持率等たくさん用いられています。

「たまにこんな少ないデータじゃ当てにならない!」などという人がいます。まあそういう場合もあるにはありますが、はたしてその人はそのあたりの統計の知識をもって言っているのでしょうか?

例えば内閣支持率が50.0%だったとします。じゃあ国民全体(母数)でも50.0%ピッタリかというとそうじゃないかもしれません。全体では49.6%かもしれませんし50.8%かもしれません。いわゆる誤差ってやつですね。わずかな違いって言ってもいいかもしれません。


「推測だから30%とか20%くらいかもしれないじゃないか!」という人がいるかもしれませんが、んーまあそれはないって言っていいと思います。まあ正直私は計算してないですけどね。

結局はサンプルと母集団の数によりますが、誤差はあったとしても大きな差があることはある程度のサンプル数であればほとんどありません。そして大きな差であればあるほどその可能性はゼロ近づいていき、そしてサンプル数が多ければ多いほど、実際との差も限りなくゼロになっていきます。

全員に調査するのは現実的、コスト的に難しい、でも正確性は当然欲しい。その落としどころが標本調査、推測統計といってもいいかもしれません。多少の誤差はあるかもしれないけど誤差±2.0%になってもそれほど問題がないし、±20.0%になることは無いと言っていいし、次回の調査では母数ピッタリや±0.1%とかいう可能性も十分あるわけです。まあ実際その落としどころが難しいこともあるわけですが。


というかそもそも誤差が大きくなるようなサンプル数で視聴率とか内閣支持率とかの大事なデータを取っていたら統計専門の人から総ツッコミが来ることくらい想像できますよね。というか文句言うなら世の中のすべてのアンケートや調査に協力しろよって話で。というかそもそも批判する前にちゃんとした知識身につけてろって話で。


お仕事の依頼お待ちしています!