見出し画像

標本誤差とは? 〜「マーケティングリサーチとデータ分析の基本」の読書メモ 〜

皆様

お疲れ様です。古屋です。

今日は『マーケティングリサーチとデータ分析の基本』という本を読んで、「標本誤差」という言葉を知ったので書き残しておきたいと思います。

なぜこの本を読んだか

『マーケティングリサーチとデータ分析の基本』を読んだ背景としては、仕事でリサーチ関係のことをやりそうだからです。具体的にいうと、サービスの価値を高めるにあたり、ユーザーに関する理解を深めないと、ユーザーに刺さるサービスにできないからです。まだ具体的な調査項目は決まっていませんが、ユーザーの思考・好む・習慣を少しずつ地道にリサーチしていき、新機能の企画やデザイン、CRMの設計に活かしていきたいなと思っています。

とはいえ、リサーチに関してはど素人なので、この本を読んで、基礎知識を身に付けたいと思いました。

標本誤差とは

では、冒頭に書いた「標本誤差」とは何か?(古屋が本から読み取ったことを意訳していると思ってください。もし違ってたらすみません。)

「標本誤差」とは、インターネットリサーチに限らず、標本調査では必ず生まれる誤差のこと。標本調査について分かりやすい説明があったので引用します。

標本調査とは?

統計調査によって何かを調べたい時、例えばある中学校で全校生徒の平均身長を調べたいと思ったら、生徒全員の身長を測って平均を計算すれば正確な結果が得られます。このように、対象となるすべてを調べる調査を「全数調査」といいます。一つの中学校の全生徒の身長を調べることは、それほど大変な手間ではないでしょうが、日本中のすべての中学生の身長を調べるのは大変な手間と費用がかかります。このような場合には、手間や費用を省くために、一部の人だけを選んで調べる方法もあります。このような調査を「標本調査」といいます。

出展:標本調査とは?~調査のしくみと設計~

つまり、一部の人だけの回答なので、一部の人ごとに回答はどうしてもブレてしまうのです。このブレが「標本誤差」です。

では、どの程度の誤差だったらOKなのでしょうか?

この本によると、標本誤差のブレの大きさは「信頼度」によって異なるとのことです。信頼度って何?と思うかもしれませんが、例えば95%の信頼度とは、100回の無作為抽出調査した時に、95回はこの範囲の中に正解があることを指します(100回テストしたら、95回は同じ結果ということ)。そして、一般的には、信頼度は95%が使われてるとのこと。

話を戻して、どの程度の誤差を許容すればいいのかですが、誤差を最大でも±5ポイント程度に抑えると良いとのことです。当たり前ですが、回答者数(サンプルサイズ)が小さいほど、ブレが大きくなってしまうので、±5ポイント程度を実現するためには、回答者数が増やす必要があります。

「じゃあ、どのくらい回答者数を増やせば良いんだよ」という話になりますが、世の中には「標本誤差早見表」というものがあるらしいんです!この早見表に必要なサンプル数が記載されているので、この表を参考しながら回答者数を決めましょう。この本にも、「標本誤差早見表」が載っていて、僕も勉強になりました。(普通に「標本誤差早見表」とググっても見れます!)

以上です。

ユーザーのことを定量的にも、定性的にもより理解できるように、これからも勉強していきます。

ここまで読んでいただき、ありがとうございました!

もし興味があれば、『マーケティングリサーチとデータ分析の基本』も読んでみてください。

この記事が気に入ったらサポートをしてみませんか?