見出し画像

統計検定2級対策(6月2日週の2問)

Introduction

前回は、点推定量とその良さの考え方について一緒に勉強しました。点推定量は、未知のパラメータを標本から推定する式のこと。その式の良さには「一致性」や「不偏性」などが考えられることを紹介しましたね。

今回は、区間推定を紹介します。区間推定は、興味のある未知パラメータに対して、標本から推定値として妥当そうな値の範囲を計算する方法のことです。

点推定は推定値を1つだけ計算する方法だったので、納得のいかない値が得られるとその後のアクションが難しいところがありました。区間推定では推定値として妥当そうな値の範囲を計算するので、ドメイン知識と比較して妥当そうな値を選ぶことが可能になります!

以下では、区間推定の考え方について、よりじっくり見ていくことにしましょう。少し数学的ですが、区間推定がどういう意味で「妥当そう」な推定値の範囲を計算する方法なのかを考えながら勉強するのが大切です。

§ 1. 母平均の区間推定

早速ですが、以下の問題を考えてみましょう。これは「母平均の区間推定」としてとてもよく知られているものの一つです。

1問目 : あるパン屋さんは一週間の来客数を見積もって事前に作るパンの数の見当をつけようと思っていました。そこで、一週間の来客数が母平均が未知、母分散が250の正規分布に従っているという仮定をおいて、この母平均を推定しようと考えました。次の問いに答えてみてください。

(1) 1週間の来客数の記録を10週とったとき、その標本平均が従う分布を求めてみてください。ここで母平均はμと書いてよいことにします。
(2) (1)の分布の95%範囲を求めてください。
(3) (2)で求めた範囲に標本平均がもし入っていたとしたら、母平均μの値の範囲はいくらでしょうか。標本平均を用いて表してください。
(4) 1週間の来客数の記録を10週とった結果、その標本平均が69[名/週]だったとします。(3)のような仮定をおいたとき、母平均が存在する範囲を求めてください。

(註)実際には、一週間の来客数にはポアソン分布を仮定することが一般的です。今回は、問題を簡単にするために、あらかじめ正規分布を仮定しました。

§ 2. 標本分布と母平均の区間推定

§1で紹介した母平均の区間推定では、母分散の値が分かっているものとされていました。ところが、母分散の値を知っていたり、ばっちり仮定できるケースは稀な話です。そこで、母分散が未知の場合でも、§1のような区間推定を行うことは出来ないのでしょうか。

ここで役に立つのが有名な標本分布たちです。標本分布とは、標本X = (x[1], ..., x[n])によって書ける計算式T(x[1], ..., x[n])が従っている確率分布のことです。一つ例を挙げておきましょう。

ちなみにこの例で書かれている統計量をt-統計量といいます。これを参考に次の問題を解いてみてください。

2問目 : あるパン屋さんは一週間の来客数を見積もって事前に作るパンの数の見当をつけようと思っていました。そこで、一週間の来客数がひとまず正規分布に従っているという仮定をおいて、この母平均を推定しようと考えました。次の問いに答えてみてください。

(1) 1週間の来客数の記録を10週とったとき、そのt-統計量が従う分布を求めてみてください。
(2) (1)の分布の95%範囲を求めてください。なお、t-分布表を調べてもよいことにしましょう。
(3) (2)で求めた範囲に標本平均がもし入っていたとしたら、母平均μの値の範囲はいくらでしょうか。標本平均と不偏分散を用いて表してください。
(4) 1週間の来客数の記録を10週とった結果、その標本平均が69[名/週]、不偏分散は1440[名²/週]ったとします。(3)のような仮定をおいたとき、母平均が存在する範囲を求めてください。

サポートをいただいた場合、新たに記事を書く際に勉強する書籍や筆記用具などを買うお金に使おうと思いますm(_ _)m