見出し画像

尤度とは何でしょう ~What Is This Thing Called "Likelihood"~

はじめに

統計学の本を見ていると"尤度(ゆうど)"とか"対数尤度(たいすうゆうど)"という言葉が出てくることがあります。心理学の研究で普通にデータを分析している分には、そこまで意識する必要はないのかもしれませんが、なんとなく気になる言葉ではあります。今回は"尤度"について、具体的な例を使って、できるだけ直感的に説明して行きたいと思います。

テストの結果によるグループ分け

尤度の利用場面として、次のような例を考えます。

大学生向けの英語のクラスで、レベル分けのために10問で構成された英語テストを実施した.
結果を使って受講者を「上級」と「通常」の2つのクラスにわけたい.
合計点を使ってクラス分けをしてもよいが,できれば去年実施した同じ問題項目で構成されたテストのデータを活用したい.
どんな方法が適切か.

手始めに、去年のデータについて各問題のレベル別の正解率を表にまとめます。

画像1

上の表から、去年は、たとえば項目1について「上級」レベルでは70%、「通常」レベルでは60%の人が正解したことがわかります。

さて、ある学生Aの、この10項目に対する回答の正誤を判定したところ、次の表のようだったとします。

画像2

この正誤データから、学生Aが「上級」か「通常」か判定する、というのが、いま考えたい問題です。

そこで、仮に学生Aが「上級」だとしたら、上表のような正誤データが得られる可能性はどのくらいか計算してみます。
この際に、項目1から項目10のテスト問題は、次のような特別な関係をもつものは存在しないか、もし存在したとしても、その影響が小さく、項目が互いに独立していると仮定できる状態だとします(局所独立)。

・数学の問題でよく見られるように、1番目の問題の回答を使って2番目の問題に回答するというような形で回答が従属関係にある(1番目が間違いなら2番目も必ず間違いになる)問題がない。

・国語の問題でよく見られるように、1番目から5番目の小問が一つの長文に紐付いているというように、テスト全体の中で他よりも関係性の強い問題項目のグループのようなものが存在しない。

最初の表から、レベルが「上級」の場合、1番目の項目に正解する確率は0.70、2番目に正解する確率は0.58でした。
3番目の項目に対する回答は誤答(✕)ですが、回答には正解と誤答の2パターンしかないので、この確率は 1から正解の確率0.35を引いて0.65 だと考えられます。
他の項目についても、同じように考えていくと、10項目に全体に対して学生Aの回答が得られる可能性は、

【レベルが仮に「上級」の場合】
 0.70 ✕ 0.58 ✕(1-0.35)✕(1-0.30)✕(1-0.25)✕ 0.73 ✕ 0.56 ✕ 0.75 ✕ 0.78 ✕ (1-0.40)= 0.020

となります。
(ここで、項目別の正解確率が単純な掛け算となるために、先程の独立性の仮定が必要になってきます)
同様に、学生のレベルが「通常」だとすると、

【レベルが仮に「通常」の場合】
 0.60 ✕ 0.57 ✕(1-0.18)✕(1-0.17)✕(1-0.14)✕ 0.63 ✕ 0.43 ✕ 0.55 ✕ 0.70 ✕ (1-0.20)= 0.004

最終的な計算結果は、学生のレベルが仮に「上級」だとすると0.020、「通常」だとすると0.004になりました。この結果から、この学生は「上級」である相対的な可能性がかなり高く,「上級」と判定して問題ないといえそうです。

実は、いま見てきた一連の推論の流れが最尤法と呼ばれるものです。学生のレベルを「上級」だと仮定した場合の計算結果0.020や、「通常」だと仮定した場合の計算結果0.004が尤度です。また、この値について対数(log)を取ったものが対数尤度です。対数を取る理由は、途中の計算において、いろいろメリットがあるためです。

尤度は『未知のパラメータ(ここでは学生のクラス)が"ある値(上級 or 通常)"だと仮定した場合にデータが得られる可能性』を計算したもので、アイデア自体はとても自然なものだと思います。

普通は「テストの合計点を利用してクラスを決める」というように、テストの結果⇒クラスわけの方向で物事を考えますが、尤度を使うときは仮の所属クラス⇒テストの結果が得られる可能性という方向で、通常とは逆向きにデータを取り扱うところが特徴です。

この記事が、少しでも参考になりましたら幸いです。

普段、テスト理論とよばれる統計的な手法を応用した学力テストや心理尺度の開発、マーケティングデータの分析、社会人の方向けの統計の教育などに取り組んでいます。こちらのページに、統計やデータサイエンス、テストの開発についてよくいただくご質問に対する説明や、自分自身が疑問に感じた事柄を少しずつシェアしていきたいと思います。

この記事が気に入ったらサポートをしてみませんか?