見出し画像

過去問 公認心理師試験第6回 午前 一般問題 問82

みなさん、こんにちは。

公認心理師受験生Kidです。

さて、掲題の通り、問82です。

------------------------------------------------
問82
データ分布の特徴を表す指標のうち、外れ値の影響を受けにくいものとして、最も適切なものを1つ選べ。
① 範囲
② 分散
③ 中央値
④ 平均値
⑤ 標準偏差

------------------------------------------------

正解、 ③です。

選択肢の解説

わかりやすく考えるために③中央値と④平均値を並べて説明します。

選択肢③の中央値は、よく使われる代表値の一つです。

Median(中央値:Me)は、データを大きさの順に並べたときに、ちょうど真ん中に位置する値です。

データが偶数の場合は、真ん中にある2つの数字の平均値を算出し、それを中央値とします。

また、選択肢④の平均値もよく使われる代表値であり、データを全て足して、データ数で割ったものになります。

一般に、平均値の方が全てのデータを結果に反映させているため、中央値よりも平均値の方が「情報をフルに利用している指標」と見なすことができます。

ただし、平均値に偏りがある場合には、中央値の方が有効な代表値になることもあります。

例えば、ある会社の社員9名の年収が400万円として、社長の年収が6400万円だとすると、その会社の平均年収は1000万円となりますが、これはその会社の実態を表しているとは言えないと考えられます。

このように、極端な外れ値が存在したり分布に大きな偏りがある場合、平均値のように「すべての情報をフルに利用している」という特徴が足を引っ張り、実態の姿から遠ざかってしまうということになってしまうわけです。

こういう状況においては、大きすぎる値や小さすぎる値がいくつか含まれていたとしても(要するに外れ値があったとしても)、ほとんど影響を受けない中央値が有効になります。

先の例だと、年収の中央値は400万円になりますから、こちらの方が実態に近く、例えば会社を選ぶ際の有効な指標になりそうです。

以上のように、平均値はよりデータの情報を活用した代表値でありますが、その特性故に極端に小さすぎたり大きすぎたりする値(=外れ値)に足を引っ張られやすく、それによって実態から遠ざかってしまう値が算出されるリスクが大きいといえます。

これに対して、中央値は「大きい順に並べて真ん中を取る」という単純な構造であるが故に、端っこの数字が何であっても影響を受けない(=外れ値を度外視する)という特徴があり、それ故に活用しやすい状況が存在するということになります。

しかし、データによっては「端っこの数字も含めて考えた方が良いもの」もありますから、必ずしも中央値があらゆる状況で平均値に勝るというわけではありません。

あくまでも、現代社会の「世界の富の9割を、1割の人間が占有している」などのようなデータ(=外れ値が存在している。こういう状況での「平均値」は当てにならず、「中央値」が実態を表す)のときに利用価値が上がりやすい代表値が「中央値」ということができます。

以上より、選択肢④は不適切と判断でき、選択肢③が適切と判断できます。

引用URL:https://public-psychologist.systems/16-心理学における研究、心理学に関する実験/公認心理師%E3%80%802023-82/

この記事が気に入ったらサポートをしてみませんか?