見出し画像

1.データの種類

統計学で扱うデータはその性質に応じて「測定したもの」か「数え上げたもの」のどちらかに分けられます。そして、このようなデータの種類に基づいて、データを分類する指標のことを「尺度」と呼びます。

データの尺度には、計量値(量的データ)と計数値(質的データ)の二つの主要なカテゴリーがあり、それぞれのカテゴリーには、計量尺度、順序尺度、順序分類尺度、名義尺度といったサブカテゴリーが存在します。

また、計量尺度は、その性質によって比例尺度と間隔尺度に分類されます。比例尺度は絶対0点(下限値として設定可能な数値0)を持ち、数値の比率が意味を持つ尺度です。一方、間隔尺度は絶対0点が存在せず、数値の間隔が均等である尺度です。このように絶対0点の有無が、計量尺度を細分化する基準となります。

統計解析はこのような尺度に基づいて行われ、正確で信頼性のある結果を得るためには、データの尺度に合わせた適切な統計解析の手法を選択する必要があります。

(図表.データの尺度)

計量値

・計量尺度(比例尺度)

比例尺度は絶対0点が存在することで四則演算が可能となり、比率を正確に計算することが特徴です。例えば、体重が10kgであれば体重が5kgのものよりも2倍重いと言えます。また、体重0kgは物体が存在しない状態を指し、体重0kgが絶対0点に該当します。

・計量尺度(間隔尺度)

間隔尺度では、相対的な大小関係や差は意味を持ちますが、比率に関する演算はできません。例えば、摂氏温度では数値間の差が均等です。10度と20度の差は10度であり、30度と40度の差も10度です。

また、摂氏温度の0度は凍結点を示していますが、マイナスの温度(-10度や-20度など)も存在するため絶対0点は存在しません。そのため、20度と10度では20度の方が温かいと言えますが、40度と20度では40度の方が2倍温かいとは言えません。

・順序尺度

順序尺度は、データを順序付けることができる尺度であり、順序関係が存在しますが、数値の差や比率には意味がありません。

アンケートの満足度を考えると、「非常に不満足」「不満足」「普通」「満足」「非常に満足」のように順序が定義されています。この順序に基づいて、回答者の満足度を比較することができます。例えば、「非常に不満足」と「満足」を比較すると、「非常に不満足」の方が低い満足度を示しています。

しかし、順序尺度では「不満足」と「普通」の差が、「満足」と「非常に満足」の差と同じだと言うことができないように、数値の差や比率には意味がありません。順序尺度は順序関係のみが意味を持ち、数値の差や比率は相対的な順序にしか言及しません。

計数値

・順序分類尺度

順序分類尺度は、データを順序付けることができ、かつ、大小関係がある尺度です。

例えば、マラソンの競技者が1位から10位までの順位をつけられた場合、1位が最も優れていると考え、順に2位、3位と続くように、順序が明確に定義されています。この順序に基づいて、各選手の相対的な競技力を比較することができます。

しかし、順序分類尺度では順序関係しか考慮されず、1位と2位の差と、2位と3位の差が同じとは言えないように、数値上の順位の差や比率には意味がありません。順序分類尺度は順序の大小関係のみが重要です。

・名義尺度

名義尺度は、データを異なるカテゴリーに分類する尺度であり、カテゴリーごとに異なる名前があります。しかし、順序や数値の大小には意味がない特徴を持っています。

血液型においては、「A型」「B型」「AB型」「O型」などのカテゴリーが存在しますが、「A型」が「B型」よりも優れているといった比較ができないように順序は定義されていません。

名義尺度では、データを異なるグループに分類することが目的であり、それぞれのカテゴリーが同じ価値を持っています。順序や数値の大小には意味がなく、単に異なるグループに分けるためのラベルとして使用されます。


この記事が気に入ったらサポートをしてみませんか?