見出し画像

R を使って,「わかる」統計!合格!統計検定4級 データの記述(3)中央値


中央値の計算

中央値とは,測定値を小さい値から大きい値へ並び替えたとき,中央にくる測定値のことをいいます。

以下は,コロナ前のある中学校の1年生の体重です。このデータの中央値を求めましょう。

34, 37, 38, 45, 47, 52, 61

2018年5月に測定された男子中学生の体重(単位はキログラム)

7個の測定値があれば,真ん中は4番目です。この場合,中央値は 45 です。

一般化

それでは,中央値の算出を一般化しましょう。

測定値を変数 n であらわします。

n = 1 の場合

測定値が1個の場合の中央値を考えます。測定値も変数にしましょう。

$${x_{1}}$$

測定値が1個の場合

測定値は1個しかありません。中央に来る測定値は $${x_{1}}$$ になります。

  • n = 1 の場合,中央値に来る測定値は $${x_{1}}$$

n=3 の場合

測定値が偶数の場合,つまり,n=2, n=4, n=6 などの場合は,中央に来る測定値がありません。この場合はどのように中央値を算出するかは後ほど考えましょう。とりあえず,考えやすい,奇数,n=3 の場合を考えましょう。

$${x_{1}, x_{2}, x_{3}}$$

測定値が3個の場合
  • n = 3 の場合,中央値に来る測定値は $${x_{2}}$$

であることは,すぐわかりますね。

n=5 の場合

n=5,つまり以下の場合を考えましょう。

$${x_{1}, x_{2}, x_{3}, x_{4}, x_{5}}$$

測定値が5個の場合
  • n = 3 の場合,中央値に来る測定値は $${x_{3}}$$

となります。

規則性をみつける

これまでの3つの場合を並べて眺めてみましょう。

  • n = 1 の場合,中央値に来る測定値は $${x_{1}}$$,添え字は 1

  • n = 3 の場合,中央値に来る測定値は $${x_{2}}$$,添え字は 2

  • n = 5 の場合,中央値に来る測定値は $${x_{3}}$$,添え字は 3

ここで,変数 n を与えたら,中央値に来る測定値の添え字( 例えば,$${x_{1}}$$の1のこと)が何になるか教えてくれる式を考えてみましょう。

例えば,次のような式を考えることができます。他の式を考えることも,もちろんできます。

$${\frac{n+1}{2}}$$

変数 n に好きな数,つまり測定値の数を入れることで,中央値に来る測定値の添え字の数字を知ることができます。

測定値が奇数の場合は,次のように中央値を求めることができます。

測定値が奇数の場合,$${x_{\frac{n+1}{2}}}$$

次に,測定値が偶数の場合を考えていきましょう。

n=2 の場合

次のような場合です。

$${x_{1}, x_{2}}$$

測定値が2個の場合

この場合,中央に来る測定値がありません。仕方がないので,中央値は,$${x_{1}}$$ と$${x_{2}}$$ の間にあると考えることにします。仮に,次のように求めることにします。

$${\frac{x_{1} +  x_{2}}{2}}$$

測定値が2個の場合
  • n = 2 の場合,中央値に来る測定値は $${\frac{x_{1} +  x_{2}}{2}}$$

n=4 の場合

次のような場合です。

$${x_{1}, x_{2}, x_{3}, x_{4}}$$

測定値が4個の場合

n=2 と同様,次のように中央値を求めます。

$${\frac{x_{2} +  x_{3}}{2}}$$

測定値が4個の場合
  • n = 4 の場合,中央値に来る測定値は $${\frac{x_{2} +  x_{3}}{2}}$$

n=6 の場合

次のような場合です。

$${x_{1}, x_{2}, x_{3}, x_{4}, x_{5}, x_{6}}$$

測定値が6個の場合

n=2, n=4 と同様,次のように中央値を求めます。

$${\frac{x_{3} +  x_{4}}{2}}$$

測定値が5個の場合
  • n = 6 の場合,中央値に来る測定値は $${\frac{x_{3} +  x_{4}}{2}}$$

規則性をみつける

再び,これまでの場合を書き出してみましょう。

  • n = 2 の場合,中央値に来る測定値は $${\frac{x_{1} +  x_{2}}{2}}$$

  • n = 4 の場合,中央値に来る測定値は $${\frac{x_{2} +  x_{3}}{2}}$$

  • n = 6 の場合,中央値に来る測定値は $${\frac{x_{3} +  x_{4}}{2}}$$

規則性を見出すことはできましたか。測定値 n が偶数の場合,n から中央値は次のように求めることができそうです。

測定値が偶数の場合,$${\frac{x_{\frac{n}{2}} +  x_{\frac{n}{2}+1}}{2}}$$

まとめ

以上をまとめると,中央値の求め方は次のように一般化できることがわかります。

測定値が奇数の場合,$${x_{\frac{n+1}{2}}}$$
測定値が偶数の場合,$${\frac{x_{\frac{n}{2}} +  x_{\frac{n}{2}+1}}{2}}$$

特にこの式を覚える必要はありません。中央値は測定値を小さい順に並べたとき,真ん中にくる測定値だと覚えておくだけで十分です。

練習

$${   \lbrace 0, 1, 2, 4, 5 \rbrace  }$$ のとき,中央値を計算しなさい。

答え

測定値の数は 5 です。$${ \frac{5+1}{2}=3}$$ なので,3番目に来る 2 が答えです。

$${ \lbrace 1,  2, 0, 3,5 \rbrace  }$$ のとき,中央値を計算しなさい。

答え

(不安なひとはコメント欄に答えを書き込んでみましょう)

おすすめの書籍

説明がとても丁寧で,あれ,なんでこうなるのかなと不安になることが少ない教科書です。難しいなと思うところもあるでしょうが,ただただ暗記したり手順を覚えているだけで,なんだか統計ってよくわからないなと思っているひとは,何度も読めば,きっと,買ってよかった,読んでよかったと思える,とてもよい一冊です。

この記事が参加している募集

読書感想文

この記事が気に入ったらサポートをしてみませんか?