見出し画像

統計の為の平均

今回から統計学の為のpythonについて書いて行きたいと思います。
数年前からAI、機械学習、統計学というワードが流行りだしました。

大学なら統計学は教養学問としてどの学部にも存在しているのでは無いでしょうか?

私が所属している商学部にも統計入門からマーケティングリサーチといった統計学に関わる学問がいくつもあります。

周りの学生を見ていても標準偏差でわからなくなったり、記述統計までは理解できたのに確率、推測統計で脱落している人がかなりの数いました

そこでpythonというプログラミング言語を使って少しでもそういう人の役に立てればと思っています。(もちろんプログラミングというものを触ってみたいという人もぜひ!!!!)

今回からの記事は、プログラミングってどうやって勉強したらいいの??という声がかなり上がっていたので書くことを決めました。

プログラミングを触ってみよう!!!

早速プログラミングを触ってみましょう。

プログラミングというと「難しそう」と思われがちですが、全くそういうことはありません!!
全てGoogle のツールを使います!
(わからなくなったら
https://www.codexa.net/how-to-use-google-colaboratory/
のサイトを参考にしてください)

まずは、Google Colaboratoryというサイトに行ってください!アカウントが無い場合は作成してください!

Google アカウントが無い方へ!
https://support.google.com/accounts/answer/27441?hl=ja

そうすると

このような画面が出てきたでしょうか?

ここで左上の「ファイル」というボタンをクリックしてください。

新しいpython3ノートブック」をクリックすると。。

というページへ飛びます!

これでプログラミングができる環境が整いました!


では、コードを打ち込んでいきましょう。

実行するときは「Shift  と Enter」を同時に押してください。

import scipy as sp
data = [1,2,3,4,5,6,7,8,9]

import scipy はそのままの意味でscipyというライブラリを呼ぶことにより関数を使えるようにしています。as sp はscipy を spと呼ぶということを示しています。

次の dataは、 dataに1~9の数字を格納したということです。

ブロックの下の方にカーソルを持っていくと「+ CODE」というボタンが出現するので押してください。

すると新しいブロックが出現するので今度は

data

と打って、また「Shift と Enter」で実行してください。

すると

data という中に1〜9の数字が入っていることを確認できます。

さて、次に本題であるdataの平均値を確認します。

sp.mean(data)

というコードを打ってください。

5.0という数字が返ってきました。

これがdataの平均値です!

本当に平均値なのか確認してみます。(これは実行しなくても大丈夫です)

1~9までを足してみます。45になります。
それを9で割ります。
すると sp.mean(data) と同じ 5.0 が返ってきました。

平均

平均は、生活でもよく使われるます。
全てを足して割るという単純な計算です。

計算式はこのようになっています。


平均はよく使われていますが、中央値との見方に気をつけないといけません。例えば、

このような日本の所得分布があります。
平均値は、547万ですが、中央値は427万です。

つまり、日本のお金持ちに引っ張られていて平均値は547万と高いように見えるが中央値は427万なので半分の人が年収427万円以下です。

「平均値だから皆そのくらいだろう」と思ったら間違いです。
グラフの通り、一番多いのは200~300万の人です。

まとめ

今回は、平均についてでした。
次は分散や標準偏差あたりを書きます。


この記事が気に入ったらサポートをしてみませんか?