見出し画像

統計学とRStudioの組み合わせがやばい

ピースオブケイクでは、週に1度、数学の先生に来ていただいて、勉強会をやっている。ちょうど1年くらい前に有志メンバーではじめて、最初は線形代数、次に微分積分、次に機械学習を学んだ。

それで、いまやっているのは統計学なんだけど、今まででいちばん頭に入りにくい気がする。なんというか、納得感が低いのだ。

もちろん、先生のせいではまったくなく、こちらのレベルの問題なんだけど、入門向けに話してもらうと、いろんな理屈が「天下り」的に降ってくることになる(例:なんで標本のときはn-1で割るの?)。かといってその根拠を、ちゃんと説明してもらうともっとわからない。

ひとつの手は、実用工学として、ツールとして、使い方を覚えて割り切って使うことだろう。たぶん、そうするのが正解なのだと思うけど、その場合でも、ツールの「手触り」を体感して納得してから覚えたい。

と思っていたら、先生に「Rつかえば? 便利だよ」とご紹介いただいた。

RStudioという統合環境があまりにも便利ですばらしい(これがフリーとは、SとSASとMathematicaが怒っちゃうな)。

Rは基本的にデータ分析につかうためのツールなんだけど、統計学を勉強するのにもすぐれている。たとえば、ランダムの数値からその分布のグラフを書いたりすることで、まさにデータの「手触り」を確認することができるのだ。

とうことで、Rで統計を勉強すると、いろいろと実験しながら統計学が覚えられて、ついでにRもわかるようになって一石二鳥で最高だなと思っていたら、まさにそういう主旨の本があった。

Rによるやさしい統計学

年末年始に読んでいたけど、わかりやすい本です。

あと先日、統計家の西内啓さんの有名シリーズの新作をいただいた。

統計学が最強の学問である[数学編]――データ分析と機械学習のための新しい教科書

ぼくらが1年間、さまざまな分野の数学を勉強してきたのは、機械学習とデータ分析のために必要な数学を学ぶためである。本書はちょうどその2分野のために必要な数学を、1冊だけで学ぶことができるのだ。

しかもすばらしいのは、そういう高度な数学を、高校数学の入門レベルから説明してあることだ。方程式とは何か?くらいのレベルからディープラーニングや統計分析に使う数学をぜんぶまとめているのだ。とてもお得な本だと思う。



この記事が参加している募集

コンテンツ会議

読んでくださってありがとうございます。サポートいただいたお金は、noteの他のクリエイターのサポートに使わせていただきますね。