統計学を全然知らない化学屋が統計検定1級を受けた話

はじめに

タイトルの通りです。
統計検定1級の受験体験記はもう既に色々ありますが、こういうのはあればあるだけいいと思っているので。
受験当日に思ったことを書きなぐるスタイルなので読みにくいですがそこはご了承ください。(あとnote書くの初めて)

筆者のバックグラウンド

学習の参考になると思うのでざっくり書いておきます

学歴

工学部化学系の修士卒
専門は有機合成でした。つまり統計どころか数学からっきしです(有機化学者は四則演算よりも難しい計算ができないため)

背景知識

一応学部の教養で微積線形代数は学びましたが、線形代数は単位を落としっぱなしで卒業しました。これが後々響いてくるのですが後述
統計学は全くの無知で、強いて言うなら量子論で「密度関数と変数をかけて積分すると期待値になる」くらいの知識は知っていたくらい

今やってること

企業で相変わらず化学やってます(具体的な話は省略)
有機合成やってた頃よりはデータを弄る機会が多くなりました

受験に至った経緯

前述のとおりデータを扱う仕事が多くなったのに統計の知識が全くなく、「この処方ってちゃんと有意差ある?」とか「実験計画法って聞いたことあるけどあれ使えねえかな」と感じる機会が業務上多くなりました。
さらにDXやらMIやらIoTでビッグデータをディープラーニングやらの波が押し寄せてきており、この辺の知識を今一度ちゃんと取り入れるためにも基本的な統計の知識が欲しいなと思ったので受験を決意したのが去年の暮れぐらいだったと思います。

受験勉強について

期間

前述のとおり昨年末くらいに思い立ったのでそこから動き始めました。
と言っても実は最初は2級くらいから始める予定だったので、2級の公式テキストを暇なときに読み込むくらいでした。

ただこの教科書、よく言えばコンパクト、悪く言えば説明不足な面があり、独学だとどうもキツいなと感じていました。
なので東京大学出版会の『統計学入門』(通称赤本)を読み始めたのですが、読んでるうちに「この知識使うなら最初から1級で良くね?」となりました。今年の3月くらいですね。というわけで1級を意識した勉強自体はこの頃から始めたことになります。

使った教材

2か月くらい前述の『統計学入門』を手動かしながら読んでいました。試験直前でも読んでいたのでやはりこういう基礎を抑えた教科書は必須ですね。そんなに難しくなく説明も丁寧なのでおすすめです。章末問題の具体的なデータに若干時代を感じますが。

その後2か月くらいは同じく東京大学出版会の『自然科学の統計学』(通称青本)を読み進めていました。赤本をもうちょっと掘り下げたような内容です。特に5章の適合度検定についての記述には大変お世話になりました。結局過去問解くときも適合度検定に関してはここを参照にすることが多かったです。逆に2章の線形モデルについては急スロットルでガチガチの線形代数が展開されてついていけず、3章の分散分析・実験計画法関連は器用貧乏な印象を受けました。これの7章まで読み進めました。

これだけでも基礎的な部分は抑えられたのですが、仕上げの部分で『現代数理統計学』を読みました。「統計検定1級 教科書」とかで調べると『現代数理統計学の基礎』と並んで推奨されていると思いますが、実際良い教科書だったと思います。特に検定論に関しては非常に丁寧に論述されていると思います。実験データを扱うことを考えるとここの知識はしっかり持っておきたいですからね。試験の面でもネイマン・ピアソンの補題を使った最強力検定の組み立てなんかはよく出ますし。これも9月半ばごろまで手を動かしていました。

あとは線形代数の知識が圧倒的に不足していたので↓の記事で紹介されていた『統計のための行列代数 上』も手元に置いて必要に応じて参照していました。これはやっておいてよかったと思っています

9月下旬以降はひたすら過去問を解いていました。あればあるだけいいので2012年~2022年の過去問をあらかた買いました(なぜか2016/2017だけ抜けていました)。3周ずつくらいはしたと思います。

勉強のポイント

他の様々な体験記で言われていますが、とにかく確率分布の取り扱いがすべてだと思います。以下具体的に本番までにやれておきたい事項を挙げます
・有名な分布について確率関数・密度関数、期待値、分散を書き下せるようにする
・期待値、分散は定義に従った方法と母関数を使った方法で導けるようにする
・分布関数から特定の確率を求められるようにする
・条件付き確率や条件付き分布を計算できるようにする
・変数変換で新たな確率分布を組み立てられるようにする

実際筆者が受けた2023年は統計数理・統計応用ともに確率分布をこねくり回す問題が多かったです。なんかひたすらモーメント関数導出してた気がします。微積分のオンパレードで「これ本当に統計学なのか?」と疑いたくもなりますが、日本統計学会が毎年出すのがこれということはそれだけ重要ということなのでしょう。そう信じましょう。

それから点推定も毎年出ています。不偏推定量の定義はもちろんのこと、UMVU推定量の定義や求め方なども抑えるべきです。最尤推定量はとにかく微分です。計算速度と精度を高めましょう。

あとは検定論もしっかりやるのが良いと思います。実用的ですし。基本的なスチューデントのt検定はもちろんのこと、カイ二乗分布を使った適合度検定や尤度比検定、さらにはそもそもどのような検定が望ましいか、それはどのようにすれば組み立てられるのかといった、単に使うだけに留まらない知識が必要です。どのような検定問題であればどの程度強い検定を組み立てられるのかについては自分の中でしっかり整理するのがいいと思います。筆者はマップのようなものを作って関係性を頭に入れました。

試験のテクニックのような話をすると、自分の得手不得手を把握するのが大事だと思います。筆者の場合行列の計算に難があった(なんせ線形代数の単位を落としてる)ので、線形モデルの絡む問題はできるだけ避けようと考えていました。過去問を解いてその辺つかむといいと思います。

実際に受験してみた感想

受験日まで

感想というかアドバイスになります。
申し込みは9月頭から始まりました。1か月くらい期間はありますが、早めに申し込んでおきましょう。
受験票は11月頭と知らされていましたが、10月終わりごろに来た記憶があります。統計数理と統計応用で受験票が分かれており、どちらも受ける人は2枚来ます。またそれぞれに30×24 mmの顔写真が必要なので用意しておきましょう。
それから電卓は関数電卓不可です。100均で適当に買いましょう。筆者は持っていきましたが使いませんでした。

受験当日

受験地が遠かったので早起きして行きました。もうちょっと会場増やしてください。
今年は寒くなるのが早く、防寒ばっちりで臨みました。会場は多少温かいだろうと高を括っていたら暖房が全然聞いておらず終始震えながら解答していました。カイロとか持っていけばよかったかな。
当日はそこまでがっつり勉強するつもりはなかったので、まとめノート+過去問演習ノートを入れたiPadと『現代数理統計学』だけ持っていきました。ただ昼に統計応用の問題傾向を改めて確認したくなったので、最近の過去問くらいは持って行ってもよかった気がします。
あと余談ですが、受験層はびっくりするくらい「理系」です。なんだか大学時代を思い出して懐かしくなりました。そんなにピリピリした雰囲気というわけでもなかったので気楽にやれました(欠席も3割くらいいましたし)

試験の感想・手ごたえ

統計数理

基礎からしっかりやっていたつもりなので自信はありましたが想定以上に解けたと思います。開始後すぐに問題をパラパラ見て、問4,5が時間かかりそうと判断して問1,2,3に絞ったのですが、微積ガリガリやってれば6,7割は解ける構成だったと感じました。問1は(5)(6)以外解答、問2は完答、問3は(5)だけ一部解答、それ以外は全部解答という感じでした。結構手ごたえあります。

統計応用

もうちょっと応用っぽいのが出るかと思いきやこちらもガリガリに計算させられました。問1が線形モデルなので飛ばして問2から始めたのですが、レイリー分布の扱いに慣れておらず30分くらい時間を溶かした挙句ほとんど解けませんでした。仕方がないので問3を雑に3/4問解答し、苦手な線形モデルとはいえトータルで解く量が少なくなりそうな問1を選択しました。ただ焦ったせいで計算ミスがちょいちょい出てきてしまいました。正直ここはダメだったんじゃないかな…と思っています。

全体通して、強みと弱みがはっきり出る試験になってしまったと思います。自己採点はしてませんしするつもりもないですが、応用は落ちたかな~という手ごたえです。

まとめ

受験日の勢いで統計検定1級の体験記(と助言のような何か)を書いてみました。似たようなバックグラウンドの人に刺されば、という思いで書いてみたので、ぜひ参考にしてください。Twitter(一部の人がXと呼ぶもの)で聞いてくれれば勉強にあたってアドバイス等もできると思います。

結果ですが、1か月後に出るのでその時はここに書いておこうと思います。まー多分ダメっぽいんですが。結果を問わずこの後は全然勉強できていなかった実験計画法とか機械学習をしっかりやっていきたいと思います。

追記(12/21)
合格発表出てました
数理、応用ともに不合格でした、残念!
自分でもまだまだ理解不足だなと思う点が多いので、また来年リベンジします

追記(2024/1/3)
結果通知書が届いていたのですが、数理は合格していました。
webの発表で番号見落としてたのかな…
応用は不合格者上位20~40%という何とも言えない位置で落ちていたので、
引き続き合格目指していきます。

この記事が気に入ったらサポートをしてみませんか?