見出し画像

統計検定1級合格体験記

こんにちは、ゆるです。本日は統計学についてではなく、統計検定(仮説検定ではなく英検、漢検といった方の検定です笑)について記事にしたいと思います。特にゆるが統計検定1級合格までに行ったことを書く予定です。

ゆる自身は研究のバックグラウンドが分子生物学だったり、統計数理は1年目に不合格だったりと、決してもともと統計や数学が得意というわけではなかったのでその立場からも皆さんのお役に立てたら嬉しいです!


統計検定とは

この記事を見て頂いている方々には不要かもしれませんが、そもそも統計検定とはという部分に触れたいと思います。統計検定とは日本統計学会が認定を行う資格試験であり、英検や漢検同様、級ごとに試験、認定を行います。国家資格ではなく、民間資格に該当するものですが、統計検定1級、準1級は国内のデータサイエンス関連資格の中でもトップレベルの資格であり、近年注目が集まっています。統計検定のホームページ

を見てみると、例えば、1級は2012年から年1回行われていますが、初年度は200人程度、5年後の2017年は500人程度、そしてさらに5年後の去年は1200人程度といったように受験者が伸びており、データサイエンスの流行の中で今後も間違いなく受験者が増えてくると予想されます。
ゆるは最初から1級を受験したので、本記事では1級のみについて触れる予定です。

統計検定1級

統計検定1級は「統計数理」と「統計応用」から構成されます。共に大問5問から3問を選択する形式になります。また、統計応用の方は分野も選択式であり、「人文科学」「社会科学」「理工学」「医学生物学」から自分に合った分野を1つ選ぶことかできます。ゆるは生物学のバックグラウンドがあったこともあり「医薬生物学」を選択しました。但し、応用はどの分野を選んだとしても、問題の題材がその分野に関連しているだけで、その分野の知識が必要になることはありません。結局は好みになります。

参考書

統計検定1級を受けるにあたり参考にしたのは以下の書籍になります。

1.統計検定公式参考書

1級対応の公式参考書です。統計数理、統計応用共に試験範囲を網羅しているので、これをもとに勉強するのは必須と言っても過言ではないと思います(ただ実際のところ、これの範囲を超える問題も出題されることもあります笑)。また、統計学関連の書籍は数式が並んで読み辛いものが多いですが、この書籍は比較的易しく書いてくれています。しかし数式の行間を読まなければいけないところも少なくないので易しいと言ってもあくまで「比較的」という表現に留めておきます。

2.公式過去問集シリーズ

こちらは公式の過去問集になります。正確にはゆるが買った時には1級・準1級の過去問がまとまったものでしたが、今は1級のみになっている年度もあるようです。実際ゆるは、過去問は1級の問題しか解かなかったのでこちらで大丈夫だと思います。こちらは年度ごとに冊子が分かれているので全部で4~5冊買わなければいけないですが、過去問とその解答解説がついており全て買う価値があります。やはり上記の参考書だけで概念を頭に入れるだけでは理解したとは言えず、実際に手を動かして問題が解けて初めて身につくと思うのでこちらも必須書籍だと言えます。

3.現代数理統計学の基礎

数理統計学の教科書になります。この教科書のすごいところは演習問題の質が非常に高く、量も非常に充実している所です。また問題と解答だけであれば以下のページで見ることもできるのでこちらでも十分かもしれません。以下のページには追加の演習問題もあるので非常に有用です。

公式の参考書を把握して過去問を全て解ける状態であったとしても、試験会場で解けない問題は出てくると思います。そういった問題はこの本の演習問題をやることで確実に減らすことができます。下にも書きますが、ゆるが初年度の統計数理で落ちて2回目に成績優秀者で受かったその最大の違いはこの教科書の演習問題をやったか否か(=それにより理解度が飛躍的にあがったから)であると自信を持って言えます。
一方でこの書籍の内容は決して統計検定の範囲をカバーしているわけではなかったり、逆に問題以外の内容まで読もうとすると範囲外のことも多く書いてあったりするので、あくまで全体的な流れの把握については公式参考書がおすすめです。

4.Rによるモンテカルロ法入門

こちらはモンテカルロシミュレーションについて解説した書籍です。統計検定1級を受ける上では直接は関係しないのですが、モンテカルロ法を使いこなせると統計学の学習の上で非常に有利になります。というのも統計学はイメージしづらい概念がある場合、実際に乱数を回してシミュレーションを行うことで腑に落ちることが多いと感じているためです。
この書籍は全8章構成のうち前半3章が乱数の生成法やその応用例について、後半5章がベイズ統計におけるMCMC(マルコフ連鎖モンテカルロ法)について解説しています。
本格的なMCMCは現段階での統計検定1級の範囲外だと思うので、前半3章を読んでから統計検定の勉強を適宜シミュレーションでサポートしながら行い、合格後、ベイズ統計を学ぶ際に後半5章を読むという使い方であれば無駄のない学習ができると思います。

余談ですが、この本はゆるが統計学にのめりこんでいくきっかけの一つでもあったので、前半3章だけでも読むと統計学の面白さに気づいてしまうかもしれません!
もちろん読み始めた当時はざっくりとしかイメージできず、なんとなく面白いという程度だったと思いますが、根気よく理解しようとすると面白さが見えてくるはずです!

合格体験記

さて本題になりますがゆるが統計検定1級に合格するまでの道のりを書きたいと思います。

2020年春~勉強開始~

ゆるが統計検定を受けようと思い立ったのは2020年の4月になります。統計検定の存在自体はこれより前から知っていましたが、一度体系的に勉強したいと思ったのがきっかけでした。そしてやはり受けるからには一番上をということで1級を最初から目指しました。試験は例年11月なのでそこに合わせていこうと、とりあえず上記の公式参考書と問題集を買い、夏ごろまでひたすら参考書を読み進めました。8月半ばあたりで参考書を1周したので過去問を解き始めましたが、やはり参考書を一周した程度では問題は解けないなあという印象がありました。

2020年秋~試験中止~

解けないながらに過去問を解き進め、今年受けようと息巻いていたのですが、例年申し込み開始する9月ごろ衝撃の知らせを目にします。なんと、COVID-19の影響でPBT方式の試験が全て中止になったのです(正確には会場が抑えられなかった云々と書いてあった気がしますが忘れました笑)。ゆるはこの事態のせいで一旦勉強のモチベーションが低下し、しばらく統計から離れていました…

2021年春~勉強再開~

統計検定1級は年1回しかないので、しばらく勉強していませんでしたが、統計検定1級をとりたいという気持ち自体は持ち続けていたのでそろそろ勉強を開始しようとなったのが2021年の5月ごろでした。内容を忘れたいたので再び参考書を読み直しました。期間が空いたとはいえ2週目だったので、前回よりも理解が深まっている感覚を確かに感じていました。この年度も8月ごろから過去問に挑み始め、前年に途中でやめて解かなかった過去問についても全て解きました。この年は無事試験が実施されることが決定し、9月頃に申し込みを完了させました。
ここで過去問をもう一回ずつ解いたりなどしていたのですが、少し時間が余っている感覚があったので、ネットで調べて評判の良かった「現代数理統計学の基礎」を購入し、内容を読みました。公式参考書と比較しても表現が難しくて読み辛かったのですが、違う切り口の説明があったりと理解を深める上でよかったと思います。

2021年11月~統計検定受験~

現代数理統計学を読みつつも、演習問題までは時間がなく手が出せませんでした。しかし、過去問は全て解いていたので行けるだろうと思い試験に臨みます。
【統計数理】
内容的にはそこまで手ごわくなかったのですが、久しぶりの数学の試験ということでの計算ミスが一番の命取りでした。電卓が持ち込み可といっても方程式の式変形が間違ってたりしたら意味ないというのを痛感しました。また実力面で言えば、一様分布に従う確率変数の変数変換について積分範囲の変換を理解できておらず、時間をかけた上に解けなかったのを覚えています。予想では6割弱でしたが、例年の噂で6割程度が合格ラインという情報があったのでワンチャンか?くらいに思っていました笑。結果は不合格で不合格者の上位20%でした…非常に悔しかったのを覚えています。
【統計応用(医薬生物学)】
生存時間分析やら症例数設計やら、オーソドックスな問題がありそれらを主に解きました。解き方は分かっても時間が足りないのが統計応用で、体感では埋めた答えが7割程度だったと思います。結果的にその多くがあっていてくれたおかげで、統計応用は合格を頂けました!ただ確実にボーダーギリギリだったとは思います笑

合否通知は1か月後くらいで、数理が不合格と分かってからはしばらく落ち込み、来年に向けて気持ちを切り替える期間を長くとっていました。

2022年春~勉強再開~

6月あたりでようやくモチベーションが回復し、少しずつ勉強を再開しました。まずは思い出すところからでしたが、ある程度下地があった&統計数理だけだったおかげで7月にはおおよその内容を思い出していました。また前年に受けた時すでに過去問も解ききっていたので、8月中には去年受けた時と同等のレベルに達していただのではないかと思います。
しかし、今年はレベルアップしなければいけないと思い久保川先生の「現代数理統計学の基礎」に取り掛かりました。こちらも内容については2週目だったので流し読みに留めました。一方で章末問題は非常に教育的なものが多く2章から8章まで「発展問題の印」がついている問題以外は全て解きました。統計検定公式の書籍にはなくてこの演習問題にはあり、かつ統計検定で出題される内容は以下になります。時間がない方はこの部分を重点的に解いてもいいかもしれません。

【確率変数の二乗の変数変換】
もちろん過去問にもありますが、その構成法については本書籍の第2章に詳しく記載してあり、その応用バージョンも演習問題で体験できます。この類の問題は本番で「落とせない問題」に該当するので、そこを固めるのは非常に大事です。

【積分区間に変数を含んだ重積分の積分順序の入れ替え】
これは正直過去問で出たことはないのですが、数学的素養をつけるという点で大事な概念になると思います。現代数理統計学の第2章の問題を参考に以下の例を考えてみましょう。
正の連続確率変数$${X}$$について

$$
{\begin{split} E[X] &=\int_{-\infty}^{\infty}xf(x)dx\\
&=\int_{0}^{\infty}\left(\int_{0}^{x}dy\right)f(x)dx\\
&=\int_{0}^{\infty}\left(\int_{y}^{\infty}f(x)dx\right)dy\\
&=\int_{0}^{\infty}\left[F(x)\right]_{y}^{\infty}dy\\
&=\int_{0}^{\infty}\{1-F(y)\}dy\\
&=\int_{0}^{\infty}\{1-F(x)\}dx
\end{split}}
$$

という性質が成り立ちます。この式そのものは今理解できる必要はありませんが、2行目から3行目にかけての式変形は重積分の順序交換に伴う積分範囲の変換が必要です。今後重積分の順序交換が問われる問題が出てきてもおかしくないと思っているので、こういった問題についても本書籍の演習問題が役立つと予想しています。

【一様分布からの変数変換】
2つの互いに独立な確率変数$${X, Y}$$の和や積については$${W=X+Y, V= X}$$や$${W=XY, V= X}$$といったように2変数を自分で設定してから2変数の変数変換の公式を用いて$${W,V}$$の同時分布を求め、最後に$${V}$$について積分して$${W}$$の周辺分布を求めます。基本的に$${X}$$や$${Y}$$が実数全体や正の実数全体といった場合には、変換後の$${W,V}$$の範囲を簡単に推測できますが、$${X,Y}$$のうちいずれかが一様分布のような限られた範囲の確率変数である場合、$${W,V}$$の範囲に場合分けが生じたりするなど、周辺分布を求める際に注意が必要です。そこで平面での図示から範囲を厳密に議論しなければなりません。こういった問題は2021年の数理でゆるが落とした苦い記憶もあり、是非把握しておいてほしい分野になります。また1つ上の項目でも言えることですが、積分区間を厳密に議論する際には図示が必須で、日ごろからその習慣をつける上で本書籍の演習問題はとても有用です。他パターンの2変数の変数変換の問題含め、第3章の演習問題に豊富にあります。

【条件付き期待値と条件付き分散の公式】
条件付き期待値や分散の公式とは、

$$
{\begin{split}
&E[X]=E_Y[E_X[X|Y]]\\
&V[X]=E_Y[V_X[X|Y]]+V_Y[E_X[X|Y]]
\end{split}}
$$

のことを指します。こちらは過去問にもあるのですが、やはり演習を解いて身に着けるという意味では本書籍の第4章がおススメです。また第4章の内容部分にも記載が充実しており、階層モデルという枠組みで解説しているので使い道がイメージしやすいです。実際に2022年の数理の第3問にも出題され、この公式を使えたかどうかは合否の分かれ目にもなったのではないでしょうか。

【確率収束、分布収束】
こちらは公式の書籍にもチェビシェフの不等式や中心極限定理など、概念は触れられていますが、如何せん実践を積むほど過去問にないという現状です
。一方今後出題されることもあると思うので、本書籍の第5章、第6章の演習問題での練習をお勧めします。

【片側検定における尤度比検定の構成法】
仮説検定というのは普段何気なく使うときと厳密な議論をするときで難易度の差が非常に大きい分野で、尤度比検定もまさにその一つです。公式の参考書や過去問では基本的に両側検定の場合しか触れられていませんので、いきなり片側検定の場合を厳密に構成しようとすると戸惑う方が多いかと思います。この部分は第7章の演習問題でたくさん練習できるので、仮説検定の理解を深めたい方は是非解いてみると良いと思います。

「現代数理統計学の基礎」について長々と書いてしまいましたが、こういった部分は去年の時点では理解していなかった分野なので、演習問題で理解を深めることができました。問題の分量は結構多いので8月から初めて1週、そして間違えたところを2周し終えた時点で試験の1週間前とかになっていたと思います。

2022年11月~統計数理受験~

以上の準備を進めて統計検定1級統計数理に臨みました。2023年8月現在は統計検定のホームページに

に過去問のリンクがあります。
ゆるは大問2、大問3、大問4を選択しました。個人的な手ごたえとしては大問2の最後の小問が時間切れで解けなかった以外は速報の略解と合っていたと思うので合格は確実だと思っていました。1か月後の合格発表で実際に合格を頂き、さらにありがたいことに成績優秀賞まで頂けたのでここまでの努力が報われ、すごく嬉しかったです!また小問1問程度でも最優秀賞は逃したので、改めて最優秀賞だった方々は本当に満点近いのだと実感しました…。

統計検定1級における今後の動向予想

さてここまででゆるの体験記を書いてきました。最後に、統計検定1級の試験について今後の動向予想について触れたいと思います。

ベイズ統計学

これまでの統計検定1級では分布のパラメータを定数として扱う問題が$${9}$$割以上を占めていたと思います。しかし、そのパラメーターも確率変数と見做すベイズ統計学という分野があります。このベイズ統計学は従来の統計学(頻度論)と比較して、区間推定や仮説検定の結果がより直観的であることから近年注目されてきています。中でも、臨床試験で取り入れようという動きや、生物学の論文で頻度論の$${p}$$値至上主義を改めようという動きがあることを最近耳にすることがあります。また、実際に統計検定1級の範囲にも入っており、ベイズ統計、マルコフ連鎖、モンテカルロ法に関する問題が増えてくるのではないかと予想しています。
これまでは2016年数理にモンテカルロ法、2018年数理にマルコフ性、2021年数理にベイズの定理と事後推定、2022年数理に階層モデルといったように数は多くないにしてもベイズ統計に通ずる問題の頻度が上がってきている印象があります。この分野はもちろん試験に合格するという意味でも大事ですが、今後の有用性という観点から時間をかけても絶対に無駄にならない分野であると確信しています!
ベイズ統計学はゆるが勉強中の分野であり、ゆる自身「見習いベイジアン」に過ぎませんが、今後記事でも扱っていきたいので是非読んで頂けると嬉しいです!

最後に

統計検定1級合格体験記についてここまで長々と書いてきました。最後まで目を通してくださった方々、ありがとうございます!統計検定受験に向けて質問等ありましたら是非お答えさせて頂きますのでコメントお待ちしております!
では次回の記事もよろしくお願いします!

【更新履歴】
2023/08/11 初稿投稿


この記事が気に入ったらサポートをしてみませんか?