見出し画像

統計検定準1級の(主観的)要点

今回は統計検定準1級実践ワークブックの各章について,テストに臨むにあたって個人的に大事だと思ったポイントをひとことふたこと書いていこうと思います.あくまで個人的な感想として読んでいただければと思います.

勉強に使用した教材等についてはこちらをご覧ください.


1. 事象と確率

ここは事象の計算ができることとベイズの定理が重要だと思います.基本的ですが特に3つの事象がある場合はベン図を用いて確認しておくべきかと思います.

2. 確率分布と母関数

母関数の定義について確認しておくべきですね.特にXとYが互いに独立ならばE[s^(X+Y)] = E[s^X]E[s^Y]となることなどの母関数の性質は重要だと思います.これを用いて再生性の証明をするのもいい練習になります.あとは微分して期待値や分散を導く練習をしておくと良いと思います.

3. 分布の特性値

偏相関係数や変動係数,歪度,尖度あたりは確認しておきましょう.あとは幾何平均や調和平均も大事です.条件付き期待値とかも離散型で問題作れそうですよね.

4. 変数変換

例題を通して変換に慣れておけば問題ないと思います.

5. 離散型分布

各分布の期待値や分散,母関数は押さえておくべきです.あとは再生性や無記憶性も大事ですね.基本的に統計はパラメトリックであれば次の連続型分布も含めて全ての基礎となっているのでここを押さえるのは本当に重要だと思います.テストにおいては点数に直結するというわけではないかもしれませんが…

6. 連続型分布と標本分布

ここも離散型分布と同様です.特にガンマ分布やベータ分布はベイズ法で使うので,その期待値や最頻値が大事です.あとは2変量正規分布の条件付き期待値や分散も重要です.後者についてはこのサイトが役立ちました.

あと混合正規分布における二峰性の条件は念の為押さえておきました.

7. 極限定理,漸近理論

試験で得点することを考えればデルタ法を押さえておくくらいで良いかと思います.あとはチェビシェフの不等式を確認しておくと良いと思います.それと連続修正も重要ですかね.

8. 統計的推定の基礎

推定量の評価指標について押さえておくと良いと思います.不偏推定量,一致推定量あたりですかね.あとは推定量の構築法として最小二乗法,最尤法,モーメント法を押さえておけば良いと思います.特に最尤推定量は漸近正規性が重要で,漸近分散がクラーメル・ラオの下限に一致することが重要です.また,最小二乗推定量についても一定の条件下で最良線形不偏推定量になることを押さえるべきです.
あと,ジャックナイフ推定量の計算はできるようになっておくと良いと思います.

9-12. 区間推定や検定

ここは基本的に2級レベルの内容なので,確実に得点したいですね.特に検出力からサンプルサイズの決定,エフェクトサイズ,イェーツの補正あたりは特にしっかり押さえてました.特にイェーツの補正は理論値との差がマイナスの場合になんとなくそのまま0.5を引いて二乗してしまうと間違えるので,しっかり絶対値に対して0.5を引いているのを意識するべきかと思います.

13. ノンパラメトリック法

ここは覚えていれば解けるのでしっかりそれぞれの方法について例題を通して確認しておきましょう.もし出たら確実に得点したいですね.

14. マルコフ連鎖

ここは推移確率行列がわかって,最尤推定でパラメータを求めて,定常分布を求めるという3つのポイントを押さえておけば良いと思います.もし出たらぜひとっておきたい分野だと思います.

15. 確率過程の基礎

ここは独立定常増分の定義をしっかり押さえて,例題がしっかり解ければ良いと思います.正直理解が完璧でない状態でテストに臨んだので詳しいことはあまりわかりません…ごめんなさい…

16. 重回帰分析

正規方程式は導出できるべきだと思います.あとは全変動が回帰変動と残差変動に分解できることから決定係数の定義が導けることが重要です.あと説明変数を増やすと決定係数は大きくなってしまうので自由度調整済み決定係数も確認しておきましょう.係数の有意性検定の話も押さえておくと良いです.あとはRidgeとLassoですね.特に後者は変数選択の性質がある点で重要です.うーん,結局全部重要ですね()

17. 回帰診断法

出たらボーナス問題だと思うので隅々まで確認しておきましょう.

18. 質的回帰

ロジスティック回帰とプロビットモデルとポアソン回帰ですがどれも重要です.当たり前ですが例題はどれも完璧にしておくべきだと思います.特に説明変数が1増えるとどうなるのかなどはそれぞれ解釈が異なるので大事ですね.

19. 回帰分析その他

ここはあまり出題されなそうなイメージだったのでほとんど触れませんでした.が,よい子の皆さんはしっかりやりましょう!!()

20. 分散分析と実験計画法

めちゃめちゃ大事です.全て大事なのでしっかりやりましょう.特に分散分析でF値を求めて検定するのはもちろんですが,信頼区間を求める話も大事だと思います.あとは直交表の話ですね.

21. 標本調査法

ここも推定量の分散を一定以下にする話とか,特にネイマン配分法は押さえておくと良いと思います.

22. 主成分分析

特に寄与率,主成分負荷量を押さえておくと良いですね.余裕があれば変換後の分散を最大化するというのでラグランジュの未定乗数法から固有値問題に帰着させているという背景も押さえておくと良いと思いますが,このような証明が試験で出るかはわかりません…

23. 判別分析

サポートベクターマシンは特に大事だと思います.ここは正直微妙な理解のまま試験に臨んだので詳しいことはあまり言えません…,なんとなくですがもし出題されるとしたら性質上結構骨のある問題になりがちな分野なのではないかなぁと思います.根拠は特にないですが…

24. クラスター分析

これは憶測ですが,問題を作りやすいと思うので結構出題されやすそうだと思います.特に最長距離法は簡単ですが意外とごちゃごちゃになりやすいので注意が必要ですね.実際にデータ例を用いてデンドログラムを作ってみるとかするといい練習になるのではないでしょうか.あとは他の距離方法についても押さえておくべきですが,計算問題として出すと複雑になりやすく,試験時間的に考えれば出にくい気がするので基本的には定義を押さえればいいのではないかと思います.

25. 因子分析・グラフィカルモデル

ここは共通性とか独自性とかの求め方とか,回転の話,操作変数法の話をしっかり理解しておくと良いと思います.後半のグラフィカルモデルについては正直問題として出される想像があまりできなかったのであまりやってません.

26. その他の多変量解析手法

ここはほぼ触れてません!!もし出ても責任は取れないので皆さんはちゃんとやりましょう!!

27. 時系列解析

とにかく弱定常性が大事ですね.これを元にして自己共分散とかを求めていくことになります.特に自己共分散を求めることができて,コレログラムと次数選択の話がわかって,コレログラムとスペクトラムの関係,DW比がわかっていれば良いと思います.詳しくはこのサイトが有用です.

28. 分割表

オッズ比とその解釈が大事ですね.あとは対数オッズ比の推定誤差からオッズ比を区間推定するみたいな話ですかね.あとは逸脱度とかフィッシャーの正確検定とかの話が重要ですね.

29. 不完全データの統計処理

おそらくこれも出たらボーナス問題になるやつだと思うのでしっかり例題レベルを解けるようにしましょう.これは正直考えればわかる話なので大丈夫だと思います.

30.モデル選択

AICとBICの公式は重要ですね.試験にはあまり関係ないかもしれませんが,個人的にはAICがF検定の変数選択に相当するというところの説明はすごく面白かったです.

31. ベイズ法

共役事前分布の話は大事だと思います.なので事前分布から事後分布を求めてベイズ推定量とかMAP推定量求める話は押さえておくべきでしょう.MCMCとかの話は私はあまりちゃんと理解できていませんでしたが,本来ならしっかりやっておくべきだと思います.

32. シミュレーション

例題は解けるようにしておきました.

さいごに

以上が個人的な要点まとめになります.統計検定準1級は4つのセクションに分かれているのですが,特に最初の「確率と確率分布」や「統計的推測」がしっかりできるほど合格しやすい気がします.取るべき問題をしっかり取ることが大事な試験だと思うので,そういった問題を絶対落とさないという気持ちで臨むと良いと思います.
また実際の試験ではワークブックの例題がそのまま出るということはほとんどないですが,類推すれば解ける問題なはずなので,やはりワークブックを極めるつもりで隅々までしっかり取り組むことが合格への最短距離だと思います.
ここまで読んでいただいてありがとうございました!皆さんの合格を祈っています!

この記事が気に入ったらサポートをしてみませんか?