トロント大学でのPhD2年目のスタート

前の投稿から随分時間があいてしまった。1年目はコースワーク中心だったが、なんだかんだで忙しすぎて何かを書き残すまとまった時間を作ることができなかった。ちょうど2年目が始まるタイミングで区切りが良いので、一年目を振り返りつつ、今後の展望を書いていきたいと思う。

①コースワーク編

以前の記事の繰り返しになるが、統計学科のPhDでは確率論(理論)、応用統計(応用)、数理統計学(理論)の3科目が必修となっている。この全てを1年目に受講して修了すれば、2年目以降は授業の履修要件はなく、研究に専念できる。純粋数学を専門としていた私にとっては確率論の授業はほとんど苦労することはなかった。以前に授業をとったことはなかったが、PhDを始める前に確率論の世界的にスタンダードなテキストと言われるRick Durrett氏の"Probability: Theory and Examples"を読了済みだったため、良い復習になった。数理統計学も既にRobert Keenerの"Theoretical Statistics"を半分以上読んでいたため、基本的に復習ベースで進めることができた。

四苦八苦したのは応用統計である。元々コーディング経験はほぼゼロだったので、課題の提出に相当苦労させられた。何しろ北米の大学は課題が多いので、毎週のように応用統計の課題の期限に追われるようになったのである。

周りの統計学の学生はむしろ応用が得意で理論に弱いのだが、自分は真逆。そこで慣れないコーディングを応用が得意な同期に教えてもらいつつ、自分は理論の授業で苦労している同期を全面的にバックアップするような形で相互に助け合いながら乗り切っていくような関係が自然にできていった。同期から"非公式"にもTAと呼ばれ、頼りにされたので悪い気はしなかった。ただ、同期のサポートに時間を割きすぎて、自分の時間が十分に取れなかったような気もしなくはない。

応用統計はコーディングそのものには非常に苦しめられたが、分析力に関しては、理論をしっかり抑えられているおかげで応用が得意な学生にも引けを取らなかった。おかげで最終的に全ての科目でA+を取得することができた。ぶっちゃけPhD学生にとって成績は重要ではなく、自分自身も良い成績を取ろうと努力していたわけでもなかったので、こんなにコーディングが下手なのに応用統計までもA+を取れたことが不思議でしかたないが、きっと自分の理論的基礎が支えになってくれたのだろうと思っている。

②Comprehensive Exam編

かくして、図らずも成績良好でコースワークを終えたおかげで、1年目のコースワークの終了後に期末試験とは別途行われる総決算の筆記試験"Comprehensive Exam"を免除してもらえることになった。この試験を通過しないと落第となり、PhDを取得できなくなってしまうので大切な試験だ。試験科目は理論科目(確率論&数理統計学)のみとなっているため、応用が得意な学生の多くはかなり苦労していたと思う。実際、同期の中にはこの試験に失敗してしまい、もう1年コースワークを受けて2回目のチャンスにかけねばならなくなった者もいるぐらいだ。

いくら自分が理論が得意とは言え、出題範囲も広いので、自分が受けるとなったらやはり1ヶ月程度は準備に時間をかける必要があったと思う。それがまるっきり免除になったおかげで、予定より早く自分の研究テーマの論文を読み始めることができたのはラッキーだった。

なお、Comprehensive Examは北米のPhDプログラムの多くで採用されているシステムである。筆記試験による入試がない代わりに、Comprehensive Examによって学力不十分な学生をふるい落としているのだ。大体どこのプログラムでも、Comprehensive Examに挑戦できるのは2度までで、2度失敗すれば退学になってしまうようになっている。大学側からすれば学費、生活費を負担しているわけで、2年分の投資が無駄になるのは無駄ではないかとも思うが、世界中から優秀な学生を集めるのに筆記試験は適さないので、こういうシステムになるのだろう。

と、ここまでが4月までの話である。夏は日本の大学院生の感覚だと理論系学生は自由に過ごすものだが、ここでは勝手が違う。この夏は大学で初めてTAではなく、講師のポジションをもらって夏の間に授業をさせてもらった。また、秋に行われるResearch Comprehensive Examに向けての準備に着々と取り組んだ。

③トロント大学講師編

これまた北米の大学院では一般的なことだが、大学院生がTAのみならず講師(Instructor)ポジションをもらうことも不可能ではない。1年目の最初の夏からやる学生はあまり多くないようだが、幸いにもSummer Prep Bootcampという統計学科の新入生(大学院生)向けの予備講座の一部の確率論の授業を担当させていただいた。

7月中の3週間に計10回の授業で確率論の基本と測度論的確率論の初歩を扱うというもので、週に3-4回のペースという過密スケジュールで授業を行う必要があった。昨年担当した方からスライドはもらっていたのでゼロから作る必要はなかったものの、大学院生向けの授業なので曖昧な理解で誤魔化すことはできず、かつ英語での授業なので、準備に膨大な時間が準備に取られ、想像以上に負担の大きい仕事だったと思う。正直やるんじゃなかったと後悔もしたが、終わってみれば非常に良い経験であり、今後、別のポジションに応募するための大きな足がかりになることを考えるととても良い経験だったと感じている。

④Research Comprehensive Exam編

これは北米の大学院で一般的なシステムではなく、トロント大学統計学科の独自の仕組みで、上記のComprehensive Examという筆記試験に加えて、研究に着手するための力を測る試験である。

試験といっても、実際の目的は、コースワークと研究の間のギャップを埋めてスムーズに研究に着手できるように学生の成長を促すことを目的としたもので、再度筆記試験を受けるわけではない。最先端の論文を一つ選び、その内容を徹底的に分析し、応用論文であれば分析結果の再現、理論であれば結果の改良を与えることが求められる。

面白いのは、この仕組みができたのはここ数年のことで、大学院学生側の要望で設けられた制度だそうだ。これまた北米の大学では一般的なことだが、大学側と学生団体との協議が良好な関係で行われていることが多いと思う。統計学科では毎年学生団体のPresidentを選挙で選ぶ。選ばれたPresidentは統計学科の大学院プログラム担当ディレクターと頻繁にミーティングを行い、学生側の要望を伝える。これまで見たところ、こうしたコミュニケーションは良好な関係の下行われているようだ。もちろん学生側のニーズが全て通るわけではないが、協議のチャンネルがあり、大学側も学生からの要望を蔑ろにせず、対話にしっかり応じている様は日本の大学では中々見られない光景ではないかと思う。

自分のResearch Comprehensive Examに話を戻そう。自分はDeep Learningの数理に元々関心を持っていたが、このResearch Comprehensive Examの機会を活かして、Deep learningの台頭で注目を集めるDouble DescentあるいはBenign Overfittingと呼ばれる新現象に関する最先端論文の一つを課題に選び、当該論文並びに関連論文を読み進めることにした。これらはパラメーターの数を増やせばトレーニングデータに過剰適合してしまい、精度の高い予測につながらず、またパラメーターの数が少なければトレーニングデータに十分に適合せず、やはり精度の高い予測が得られないため、最適なパラメータ数を選ぶ必要があるという統計学の古典的理解に反する現象である。

この夏の数ヶ月の成果として、選んだ論文中の証明に致命的な欠陥があることを突き止め、著者らの方法論では、著者らが主張する理論的結論より著しく弱い結果しか導けず、当該論文の価値が著しく損なわれることになると結論づけることができた。完全に著者らの主張を覆す反例を見つけるに至ったわけではないが、数学的に根拠がないことを示すことはできたので、とりあえずResearch Comprehensive Examの目的としてはこれで十分だと指導教授からお墨付きをもらってほっと一息つけたところである。

今後の展望

指導教授と議論したのだが、上記の成果は数学コミュニティでは感謝される貢献だが、統計学のコミュニティではあまり大きな貢献と見なされず、中々論文につながらないそうである。これは数学と統計学の文化の違いで、数学では正しいと思われていた理論を反例などで覆すことは非常に大きな貢献とみなされるが、統計学では理論研究であってもそうではないらしい。基本、ポジティブな内容のみが貢献とみなされるような文化があるそうだ。

論文としてアクセプトされるような成果を出すためにはオリジナルのポジティブな貢献が必要で、残念ながらResearch Comprehensive Examに向けてこれまでやってきたことはこのままでは活かせそうもない。ただ、これまでに培った知見に加えて、さらに最先端の論文を読みこなす中で、まだ他の人が手をつけていない視点に気づける可能性はあるので、まずは引き続きこの方面の研究に取り組んでみたいと思う。

この記事が気に入ったらサポートをしてみませんか?