見出し画像

ヒトの学習を「いま」機械学習を使ってアプローチするのは、学生には禁忌

修論の提出が終わったので一旦一息ついてみる。

研究テーマはヒトの学習で、強化学習モデルから、どんな選択をしているか調べている。これが地獄なのである。3つの地獄があって、①知らなくてはいけないことが多すぎる、②数学が大きく絡むので入り口に立つまでが遠い、③機械学習がまさに発展中であること。

心理学は、あまり前提知識なくてもできちゃう部分がある分野だと思う。怒られるかもしれないけど。例えば理学系のものだったら、最新に追いつくまでに途方もない距離がある。修士課程なんて勉強がやっとで最新のことなんて自力では到底できない、なんての普通のことだと思う。それに対して、心理学系は学部生で、初めて研究する人でもそれっぽい研究をして、外で発表できるレベルになることも少なくない。

このテーマは割と、延長線にあるような顔をしているけど、全然違う。最低ラインに立てる気がしない。理由は最初に書いた3つの地獄の通りなので、その話を掘り下げていこうと思う。


①知らなくてはいけないことが多すぎる

その分野のことを知るなら、教科書を読んで、レビュー論文を読んで、代表的な論文を読んで、最新の論文に当たると、大まかなことはわかる。大方の心理学をやっているなら、これで相当なレベルで把握できると思う。確かに細かい経緯や、周辺テーマとの明文化されていない関連や、暗黙の了解などを知るにはまだまだだけれど、「このテーマはどんな問題意識で、どんな研究がされているか」は割と正しく説明できるようになるだろう。少なくとも的はずれになることはない。

だけれども、そんなことが容易に起きる。勉強すべき領域が広い。心理学の学習を知って、機械学習の数学的なことをちゃんと理解して、脳科学のことも最低限拾えてないといけない。まず文献の多くが脳科学の分野に存在しているので、脳のことを知らないといけない。学習モデルを考えるにあたっては、数式をこねくり回すことができないと危険で、学習モデルが提案時点で破綻している可能性が高い。学習モデルは強化学習やベイズ学習を使うことが多いので、その辺りの知識は前提であるし、数式をこねくり回すための基本知識はここに詰まっている。でもって、この辺りのことがわかりやすくまとまっている本なんてまず存在しない。各分野でそれぞれ入門書を読んで、それを自力で統合しないといけない。

誰だかが頑張ってベイズ学習を100日勉強してnoteにしていたと思うんだけど、これでも早い方よね。これが統合するべきことの一部だから、この後まだまだ残ってると思うとさ。。。それで勉強を済ませてから、何を研究するのか決めて・・とか考えると果てしない。

修士課程の間で終わると思ってるのだろうか。「自力で統合する」とかやってられない。しんどすぎる。研究にたどり着かない。


②数学が大きく絡むので入り口に立つまでが遠い

数学は大事。どこまで行っても大事。

研究内で何か新しいことを言うにあたって、学習モデルで新しいことをすると、そこには数学的な裏付けがそれなりに必要になる。学生のほとんどのぽっと出のアイデアは、数学的に破綻している。ちょっとわかる人が、ちょっと計算すると、瞬間的に矛盾や問題にたどり着ける。本当に詳しい人は「心理学あたりは適当にやっているのだから、そんなに深く指摘しなくていいけど、ひどいな〜」と心の中で思うに違いない。

1番の地雷は、「ヒトの意思決定に、今まで調べられてないけど〇〇が関わっているに違いないから、それを調べた」みたいな内容だと思う。新しい要素を付け加えるなんてのは、普通の人にはできないし、かなりの確率で失敗する。始める前に、何を〇〇にするか、〇〇をどのように数式に落とし込むのか、が破綻しているからである。破綻していることに気づくことは学生にはできない。

「だったら、教員が、その計算ができて、判断できたらいいんじゃない?」って。その通りなんだけど、そんな指導できる教員も多くない気がするんだが。。だから、それができる先生のところに所属できてないといけない。受験する場所を選ぶことをしくじったら、終わるんですよ。これは最終的に「先生のカバー範囲から、決して逸脱してはならない」という結論に繋がる予定。


③機械学習がまさに発展中であること

これは実は隠れた重要要素だと思う。心理・脳科学に強化学習的なものが入ってきて盛んになったのは、1990年くらいと言う認識でいいと思う。この時期はMRIの性能向上やPCの処理能力向上の影響で、ヒトの脳の情報で扱えることが急速に増えた時期だと思う。だから気づかなかったのだが、この時期はAIブーム冬の時代と一致する。これは幸運なことで、機械学習分野での進展がないから、一旦勉強したら最新に追いつき続ける必要がかなり弱い。機械学習の基本を押さえていれば、心理・脳科学に応用するにあたっては十分だったし、「当時の基本」は今の初歩でもある。

最近はどうだろう。深層学習あたりで猛烈な発展があって、継続して新しいことが考えられているし、性能が日進月歩である。方法的な発展はあるものの、理論的なサポートがやや遅れているのもあって、真に理解するのは大変すぎる。誰も説明してくれないし、そもそも理解できるのかわからない。応用するのも大変だし、応用できたところで少ししたら遅れているかもしれない。

1990年代のままな機械学習の使い方をすると、明らかに最近の情報とは足りなすぎるし、かといって新しいことに真剣に取り組もうとするなら情報科学をきっちりやらなきゃいけないじゃん。無理だよ。

解剖っぽい人たちは深層強化学習っぽいことしてたり、ヒトの脳でも強化学習で分布扱おうとしてたり、子供の学習で教師なし学習とか半教師あり学習みたいなこと言ってる人もいるし、何をどこまでやったらいいのかね。設定した興味に該当する部分を勉強してもさ、興味分野が少し違うことに気づいちゃって、そしたら使ってる機械学習も違うってこともあって、勉強し直し、みたいな。でもそれだと修士課程終われないのさ。2年でやることじゃない。

まとめ:学生はタブーに気づけない。

修士課程が始まった時点で、このことをわかっていて、自分の考えがタブーに該当するか判断できたら問題ない。でも研究初心者に判断できるわけもない。このことに行き着いたのは、2年目の修士課程が終わった時のことである。今3年目をしているので察してください。学生の知識レベルで、どんな研究テーマなら期間中にある程度習得できて、形にできて、研究のお作法を身につけられるのか、を判断できるわけがない。

研究テーマ選びには学生が取り組むべきではないテーマ(=タブー)がいっぱいある。ここで書いたこともそうだけど、各分野にタブーがいっぱいある。数式をいじったり、生物をいじったりする分野ほど、容易にタブーに突っ込む。ただ、多くは教員が止めるので問題にはならない。しかし心理系は、多くのテーマでなんとかなってしまう分野なので、教員側の危機意識が低い傾向にあると思う。

つまりね。ちょっとややこしそうなことをするなら、ちゃんとマッチした先生のもとでやろうね、ということですよ。

誰に書いてるかというと、将来同じ境遇になりかねない架空の後輩にむけているつもりで書いている。気をつけてね。



この記事が参加している募集

最近の学び

この記事が気に入ったらサポートをしてみませんか?