統計解析のためにR言語を2年、Pythonを1年触ってみて~ChatGPTの出現によって現れた変化~



医師のキャリアパスの中で、大学院に進む先生はそれなりにいらっしゃる。大学院に行く理由は人それぞれだろうが、自分のように「上司に行けと言われたから」、「みんな先輩も行っているから」と決定を人任せにして進学してしまった先生もいるのではないか。論文がアクセプトされ、一応は卒業要件を満たしたこのタイミングで、大学院生活と統計ソフトとのかかわりを中心に書いてみたい。同様に苦しむ大学院生の参考になれば幸いだ。


先輩のスクリプトを借りて、見様見真似で始まる研究

6年生の医療系大学を卒業したので、修士課程を飛び越えて博士課程から自分の大学院生生活はスタートした。そんな自分に最初に与えられた仕事は、マウスの解剖でもなく細胞の培養でもなく、人手が足りずに手つかずのままだったデータの解析だった。先輩たちが見向きもしない、扱いづらいデータだったのようだった。複雑なデータセットを扱えるのはRかPythonではないか、という親しい先輩からの勧めも後押しし、自分の研究生活R studioのインストールからスタートした。

まず始めたのはT検定などの簡単な統計であったが、当然それで目ぼしい結果が出るわけもなかった。扱うデータセットによっては、どれだけ趣向を凝らしても論文に値するような結果が出ないケースもあるだろう。だが当時の自分は、R言語をさらに使いこなせば魔法のように有意差が出て大学院を卒業出来ると思い込んでいた。半年程度で、簡単なデータスクレイピングやクラスタリングといった統計手法を実施出来るようになった。しかしながら論文化出来るような結果はまだ出てこず、素敵な図表作成も行えない状況だった。

ChatGPTの出現、加速するggplot2の表現力

研究が停滞気味となり途方に暮れていたころ、ChatGPTが彗星のごとく現れた。当時のChatGPTでは文献検索には用いるレベルになかったように記憶しているが、とにかくR言語との親和性は高かった(Pythonの方が高いと思うが)。やりたいけどスクリプトが書けずにもやもやしていた色んなことがChatGPTによって出来るようになった。特に顕著だと自分が感じているのが、ggplot2による可視化だ。ggplot2というのは、目を引く図表を作成するためのパッケージだ。グラフィカルなアイデアを、ChatGPTが教えてくれることにより、自分の研究結果の外観だけは、素敵なものになったのだ。

出来れば楽しくなる、ChatGPTの出現によって現れた変化

論文化に値する結果は未だ出ていなかったが、それでもChatGPTが与えてくれた自己肯定感により、研究のやる気を取り戻したのは確かだ。ChatGPTがあれば何とかなる、と強く思えるだけの手ごたえがあった。手をつけてこなかったPythonによる解析にもトライし、Shapスコアといったやや高度な統計手法にも手をつけてみた。真の統計家、データアナリストからすればお笑いみたいなクオリティだが、それでもやる気をもって前進出来たのは大きい。結果的にはR言語内で完遂出来る統計解析によって自分の研究結果は飛躍的に意味を持ち始めた。その飛躍の裏側には、ChatGPTによって得た学びや、Pythonなどを触り始めて得た知識は欠かせなかったように思う。ChatGPTがなければ、自分は論文を書けるような結果を出せていなかったと思う。マジで。これからR言語等を用いて解析をスタートする後輩に声を大にして言いたいのが、とにかくChatGPTに課金すること、である。

これからトライしたいこと、このnoteで書いてみたいこと

R言語やPython、せっかく学んだので、もう少し実生活に生かせないかと画策している。具体的には、戸建て住宅におけるswithbot温湿度計データの可視化、などだろうか。じんわりと生活に落とし込めたら、大学院卒業後にも生きる知識になるかな、と期待している。これからのnoteでは、自分が統計解析を行う中で得た知識やtipsに加え、閉塞感満載の中での癒しであった家庭菜園をテーマにした内容も書いていきたいと考えている。

#R言語 #Python #大学院生

この記事が気に入ったらサポートをしてみませんか?