見出し画像

【W7】活性予測のための機械学習モデル_01_概要

【W7の目的】

利用可能なデータソースがより大きくなるにつれ、医薬品探索、特にリガンドベースのバーチャルスクリーニングにおいて、機械学習(machine learning、ML)が盛り上がってきました。このトークトリアルでは、私たちの標的とするターゲット分子(EGFR)に対して新規な化合物の活性を予測するために、様々な教師あり機械学習(supervised ML)アルゴリズムを使用する方法について学習します。

上記はPython版TeachOpenCADDのT7についてのmagattacaさんの記事から引用しましたが、KNIME版のW7も同様です。

【化合物プロファイルの機械学習】

機械学習をうまく適用するために必要となるものは、巨大な化合物データセット、化合物のエンコーディング、データセットの化合物ごとのラベル、そしてモデルを訓練するための機械学習アルゴリズムです。これらによって、新しい化合物の予測を行うことができます。

ではKNIMEを用いた機械学習の勉強をはじめます。

【7. Ligand-based screening: machine learningメタノード】

中身を見てみましょう。

画像1

Step1は

画像2

W7ではpIC50値が6.3(IC50値で言えば約0.5μM)より上か下かで活性/非活性を分け、その判別を機械学習で予測してみます。そこでデータセットの化合物ごとのラベル付けをしています。

Step2はデータの前処理と化合物のエンコーディングです。


画像3


Step3はモデルを訓練するための機械学習アルゴリズム3種を体験します。

上から順に
・ランダムフォレスト(Random Forest、RF)
・人工ニューラルネットワーク(Artificial neural networks、ANNs)
・サポートベクトルマシン(Support Vector Machines (SVM))
です。

画像4

しかも
妥当性検査手法(Validation strategy):k分割交差検証
を行います。


Step4は性能評価を体験します。

画像5

Step3と書いてあるんですけどStep4として扱います。

次回以降workflowの詳細をそれぞれ見ていきます。


【新年のご挨拶】

あけましておめでとうございます

昨年中は多くの方に励ましの言葉を頂きありがとうございました。

W5のクラスタリング、W6のMCSまでは皆様のコメントやTwitterでのフォローなどを心の糧として何とかたどり着きました。

そして年末、W7の機械学習という富士より高い頂を見て、正直ひよって冬籠りをしました。

機械学習あるいはAI創薬なる技術には個人的な思い入れがあります。
今やもう昔話なのですが、私が創薬化学者であったころAI創薬プロジェクトに興味をもって参画しようとしたことがあります。

計算化学のプロである後輩に「お気持ちはありがたいです。しかしあなたはどのように役立って下さるのでしょうか?(意訳)」と尋ねられ、その後しばらく悩んで身を引きました。憧れの気持ちは抱きつつもプロとして戦力になれる自信が持てなかったのです。

時は移り今は化合物データベースの設計や運用のとりまとめなどをなりわいとしています。AI創薬がモーターとすれば、そのエネルギー源にあたるデータを途切れなく供給することで貢献したいと願っております。言うなれば兵站担当の一人だと考えています。

KNIMEはETLすなわち現場の実験データをExcelなどから抽出(Extract)し、データベースに適切に格納できるよう整形(Transform)し、データベースサーバーへ収載(Load)する業務に最適です。私のようなもともと素人だった人間が数年でDB担当としてデータ管理できるようになります。
KNIMEって便利だ、僕にもできるよと嬉しくなって昨年からこのブログを書くに至りました。いつか誰かの役に立つのなら、こんなに嬉しいことはないです。

少々脱線が過ぎたので元に戻しますが、機械学習の深遠なる世界について、私が何かコメントするのは恐れ多いです。W7に関しては「体験記」というよりも「学習記録」的な内容になるだろうと思います。

TeachOpenCADDのみならず、玄人の皆さんによるブログや動画など、2023年の今、教材は揃っているではないですか。
昨年よく聴いたセリフ「日和ってる奴いる? いねーよな!?」を言ってもらっている気持ちでリベンジを試みます。

今年もどうぞよろしくお願いします。

2022年 元旦     富士より高い機械学習の山麓にて    KNIMEST

記事を読んでいただきありがとうございます。 先人の智慧をお借りしつつ、みなさんに役立つ情報が届けられたらと願っています。 もしサポートいただけるなら、そのお金はKNIMEの無料勉強会の開催資金に充てようと思います。