見出し画像

DrugCLIP: Contrastive Protein-Molecule Representation Learning for Virtual Screening

https://arxiv.org/abs/2310.06367

  1. 本研究の学術的背景は、AIを利用した薬剤探索の中で、バーチャルスクリーニングという技術が重要なステップであることです。バーチャルスクリーニングは、特定のタンパク質ポケットに結合する可能性のある薬剤を広範な化合物データベースから特定する手法です。しかし、従来のドッキング法は時間がかかり、実際の応用では制約のある検索ライブラリしか扱えませんでした。

  2. 本研究の目的は、ドッキング法や教師あり学習法よりも優れた性能を持つ新しいバーチャルスクリーニング手法を提案することです。この手法は、対照的な学習を利用し、バインディングタンパク質ポケットと分子の表現を大量のペアデータから得ることができます。また、生物学的な知識に基づいたデータ拡張戦略も導入して、より良いタンパク質-分子の表現を学習することができます。

  3. 本研究では、バーチャルスクリーニングの問題を情報検索の課題として位置づけています。具体的には、タンパク質ポケットをクエリとし、大規模な分子ライブラリから最も関連性の高い結合分子を検索することを目指しています。この新しい視点では、バーチャルスクリーニングはタンパク質と分子の類似性のマッチング問題に簡約化されます。また、本研究では、バイオリップやケンブルなどのデータセットを利用してモデルの能力を拡張することが可能です。さらに、生物学的な知識に基づいたデータ拡張法も導入しています。

  4. 本研究では、新しいバーチャルスクリーニング手法であるDrugCLIPを提案しています。DrugCLIPは、タンパク質と分子の結合関係を明示的なラベルなしで学習するため、教師あり学習法よりも有利です。また、プレトレーニングされたエンコーダ同士の対照的な損失を計算することで、タンパク質-分子ペアの類似性を最大化し、バインディングアフィニティの予測に依存することを緩和します。さらに、バイオリップやケンブルの大規模なデータを使用してモデルを訓練し、生物学的な知識に基づいたデータ拡張法であるHomoAugを導入しました。

  5. 本研究では、複数のバーチャルスクリーニングのベンチマークテストを実施して、DrugCLIPが従来のドッキング法や教師あり学習法よりも優れた性能を示すことを示しました。特にゼロショット設定では、DrugCLIPの性能が他の深層学習手法を上回ります。また、薬物学の専門家が広く使用している商用ドッキングシステムであるGlideと比較したヒューマン評価でも、DrugCLIPの方が選択される傾向がありました。さらに、DrugCLIPはターゲットフィッシングなどの重要なタスクでもドッキング法よりも優れた性能を示しました。

この記事が気に入ったらサポートをしてみませんか?