見出し画像

【W6】最大共通部分構造_01_概要

【W6の目的】

サイズの大きい化学データのクラスタリングとクラス分類は、医薬品探索の化学を利用する広範な領域において、研究を導き、分析し、知識を発見することにとって不可欠です。
一つ前のトークトリアルで、化合物をグループ化する方法(クラスタリング)を学び、一つのクラスターに含まれる化合物がお互いに似通っており、共通の骨格(scaffold)を共有していることを見つけました。視覚的に調べることに加えて、ここでは化合物セットが共通してもつ最大の部分構造を計算する方法を学びます。

上記はPython版TeachOpenCADDのT6についてのmagattacaさんの記事から引用しましたが、KNIME版のW6も同様です。

【最大共通部分構造】

最大共通部分構造(maximum common structure、MCS)は2つあるいはそれ以上の対象化合物に含まれる最大の部分構造として定義されています。
利点:
* 直観的 → 対象化合物に共有されている構造は重要である可能性が高い
* ありうる活性のパターンへの洞察を与える
* 単純に部分構造をハイライトすることで簡単に可視化できる

W6でKNIMEを用いたMCS解析の体験をしていきましょう。

【6. Maximum common substructuresメタノード】

中身を見てみましょう。

画像1

Step1の前半は

画像2

MSC解析を実施し、得られたMCSで化合物群を部分構造検索して抽出する操作をGroup毎にループ処理をします。
MCS解析にはFindMCS(FMCS)というアルゴリズムを利用しています。

後半では

画像3

MCSが各化合物のどこにあたるかの可視化処理などしたのち、ループ処理を終了します。

Step2はデータ表示のための後処理とTable形式での可視化です。

画像4

次回以降workflowの詳細をそれぞれ見ていきましょう。

補足:

【FMCSアルゴリズムの詳細な説明について】

FMCSアルゴリズムとはなにか、実は意識的に説明をはしょりました。私は自分の言葉で説明できるほど理解できてはいないです。代わってお勧めしたいのが文頭に紹介したmagattacaさんの記事です。丸ごと引用もどうかと思うので、原典をご覧ください。

創薬化学者にとっては、化合物間で共有されている部分構造を判断して、差異を見比べるのは日常的な考え方だと思います。前にもW4の体験時に取り上げました。

部分構造検索を駆使して、最大の共通部分構造を自動的に抽出できる手法が今回のトピックです。下記記事を読むと部分構造検索技術のより広い利用方法を俯瞰できると思います。



記事を読んでいただきありがとうございます。 先人の智慧をお借りしつつ、みなさんに役立つ情報が届けられたらと願っています。 もしサポートいただけるなら、そのお金はKNIMEの無料勉強会の開催資金に充てようと思います。