【RF Diffusion】RF Diffusion、ProteinMPNN、AF2によるタンパク質薬の創出【In silico 創薬】

【RF Diffusion】【ProteinMPNN】【AF2】RF Diffusion、ProteinMPNN、AF2によるタンパク質薬の創出【In silico 創薬】

本記事はRF Diffusion、ProteinMPNN、AF2について書かれたIn silico 創薬の記事です。これらを使い薬候補となるタンパク質薬を自分のパソコンでデザインできます。こちらの記事の内容ができるようになると、RF Diffusion、ProteinMPNN、AF2を使った一連のin silico創薬を体験できます。
ぜひ、トライしてみてください!

動作検証済み環境

macOS Ventura(13.2.1), python 3.9.7, Jupyter Notebook, PyMOL 2.5.4

RF Diffusionとは?

タンパク質のin silico設計の大御所であるBaker labで開発された技術です。

RF Diffusion now free and open source

RF Diffusionとは、機械学習アルゴリズムを利用して新しい生理活性化合物を発見するための手法の一つです。

RF Diffusionでは、既知の生理活性化合物の構造情報をデータセットとして使用し、機械学習アルゴリズムによってその構造情報から新しい化合物を生成します。この生成された化合物は、予測された生理活性に基づいてランキングされ、最も有望な化合物を選択することができます。

簡単に言うと、RF Diffusionは機械学習アルゴリズムを利用して、既知の生理活性化合物から新しい化合物を創出する手法であり、効率的で正確な結果を得ることができます。

ProteinMPNNとAF2とは?

ProteinMPNNは、高い精度で新しいタンパク質を設計するための、深層学習に基づくタンパク質配列設計方法です。ProteinMPNNでは数千の高分解能構造から成るタンパク質データバンクでトレーニングされています。

Alphafold2は、タンパク質の3次元構造を予測するために開発された人工知能のアルゴリズムです。このアルゴリズムは、DeepMind社によって開発され、2020年に発表されました。Alphafold2は、タンパク質のアミノ酸配列から、そのタンパク質の3次元構造を高精度で予測することができます。

Alphafold2は、その高い精度によって、タンパク質構造予測の分野において大きな注目を集めています。これまでに、Alphafold2は、多くのタンパク質の構造を予測し、実験的に決定された構造との比較において高い一致率を示しています。これは、医療や製薬分野において、タンパク質の構造と機能に関する理解を深めるために非常に重要な役割を果たしています。

ここではSergeyさんが作ってくださいましたGoogle Colabのページで

RFDiffusionによる骨格生成 →Protein MPNNでの配列設計 > AF2によるvalidationを行います。

本記事を進むにあたって、PyMOLのダウンロードをお願いします。

大阪大学の蛋白研究所からインストールの仕方が解説されています。

RF Diffusion、ProteinMPNN、AF2を使った一連のin silico創薬


では早速RF Diffusion、ProteinMPNN、AF2を使った一連のin silico創薬を試してみましょう!

まずはこちらからGoogle colabページに行きます。

今回はモデルのタンパク質としてProtein Data Bank(PDB)の番号4N5TであるMDMXのバインダーのデザインをしてみましょう!

MDMXは、ヒトのタンパク質で、がんの発生に関与することが示唆されています。MDMXは、p53という重要ながん抑制因子を抑制することができます。これは、p53の正常な機能を阻害し、がん細胞の形成や進行につながる可能性があります。一方、MDMXの欠失は、胚の発育異常を引き起こすことが知られています。

MDMXは、がん治療の標的となる可能性があります。MDMXを標的とした治療法の開発は、p53を再活性化し、がん細胞の増殖を抑制することが期待されています。この治療法の開発により、がん患者の治療に大きな貢献が期待されています。

画像のように以下の手順をしてみてください。

  1. nameに名前を入れる。ここではMDMXbinder。このときスペースは入れないでください。
  2. contigsに結合箇所とタンパク質の長さを入れる。ここではA:30。MDMXのchain Aに結合する長さ30のタンパク質をデザインします。
  3. pdbにMDMXのPDB番号を入れる。ここでは4N5T。
  4. Display 3D structureのanimateはチェックを入れても入れなくても良いですが、面白いので、チェックを入れましょう笑

5. あとは上にあるランタイムタブから全てのセルを実行を押してください。あとは数分待つだけです。

結合剤の生成アニメーション


先ほどanimateにチェックを入れたので、アニメーションが生成してきます!

これだけみても面白いですよね!

結果


しばらくすると作業が終わり、zipファイルがダウンロードされてきます。ダウンロードされたファイルのbest.pdbをpymolで開いてみてください。もっとも信頼性の高い複合体が示されます。

開いたらDisplay→Sequenceから配列を見てみましょう。

わかりやすいようにデザインされたbinderを赤くします。

美しいα-ヘリックス構造を持つタンパク質ができました!緑色が MDMX、赤色が今回デザインされたタンパク質です。

既存の構造との重ね合わせ


Protein Data Bank(PDB)の番号4N5TであるMDMXは本来、別のbinderとの複合体になっています。ですので、本来のbinderとの結合はどのように違うのかを見てみましょう。

上記のFile→Get PDB…を押してもらい、PDB IDに4N5Tを押して本来のMDMXとそのbinderとの複合体をダウンロードしてください。

出てきた新しいMDMX(ここでは水色)のbinderの部分の色を適当に変更します。

水分子は邪魔なので、右側の4N5T→Hide→watersで消します。

最後に4N5T→Action→align→to molecule→bestで重ね合わせます。

本来のbinderと同じ位置に結合しているbinderがこのRF diffusionでデザインできたのがわかります。

最後に


いかができたでしょうか? RF Diffusion、ProteinMPNN、AF2を使っていとも簡単にタンパク質がデザインできIn silico 創薬ができるとても素晴らしい技術です。皆さんもRF Diffusion、ProteinMPNN、AF2を使ってお好きなタンバク質に自由にbinderを見つけてIn silico 創薬をしてみてください!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

jaJapanese