【ペプチドミメティクス】ペプチド→低分子変換パイプラインの開発【In silicoペプチド創薬】

この記事では、ペプチド-タンパク質複合体の結合を保ちながら、ペプチドを低分子に変換するAI駆動型パイプラインの開発について紹介します。

ペプチド医薬品は高い選択性と活性を持ちますが、分子サイズの大きさ、代謝安定性、膜透過性などの課題があります。本ツールは、これらの課題を解決するペプチドミメティクス（低分子）を効率的に設計することができます。

最新の構造解析技術、ファーマコフォアモデリング、AI逆合成解析を組み合わせた手法になっているので、ぜひ創薬研究の参考にしてみてください！

【この記事のまとめ】

創薬研究者やバイオインフォマティクスエンジニアに向けた、ペプチド医薬品の課題（膜透過性・代謝安定性）を克服し、AIを用いて低分子（ペプチドミメティクス）へ変換・設計するための自動化パイプラインの構築手法を解説します。

PDB1つで完結する自動設計ワークフロー: ペプチド-タンパク質複合体の構造データから、相互作用解析、ファーマコフォア抽出、ドッキング評価、さらにはAI逆合成解析までをPythonで一気通貫に実行可能。
実績あるオープンソースツールの統合: 分子計算の「RDKit」、ドッキングエンジンの「smina」、AI逆合成の「AiZynthFinder」を組み合わせ、客観的な数値（SA ScoreやQED等）に基づいた候補分子の選別を実現。
多様な分子設計戦略の提示: 単純なフラグメント化だけでなく、1,400種類のリンカーDBを用いた「リンカーベース設計」や、剛直な骨格を用いる「スキャフォールド設計」により、元の活性を維持した低分子化を提案。

この記事を読むことで、属人的な経験則に頼っていたペプチドミメティクス設計を体系化し、代謝安定性や経口投与の可能性を高めた次世代の低分子候補探索を大幅に効率化できます。

動作検証済み環境

Ubuntu 20.04 LTS, WSL2
CPU: Intel Core i7-13700F, メモリ：32GB
GPU: GeForce RTX 4070 (推奨、ただし必須ではない)
Python 3.11, Conda環境管理

自宅でできるin silico創薬【新薬探索編】 ~初心者でもできる”おうち創薬”~

自宅でできるin silico創薬の技術書を販売中

新薬探索を試したい方必読！
ITエンジニアである著者の視点から、wetな研究者からもdryの創薬研究をわかりやすく身近に感じられるように解説しています

技術書ページへ

自宅でできるin silico創薬【解析編】 ~”おうち創薬”を気軽に楽しもう！~

自宅でできるin silico創薬の技術書を販売中

分子ドッキングやMDシミュレーションなど、
自宅でできるin silico創薬の解析方法を解説したものになります！

技術書ページへ

自宅でできるin silico創薬の技術書を販売中

in silico創薬の技術を網羅的に知りたい方、さらにそれらを用いてPCだけで論文を書きたい方はこちら！

技術書ページへ

【初心者向け】各種ツールで学ぶin silicoタンパク質デザイン〜新規デザインから物性評価まで~

自宅でできるin silico創薬の技術書を販売中

タンパク質デザイン・モデリングに焦点を当て、初めてこの分野に参入する方向けに、それぞれの手法の説明から、環境構築、実際の使い方まで網羅！

技術書ページへ

【初心者向け】ネットワーク薬理学を使ったin silico創薬〜漢方、食材から医薬品候補を見つけてみよう~

自宅でできるin silico創薬の技術書を販売中

漢方、食材のどの成分が具体的に効くのかがわかる！医薬品候補を見つけてみよう！

技術書ページへ

自宅でできるin silico創薬の技術書を販売中

ここでしか手に入らない、In silico ペプチド創薬の決定版！

技術書ページへ

ペプチド医薬品の課題とペプチドミメティクス

ペプチド医薬品は、標的タンパク質に対して高い選択性と結合親和性を示すことで、近年注目を集めています。しかし、実用化にあたっては以下のような課題が存在します：

分子サイズが大きい：細胞膜透過性が低く、経口投与が困難
代謝安定性が低い：ペプチダーゼによる分解を受けやすい
製造コストが高い：合成が複雑で大量生産が困難

これらの課題を解決するアプローチの一つがペプチドミメティクスの設計です。ペプチドミメティクスとは、ペプチドの生物活性を模倣する低分子化合物のことで、ペプチドと同等の結合親和性を持ちながら、**低分子の利点（膜透過性、代謝安定性、経口投与可能性）**を兼ね備えています。

従来のペプチドミメティクス設計では、構造活性相関の解析や化学者の経験と直感に大きく依存していましたが、近年の構造生物学とAI技術の進歩により、より体系的かつ効率的なアプローチが可能になりました。

ペプチド→低分子変換アプローチ

この課題に対して有効なのが、構造情報とAI技術を組み合わせたペプチドミメティクス設計です。本手法では、以下の戦略を採用しています：

相互作用解析：ペプチド-タンパク質複合体から重要な相互作用を特定
ファーマコフォアモデリング：薬理活性に必須な化学的特徴を抽出
フラグメントベース設計：重要残基のフラグメント化と最適な結合戦略
AI逆合成解析：設計分子の合成可能性評価と合成ルート提案

従来の経験ベースの設計とは異なり、構造情報に基づいた系統的なアプローチにより、効率的なペプチドミメティクス探索が可能になります。

これまでペプチドミメティクス設計は専門的な知識と経験を要する複雑なプロセスでしたが、本パイプラインを使用することで、PDBファイル1つから自動的に低分子候補を生成し、合成可能性まで評価することができます。

環境構築

基本環境のセットアップ

こちらに開発したコードを記載しています。

以下を行い、Peptide-to-Small-Molecule環境をセットアップしてください。

# githubレポジトリのダウンロード
git clone https://github.com/Barashin/Peptide_to_small_molecule.git
# Peptide_to_small_moleculeフォルダへ移動
cd Peptide_to_small_molecule
# conda環境の作成
conda create -n peptide_pipeline python=3.11 rdkit -c conda-forge -y
conda activate peptide_pipeline
# 必要パッケージのインストール
pip install biopython numpy scipy matplotlib pillow
# ドッキングエンジン (smina) のインストール
conda install -c conda-forge smina -y

オプション: AI逆合成解析 (AiZynthFinder)

より正確な合成ルートを提案させたい場合は、以下も実行してください：

# AiZynthFinderのインストール
pip install aizynthfinder[all]
conda install -c conda-forge pytables -y
# 公開データのダウンロード
download_public_data aizynthfinder_data

パイプライン全体概要

パイプライン概要

1. 構造入力: ペプチド-タンパク質複合体のPDBファイルを入力。

2. 相互作用解析: 距離ベース接触解析により、重要な相互作用を特定。

3. ファーマコフォア抽出: 薬理活性に必須な化学的特徴（水素結合、疎水性相互作用等）を抽出。

4. 分子設計: 重要残基のフラグメント化と、複数の結合戦略による低分子設計。

5. ドッキング評価: 設計された低分子の結合親和性をsminaドッキングにより評価。

6. 多面的評価: Ligand Efficiency、薬剤らしさ(QED)、合成容易性(SA Score)による総合評価。

7. 逆合成解析: AiZynthFinderによる合成ルート提案と合成可能性評価。

使用ツールとライブラリ

主要ツール

ツール	バージョン	用途	ライセンス
RDKit	≥2022.09	分子計算・描画・記述子計算	BSD-3-Clause
smina	最新	分子ドッキング (AutoDock Vina改良版)	Apache-2.0
AiZynthFinder	≥4.0.0	AI逆合成解析	MIT
BioPython	≥1.79	PDB構造解析・配列処理	Biopython
NumPy	≥1.21	数値計算・行列演算	BSD-3-Clause
SciPy	≥1.7	科学計算・最適化	BSD-3-Clause
matplotlib	≥3.5	グラフ・チャート作成	PSF
Pillow	≥8.0	画像処理・分子図作成	PIL

アルゴリズム専用ライブラリ

ライブラリ	機能	参考文献
FEgrow リンカーDB	1,400種類の薬理学的リンカー	Bhati et al., J. Chem. Inf. Model. 2021
USPTO反応テンプレート	50k反応パターン（AiZynthFinder用）	Schneider et al., Chem. Sci. 2018
BRICS/RECAP	構造ベース逆合成解析	Degen et al., ChemMedChem 2008

分子記述子・評価指標

指標	アルゴリズム	説明
SA Score	Fragment-based	合成容易性 (1-10, 低い方が合成しやすい)
QED	Weighted descriptors	薬剤らしさ (0-1, 高い方が良い)
Ligand Efficiency	LE =	ΔG
Lipinski Ro5	MW≤500, LogP≤5等	薬剤様分子フィルタ
PAINS/BRENK	Substructure alerts	問題構造の検出

コードの実行

基本的な実行

# サンプルデータで実行
python pipeline.py Protein_Peptide.pdb
# 独自のPDBファイルで実行（チェーン指定）
python pipeline.py your_complex.pdb --protein-chain A --peptide-chain B
# AI逆合成解析を含めた実行
python pipeline.py your_complex.pdb --use-aizynthfinder

パラメータのカスタマイズ

以下のような引数で、様々なパラメータを設定できます：

引数	デフォルト	説明
`--protein-chain`	A	タンパク質チェーン ID
`--peptide-chain`	B	ペプチドチェーン ID
`--top-residues`	3	設計に使う上位残基数
`--cutoff`	4.5	接触距離カットオフ (Å)
`--exhaustiveness`	8	sminaドッキング exhaustiveness
`--sa-threshold`	6.0	SA Score 合成容易性閾値
`--use-aizynthfinder`	False	AI逆合成解析の使用
`--skip-docking`	False	ドッキング評価のスキップ

結果の選抜と可視化

パイプライン完了後、上位候補の選抜と合成スキーム図を生成：

python collect_best.py

結果

相互作用解析

まず、ペプチド-タンパク質複合体から重要な相互作用が自動で特定されます。

相互作用解析

各ペプチド残基の重要度がスコア化され、設計に使用する上位残基が選択されます。

ファーマコフォアモデリング

重要残基から薬理活性に必須な化学的特徴が抽出されます。

ファーマコフォア

水素結合ドナー・アクセプター、疎水性相互作用、芳香環スタッキングなどの特徴が3D空間にマッピングされます。

分子設計戦略

以下の戦略で低分子が設計されます：

1. フラグメントベース設計

重要残基の側鎖を直接フラグメント化
薬理活性に必須な部分構造を保持

1の後に、以下の２か３の設計が行われます。

2. リンカーベース設計

複数フラグメントを様々なリンカーで結合
剛直性と柔軟性のバランスを最適化

3. スキャフォールド設計

剛直なスキャフォールド（ベンゼン、ピペラジン等）上にフラグメントを配置
立体配座の制御と結合親和性の向上

ドッキング評価結果

設計された低分子候補のドッキングスコア分布です。

ドッキングスコア

原子数が約1/3の低分子でありながら、**高い結合親和性(-7.40kcal/mol)**を示す候補が特定されています。

(分子ドッキングでは、大体-7.0 kcal/molだと結合活性があるといわれています）

上位5候補の詳細評価

順位	分子名	スコア (kcal/mol)	HAC	LE	SA Score	QED
1	reduced_peptide_TRP_ALA_PRO_direct	-7.4	26	0.28	4.0	0.45
2	direct_link_TRP_ALA_PRO	-6.1	16	0.38	3.9	0.78
3	benzene_tri_TRP_ALA_PRO	-6.1	22	0.28	5.6	0.78
4	direct_link_TRP_ALA_direct	-6.0	11	0.55	1.9	0.64
5	reduced_peptide_TRP_ALA_PRO_C4	-5.8	34	0.17	3.9	0.20

LE (Ligand Efficiency) = |スコア| / 重原子数。0.3以上が良好。SA Score = 合成容易性。1 (容易) 〜 10 (困難)。6以下が推奨。QED = 薬剤らしさ。0.5以上が推奨。

可視化

だいたいInputの環状ペプチド（緑）と設計されたTop1の低分子（水色）が大体同じところに結合しているのがわかります。タンパク表面上のものなので、相互作用面を多くしたりするともっと結合力が上がると思われます。

AI逆合成解析結果

AiZynthFinderによる合成ルート提案の例です（1位の分子、7ステップ）。

合成スキーム

合成成功確率: 85% (AiZynthFinder予測)推定合成工程: 7ステップ出発物質: 市販化合物からスタート可能

環状ペプチド vs 設計低分子の比較

smina (AutoDock Vina) による比較の制限

結合親和性比較

⚠️ 重要な注意事項: sminaは定性的な評価ツールであり、厳密な結合親和性の定量比較には限界があります。

制限事項	説明
スコアリング関数の制約	低分子向けに最適化されており、ペプチドには完全に適していない
相対比較のみ可能	同一受容体での相対順位は有効だが、絶対値は実験値と乖離する可能性
分子サイズ効果	大きな分子（ペプチド）に対してペナルティが生じやすい

上図は傾向の把握のためのものであり、設計された低分子が元の環状ペプチドの約1/3の分子サイズでありながら匹敵する結合スコアを示すことを定性的に示しています。

より厳密な結合親和性評価手法

本プロジェクトでは、sminaの制限を補完する追加の評価手法も実装しています。必要に応じて実行してみてください

1. AutoDock CrankPep (ADCP) – 環状ペプチド専用評価

# 環状ペプチドの結合親和性を専用手法で評価
python dock_cyclic_adcp.py

特徴:

環状ペプチド専用のモンテカルロ法
暗黙的溶媒モデル (implicit solvation) 使用
より現実的なペプチド結合親和性評価 (典型的範囲: -10〜-35 kcal/mol)
smina (-5〜-10 kcal/mol) とはスコアスケールが異なるため直接比較不可

2. PRODIGY法 – 界面接触に基づく結合自由エネルギー予測

# 構造ベース結合親和性予測
python analyze_prodigy.py

アルゴリズム:

タンパク質-ペプチド界面の接触パターン解析
残基タイプ別接触数 (荷電性/極性/疎水性) をカウント
線形回帰による ΔG 予測 (Vangone & Bonvin, eLife 2015)
実験値との相関係数 r = 0.73 (文献値)

3. 統合的評価アプローチ

手法	適用対象	強み	制限
smina	低分子	高速、相対比較	ペプチドに不適、定性的
ADCP	環状ペプチド	ペプチド専用、現実的	低分子に適用不可
PRODIGY	タンパク質複合体	構造ベース、実験相関	動的効果を無視
実験検証	すべて	最終的真値	時間・コスト大