本記事は低分子化合物の毒性予測について書かれた記事です。構造から毒性を予測するToxicophoresとQSARによる予測を行います。こちらの内容が理解できると、望みの化合物の毒性、それを引き起こす可能性のある官能基を簡単にわかることができるようになります。ぜひ皆さんもトライしてみて下さい！

動作検証済み環境

macOS Ventura(13.2.1)

自宅でできるin silico創薬の技術書を販売中

¥3,200 → ¥1500 今なら50%OFF!!

新薬探索を試したい方必読！
ITエンジニアである著者の視点から、wetな研究者からもdryの創薬研究をわかりやすく身近に感じられるように解説しています

技術書ページへ

自宅でできるin silico創薬の技術書を販売中

¥3,200 → ¥1,500 今なら50%OFF!!

分子ドッキングやMDシミュレーションなど、
自宅でできるin silico創薬の解析方法を解説したものになります！

技術書ページへ

毒性評価とは

創薬分野における毒性評価は、新しい医薬品の安全性を確認するために不可欠なプロセスです。この評価は、薬が人間に与える潜在的な害を理解し、回避することを目的としています。毒性評価は、通常、薬の開発初期段階で行われ、細胞培養、動物実験、そして最終的には臨床試験を通じて、薬の安全性プロファイルを確立します。このプロセスでは、急性毒性、慢性毒性、遺伝毒性、発がん性、生殖・発生毒性など、さまざまな種類の毒性が評価されます。近年では、in silico（コンピュータ上でのシミュレーション）や代替的なin vitro（試験管内での実験）方法が、動物実験の補完または代替として利用されるようになり、倫理的な懸念の軽減や、評価プロセスの高速化、コスト削減に貢献しています。毒性評価の結果は、薬の開発進捗、用量設定、投与スケジュールの決定に重要な役割を果たし、患者の安全と薬の効果的な使用を保証するために不可欠です。

in silicoにおける毒性評価については以下の二つがあります。

「Toxicophores」または「Structural alerts」による予測

「Toxicophores」または「Structural alerts」（SAs）は、化学物質が毒性を示す可能性がある特定の構造パターンです。これらは、単純で解釈しやすい方法で、副作用（ADRs）や毒性反応を引き起こす可能性のある化合物を識別するために使用されます。Toxicophoresは、体内での代謝によって活性化する前または後の化学物質の特徴を指します。化学物質をこれらのアラートに対してスクリーニングすることで、潜在的なリスクを持つ物質を早期に特定し、QSARモデルの予測を補完することができます。

定量的構造−活性相関（QSAR）モデルによる予測

定量的構造−活性相関（Quantitative Structure-Activity Relationship, QSAR）モデルは、化合物の分子構造とその生物学的活性や毒性との間の数理的関係を確立する手法です。分子の物理化学的特性を示す分子記述子と呼ばれるデータを用いて、機械学習のアルゴリズムを活用してモデルを構築します。これにより、新しい化合物の活性や毒性を予測することが可能になり、薬剤の開発や化学物質の安全性評価において非常に重要なツールとなっています。QSARモデルは実験的なテストを行わずに、早期段階でリスクのある化合物を特定することができるため、時間とコストを節約することができます。

この記事では

「Toxicophores」または「Structural alerts」による予測をToxAlertsで行い、

定量的構造−活性相関（QSAR）モデルによる血液毒性予測をすでに構築されたモデルで行っていきます。

ToxAlertsによる毒性評価

ToxAlertsとは

創薬分野では、特定の種類の毒性と関連する分子パターンを「構造アラート」（または「毒性因子」とも呼ばれます）として識別します。過去10年間の研究により、構造アラートを利用して潜在的に有害な化学物質を検出することは、効果的な手法であることが示されました。化学化合物を既知の構造アラートに対してスクリーニングすることは、定量的構造活性相関（QSAR）モデル（後半で解説）を補完し、その予測を解釈するのに役立つ良い実践となります。

ToxAlertsは、化学化合物を構造アラートに対してスクリーニングするためのプラットフォームです。このプラットフォームを使用すると、構造アラートを検索したり、独自のアラートを導入したり、アラートにヒットする化合物が含まれている化学ライブラリをスクリーニングすることができます。ToxAlertsは、創薬研究者が化合物の毒性リスクを事前に評価し、安全性の高い薬剤候補を効率的に選別するのに役立つツールとして機能します。

ToxAlertsによる毒性評価

それでは早速ToxAlertsによる毒性評価をしてみましょう。

まずはこちらにアクセスしてみてください。以下のような画面が出てくると思います。こちらのScreen your molecules をクリックしてみてください。

今回例としてしようする化合物は以前AI創薬の記事で発見したTolnaftateです。

分子ドッキングで新型コロナの原因タンパク質MProに対して、結合場所を予測しているので、

興味ある人はこちらから見てみてください。

TolnaftateをDraw Molecule で書きます。

Endpointに関してはわかりやすいようにGenotoxic carcinogenicity, mutagenicity　（遺伝毒性発がん性、変異原性）にしておきます。

もちろん他にしても大丈夫です。

Start screeningを押すと、この化合物の遺伝毒性発がん性、変異原性における毒性がわかるようになります。

結果

結果は以下のようになりました。

Tolnaftateに含まれるAromatic aminesがGenotoxic carcinogenicity, mutagenicity（遺伝毒性発がん性、変異原性）を引き起こす可能性があると出ています。

Aromatic aminesをクリックすると、Aromatic amineの構造や参考論文が出てきます。

QSARによる毒性評価

ToxAlertsが記載されているwebサイトOnline chemical modeling environment (OCHEM)にはこれまで構築されたQSAR機械学習モデルを使って、自身の化合物を予測することができます。

QSARモデルによる血液毒性予測

まずはこちらにアクセスしてApply a modelをクリックしてみてください。

以前に構築された様々なモデルの一覧を見ることができます。

今回は試しに血液毒性を予測するConsensus Hematotoxicityモデルを使ってみましょう！

クリックすると以下のModel Profileが出てきます。

Training set（訓練セット）: 1456件の記録を含むデータセットで、モデルの訓練に使用されました。このセットでは、モデルの精度（Accuracy）は79% ± 1.0、バランスの取れた精度（Balanced Accuracy）は76% ± 1.0、マシューズ相関係数（MCC）は0.54 ± 0.02、領域下の曲線（AUC）は0.85 ± 0.01となっています。
Test set（テストセット）: 701件の記録を含むデータセットで、モデルの汎用性をテストするために使用されました。テストセットでの精度は83% ± 1.0、バランスの取れた精度は77% ± 2.0、MCCは0.44 ± 0.04、AUCは0.84 ± 0.02です。

下部には混同行列（Confusion Matrix）が表示され、訓練セットとテストセットの両方について、実際のクラス（positive/negative）と予測されたクラスとの比較が示されています。この行列から、ヒット率（Hit Rate）、精度（Precision）、再現率（Recall）、特異度（Specificity）などのパフォーマンスメトリックを読み取ることができます。

例えば、訓練セットの混同行列において、実際に陽性（positive）であるものが355回、正しく陽性と予測され（ヒット率0.66）、陰性（negative）であるものが793回、正しく陰性と予測されました（ヒット率0.87）。精度（Precision）は陽性予測のうち正確だった割合を示し、ここでは0.74となっています。また、陰性予測で正確だった割合を示す精度は0.81です。

この情報から、モデルが比較的高い精度で血液毒性を予測できることがわかりますが、完璧ではなく、一定の誤分類が存在することが読み取れます。MCC値は、予測の品質を示す指標であり、+1の完璧な予測から0の無価値な予測、-1の完全な不一致までのスケールで評価されます。このモデルのMCCは中程度の値です。AUC値は、モデルがランダムな予測と比較してどの程度良いかを示すもので、1に近いほど良い予測をしていると評価されます。このモデルのAUCは0.85および0.84と比較的高く、良い予測性能を持っていると言えます。

それではTolnaftateをこのモデルに適用してみましょう。

以下のようにTolnaftateをDraw Molecule で書いて、Nextを押すと、予測が始まります。