本記事は、RNAやDNAの二次構造を予測できるRNAfold Web Serverの使い方を紹介します。Webブラウザ上からノーコードで解析できるため、だれでも気軽に試すことができます。この記事では、実施例をお見せしながら解説します。
Google Chrome バージョン 137
自宅でできるin silico創薬の技術書を販売中
新薬探索を試したい方必読!
ITエンジニアである著者の視点から、wetな研究者からもdryの創薬研究をわかりやすく身近に感じられるように解説しています
自宅でできるin silico創薬の技術書を販売中
タンパク質デザイン・モデリングに焦点を当て、初めてこの分野に参入する方向けに、それぞれの手法の説明から、環境構築、実際の使い方まで網羅!
RNA foldとは?
RNAfold Web Serverは、RNAの塩基配列からその二次構造を予測するためのオンラインツールです。オーストリアのウィーン大学によって開発された ViennaRNA Package の一部であり、RNAfoldコマンドラインツールのWeb版にあたります。ユーザーは、RNAの一次配列(A, U, G, Cからなる文字列)を入力するだけで、計算に基づいて最も安定な構造(自由エネルギーが最小になる構造)を可視化できます。商用利用も可能となっています。
アプタマーとその二次構造予測
アプタマー(Aptamer)は、特定の分子(タンパク質や小分子)と強く結びつく短いRNAまたは一本鎖DNAのことです。アプタマーは、抗体のように特定の標的を選んで結合する性質を持っていますが、化学的に合成できる点が大きな特徴です。
今回取り上げる以下の文献では,SARS-CoV-2スパイクタンパク質に対するアプタマーDNAとしてRBD-1CM1がin silicoで選択されました。本記事では,RNAfold Web Serverを用いて,このRBD-1CM1の二次構造を予測し,どのような結合特性を示すものかを調べてみましょう。
In-Silico Selection of Aptamer Targeting SARS-CoV-2 Spike Protein
RNAfold Web Serverの使い方
RNA配列を調べる
まず、解析対象のアプタマーのRNA配列(塩基配列)を調べます。RBD-1CM1の配列は論文中に掲載されていて,次のようになっています。
5'-CAGCACCGACCTTGTGCTTTGGGAGTGCTGGTCTAAGGGCGTTAATAGACA-3'
RNAfold Web Serverに配列を入力
RNAfold Web Serverにアクセスし「Sequence Input」欄にRNA配列を貼り付けます。
論文では特にパラメータの設定が他にないので、デフォルトの設定で二次構造を予測します。
今回は,初期設定のままで実行します。 画面をスクロールして右下のボタンをクリックします。
しばらくすると(3分くらい)画面が切り替わり解析結果が表示されます。
結果
以下のようなアウトプットになります。
DNAで予測しましたが、出力はRNAになっているようです。(TがUになっている)
最小自由エネルギー予測の結果(Results of minimum free energy prediction)
ドット・ブラケット表記で最も安定な二次構造が示されます。
ドット・ブラケット表記では,
(
と)
が塩基対.
が(塩基対になっていない)非結合の塩基
となります。
最小自由エネルギーは-14.90kcal/molで,このときRBD-1CM1の二次構造のドット・ブラケット表記はこうなりました。
CAGCACCGACCUUGUGCUUUGGAGUGCUGGUCUAAGGGCGUUAAUAGACA
((((((...(((........))).))))))(((((..........))))).
この結果から,RBD-1CM1が,複数のステム-ループ構造を含み,典型的な機能性RNAの構造をもつことがわかります。2つのステムがありますが,片方のステムには,小さなヘアピン構造を持ち,構造的に安定的な領域を作っています。もう一つのステムは,長めのループを含んでいます。これは,特定の分子と相互作用する認識部位である可能性が高いです。後述するように,RNAfold Web Serverでは二次構造のグラフィックも表示されるため,視覚的にこれらのことを確認することができます。
熱力学的アンサンブル予測の結果(Results for thermodynamic ensemble prediction)
The free energy of the thermodynamic ensemble is -15.38 kcal/mol.
The frequency of the MFE structure in the ensemble is 46.04 %.
The ensemble diversity is 7.80 .
熱力学的アンサンブルの自由エネルギーが-15.38 kcal/molというのは比較的安定な構造といえます。
最も安定(最低エネルギー)である構造の出現頻度が46.04%ですので,明確に1つの安定構造をもちます。一方で,他の構造もかなりの割合で存在していることがわかります。
アンサンブル多様性は7.80とやや高めです。(0 に近いほど構造が一様。10 以上で多様。)
つまり,特定の1構造に完全に固定されているわけではなく,柔軟に異なる構造をとれるようになっています。
以上より,RBD1-CM1は安定性と柔軟性のバランスが取れたRNAであり,環境変化に応じて構造を変えるような機能RNAとして性質を持っている可能性が高いといえるでしょう。
2次構造のグラフィック
最適構造の図がプロットされます。塩基対確率を符号化した構造図,位置エントロピーを符号化した構造図も得られます。左がRNA、右がDNAを表しており、下の赤枠でDisplay optionを変えれます。
塩基対確率(Base-pair probalities)を符号した最適構造
この図は、RNAの二次構造を表しており、各塩基の色は構造の安定性(ペアになっている確率)を示しています。赤い部分は非常に安定で、塩基同士が強く結合していることを意味します。黄色や緑はやや不安定で、結合の確実性が低いことを示します。青に近いほど結合せず、ループなど自由に動ける部分です。全体として、中央のステム部分は安定した構造を持ち、両端のループ領域は柔軟性が高い構造になっていることがわかります。
位置エントロピー(Positional Entropy)を符号化した最適構造
この図は、RNAの中で「構造が決まりやすい塩基」と「揺らぎが大きい塩基」を色で見せたものです。青はエントロピーが高く、不安定、逆に赤い部分は安定ということを示しています。
マウンテンプロット(Mountain Plot)
マウンテンプロットは、RNAの二次構造の全体的な形や安定性を視覚的に表現するグラフです。
- 横軸:RNAの塩基番号
- 縦軸:その塩基が構造中でどれだけステム(塩基対)に関与しているか、または構造の高さ
上段:Height(構造の高さ)
線の意味:
- 🔴 赤(mfe):最小自由エネルギー構造(Minimum Free Energy)
- 🟢 緑(pf):全配列のペアリング確率(partition function による期待値)
- 🔵 青(centroid):中心構造(ペアリング確率に基づく代表的構造)
解釈:
- 高さが高いほど、ペアになっている構造のステム(stem)が高い=安定したヘリックスを示唆
- mfe, pf, centroid がほぼ重なっていれば、構造予測に一貫性があることを意味します
- もし大きくズレているなら、不確実性が高い or alternative structure が存在することを示唆
下段:Entropy(エントロピー)
- 各位置における**構造の不確実性(情報エントロピー)**を示しています
- 値が高い ≒ その位置の塩基がどの塩基と結合するかが多様で不安定
- 値が低い ≒ その塩基のペア形成が安定しており、予測構造が定まっている
解釈の例:
- エントロピーが高い領域 → いくつかの構造パターンが競合している
- エントロピーが低い領域 → ステムなどで明確な二次構造が形成されている
この図からわかることは:
- 全体の構造は比較的安定しており、mfe・pf・centroidがよく一致している(赤・緑・青の重なりが大きい)。
- エントロピーが高い領域(10–15や35–45あたり)では、構造の予測が不確かで、代替構造が存在する可能性あり。
- エントロピーが低い位置は信頼性が高い(20–30あたりは構造が明確)。
総じて、この結果から分かることは
- 「配列の安定なステム領域」と「可変的なループや不確実な領域」が明確に分かれています。
- siRNA設計や構造機能解析で使う場合、「エントロピーが低い領域=安定結合部位」として注目されます。
最後に
いかがでしたでしょうか?
RNAfold Web Serverは、RNAやDNA配列の二次構造を簡単に予測できる無料ツールです。視覚的に安定性や柔軟性も確認でき、アプタマー設計にも役立ちます。
次の記事ではアプタマーの3次元構造の予測を行なっていきます!
参考文献
Lin YC, Chen WY, Hwu ET, Hu WP. In-Silico Selection of Aptamer Targeting SARS-CoV-2 Spike Protein. Int J Mol Sci. 2022 May 22;23(10):5810. doi: 10.3390/ijms23105810. PMID: 35628622; PMCID: PMC9143595.
自宅でできるin silico創薬の技術書を販売中
新薬探索を試したい方必読!
ITエンジニアである著者の視点から、wetな研究者からもdryの創薬研究をわかりやすく身近に感じられるように解説しています
自宅でできるin silico創薬の技術書を販売中
タンパク質デザイン・モデリングに焦点を当て、初めてこの分野に参入する方向けに、それぞれの手法の説明から、環境構築、実際の使い方まで網羅!