【ゲノム解析】WGS/WES解析のこと始め【バイオインフォマティクス】

【ゲノム解析】WGS/WES解析のこと始め【バイオインフォマティクス】

ゲノム解析に興味ある方はいらっしゃるのではないでしょうか。ゲノム解析ができると疾患との関連性がつかめるようになります。

この記事ではゲノム解析であるWGS/WES解析について解説しようと思います。

WGS/WES解析の外観がつかめるようになります。ぜひとも読んでください。

*本記事では、ゲノム解析用のサンプル調製の話ではなく、実際のシーケンスファイルを得たあとの解析にフォーカスして解説していきます。

Tested Environment

macOS Monterey (12.4), Quad-Core Intel Core i7, Memory 32GB

ゲノム解析とは?

ゲノム解析は、生物のゲノム、つまり遺伝情報全体の構造、機能、進化を理解するために行われる一連の方法です。この解析はDNAシーケンスの決定から始まり、そのデータを使って遺伝子の位置、遺伝子間の関係、遺伝子の変異などを特定し、これらの遺伝情報がどのように生物の形質や疾患に関連しているかを解明することを目的としています。

ゲノム解析には以下のような種類があります。

  • 全ゲノムシーケンシング(WGS):生物の完全なゲノム配列を決定するプロセス。これにより、疾患関連遺伝子の同定、進化的研究、種間の比較などが可能になります。
  • 全エクソームシーケンシング(WES):ゲノム中のすべてのエクソン(タンパク質をコードする遺伝子領域)を対象としたシーケンシング。遺伝性疾患の原因となる変異を探索するのに特に有用です。
  • ターゲットシーケンシング(target sequence):、特定の興味のあるDNAまたはRNAの領域だけを対象としたシーケンシング。WGS/WESよりも安価で、対象としたい遺伝子があらかじめわかっている場合に特に有用です。

https://www.mhlw.go.jp/content/001203469.pdf

ゲノム解析は、その高度な技術を様々な分野で応用することができ、医療から農業、生物学的多様性の研究、法医学に至るまで幅広い影響を及ぼしています。特に医療と精密医療の分野では、ゲノム解析は遺伝性疾患の診断、治療のカスタマイズ、薬剤選択時の副作用リスクの評価など、個々の患者に最適な治療法を特定するための重要なツールとなっています。

全ゲノム解析の流れ


変異解析(一次解析)までと、その結果を利用した発展的解析へのワークフローを示すと以下のようなイメージです。

  • 一次解析:シークエンス・データから変異情報の検出まで
    • シークエンス・データ (fastQ ファイル) ↓
    • アラインメントプロセス ↓
    • アラインメント・データ (BAM ファイル) ↓
    • 変異情報の検出
      • 変異情報のデータ (VCF ファイルなど)
        • SNV
        • Short Indel
        • コピー数異常 (CNV)
        • 構造異常 (SV)
        • ウイルスゲノム
        • レトロトランスポゾン
        • 生殖細胞系列別リファレンス
        • TMB, MSI
  • 検出変異等を利用した上流遺伝的解析
    • 変異Signature解析
    • HRDSignature, Chromothripsis
    • RNAシークエンスの発現解析
    • 免疫チェック解析
    • がんリスクの可視化
    • がんリスクデータベース

まず、シークエンスデータがアラインメントプロセスを通じてアラインメントデータ(BAMファイル)に変換されます。

次に、アラインメントデータから変異情報の検出が行われ、変異情報データ(VCFファイルなど)が生成されます。このステップには、単一塩基変異(SNV)、短い挿入・欠失(Short Indel)、コピー数変異(CNV)、構造変異(SV)の検出が含まれており、ウイルスゲノム、レトロトランスポゾン、生殖細胞系列別リファレンス、TMB(腫瘍変異負荷)、MSI(微小衛星不安定性)などの解析が可能です。

最後に、得られた変異情報を利用して、がんSignature解析、HRDSignature(ホモログ再組換え不全のシグネチャー)、Chromothripsis(染色体シャッタリング)、RNAシークエンスによる発現解析、免疫チェック解析、がんリスクの可視化、がんリスクデータベースの活用といったさらなる解析が行われます。

バリアントについて


バリアントは、DNAの塩基配列の差異を示す用語です。この差異には、一塩基多型(SNP)のように単一の塩基の変更から、塩基の挿入や欠失を含むindel、そして特定の配列の繰り返し回数の違いなど、多様なタイプが含まれます。これらの違いはすべて、バリアントとして分類されています。バリアントの例を以下に示します。

変異遺伝・欠失・挿入

変異遺伝・欠失・挿入とは、DNAを複製する過程でエラーが発生し、正常なDNA配列が変異することによって生じるものを指す。

  • 変異遺伝: DNA配列の1塩基が別の塩基に置き換わる変異
  • 欠失: DNA配列の塩基が失われる変異
  • 挿入: DNA配列に上に新たな塩基が挿入される変異

非同義変異 (Nonsynonymous mutation)

アミノ酸が置換する変異。

  • ミスセンス変異: アミノ酸が別のアミノ酸に置換する変異
  • ナンセンス変異: アミノ酸がストップに置換する変異

同義変異 (Synonymous mutation)

アミノ酸が置換されない変異 (サイレント変異と同義)。

フレームシフト変異

塩基の欠失や挿入によって読み枠がずれる変異。アミノ酸の変化に加え、翻訳ストップの強さを生ずる

コピー数異常 (CNV)

通常、細胞内の染色体の特定の領域は2コピー存在しますが、CNVはこれが0または1コピーに減少したり、3コピー以上に増加することを指します。このような変化によって、遺伝子の発現パターンが変わり、機能的な問題が生じる可能性があります。

構造異常 (SV)

染色体の一部が欠けたり、逆位、転座などによって他の染色体と不適切に結合したりする現象です。特に、転座は新しい遺伝子の形成や既存の遺伝子のエンハンサー領域の影響を受けることで、遺伝子活性が異常になる場合があります。例えば、BCR-ABL や EML4-ALK のような癌関連遺伝子がこのプロセスで形成されることが知られています。

変異遺伝、欠失、挿入の例


下図の例を見てみましょう。こちには、遺伝子変異とその結果として起こりうるアミノ酸の置換に関する情報が記載されています。細胞のタンパク質合成において、DNAの塩基配列がどのようにアミノ酸の配列に翻訳されるか、そしてどのような変異がアミノ酸置換を引き起こすかについて説明されています。

  • 変異遺伝の例では1塩基が塩基配列でのTからGに置換わっており、その結果アミノ酸がセリン (Ser) からアラニン (Ala) に置換されている (ミスセンス変異)
  • 欠失の例では1塩基 (T) が失われ、挿入の例ではおなじく左からGが新たに挿入されることにより、その部位以降のアミノ酸配列がずれている (フレームシフト変異)

https://www.mhlw.go.jp/content/001203469.pdf

ここには特定の塩基の変更が、元々のセリン(Ser)がアラニン(Ala)に置き換わるような一塩基置換(SNP)を示しています。また、塩基の欠失または挿入が起こると、タンパク質のアミノ酸配列全体が変わる可能性があることを示しており、これはフレームシフト変異として知られています。フレームシフト変異は、読み枠の変更を引き起こし、完全に異なるアミノ酸配列を生成する可能性があります。

さらに、変異によって一つのアミノ酸だけが別のアミノ酸に置き換わることもありますが、これがタンパク質の機能にどのように影響するかは、そのアミノ酸の性質とタンパク質内での位置に依存します。例えば、ヒスチジン(His)がチロシン(Tyr)に置き換わるような置換変異は、タンパク質の構造や機能に重大な変化をもたらす可能性があります。これらの変異は疾患の原因となったり、生物の適応と進化の過程で重要な役割を果たしたりします。

構造異常の例


SVの例として例えば、BCR-ABL や EML4-ALK のような癌関連遺伝子が構造異常で形成されることが知られています。画像では、最初に正常な9番染色体と22番染色体が示されており、それぞれにはABL遺伝子とBCR遺伝子が位置しています。次に、染色体の一部が互いに交換される転座が起こり、これが新しい染色体9と22を形成します。転座した22番染色体はフィラデルフィア染色体として知られ、新たにBCR-ABL融合遺伝子が形成されます。この融合遺伝子は、異常なタンパク質をコードし、細胞の成長と分裂の制御を失わせ、最終的に疾患原因となる異常なシグナル伝達を引き起こすことが知られています。

https://www.mhlw.go.jp/content/001203469.pdf

最後に


いかがだったでしょうか。これからWGS/WES解析の記事を書いていきますので、是非とも次回の更新をお待ちいただければ幸いです。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です