概要
PacBioシーケンスは、従来の手法と比べて、圧倒的に長いリードを獲得できる手法になります。
数十キロベースのロングリードのシーケンスにより、完全長ゲノム配列の作成、mRNAアイソフォームのリストアップ(Iso-Seq)、といった従来の手法では対応が難しかった場面で有効です。また、PCRを用いない、1分子レベルでリアルタイムに塩基を読み取るシーケンス法になりますので、増幅によるGCバイアスのリスクを排除できます。
本サービスでは、取得データ量、リード長・精度の異なる複数の仕様で対応が可能です。
目的やご要望に応じて、最適な仕様でご案内をします。
【1 Cell Run】
PacBio Revio(HiFi Read) :60~90Gb程度/Cell
【相乗りプラン】
PacBio Revio(HiFi Read, 200Mb):ゲノムサイズ10Mb未満のバクテリア向け
PacBio Revio(HiFi Read, 500Mb):ゲノムサイズ25Mb未満のバクテリア向け
* 取得データ量 1Gb, 5Gb の相乗りプランもございます。
PacBio Revio(
fig.1)(
fig.2)(
fig.3)(
fig.4)
PacBio Revioは、ヒトHiFiゲノムを1年間に1300サンプル解析できる能力を有しており、PacBio Sequel IIeシステムと比較して 20 倍超の演算能力を持ちます。HiFi シーケンスでは、90% の塩基が≥ Q30、リード精度の中央値が≥ Q30 という優れた精度により信頼性の高い結果が得られます。
【データ解析】
・de novo Assembly解析
・Annotation解析
* 解析に必要な取得データ量の目安:ゲノムサイズの20倍以上
・Mapping, Variant call, Annotation解析
・SV、CNV解析
* 解析に必要な取得データ量の目安:ゲノムサイズの15倍以上
PacBioシーケンスの特徴
ロングリード
数十キロベースのロングリードのシーケンスは、ゲノム全体を調べ、様々な構造変化を網羅的に把握することに長けています。また、完全長ゲノムを決定する際には、リードの短い従来法に比べ、コンティグの数を減らす(ギャップの数を減らす)ことができます。さらに、mRNAなどの転写産物の全長を 1リード内に収めることも可能であるため、高い精度でアイソフォーム(スプライシングバリアント)を同定することも可能となります。
高い精度
ライブラリー調製の工程で PCR 増幅を行わないため、増幅時のエラーや GCバイアスの影響を受けることなく、また、シーケンスエラーもランダムに発生するため、非常に精度の高いコンセンサス配列を得ることが可能です。得られたロングリードのコンセンサス精度は 「99.999%」 を超えます。このため、de novo Assembly解析やターゲットリシーケンスに非常に効果的です。
高精度ロングリード HiFiリード について
Circular Consensus Sequencing (CCS) を用いてHiFiリードを生成することで、取得データ量は制限を受けますが、より高精度なロングリードのデータを取得することが可能です。
高精度ロングリードである HiFi Read では、de novo Assembly解析に必要な取得データ量の目安が、ゲノムサイズの20倍以上となります。
PacBioシーケンスが有効なアプリケーション例
完全長ゲノム配列の作成(全ゲノムシーケンス)(fig.5)
従来の次世代シーケンスで用いられる、数百塩基単位のショートリードをアセンブルして完全長ゲノムの構築を目指す方法では、多くのコンティグが作られ、たくさんのギャップ(隙間)ができていました。
それに対し、数十キロベースの超ロングリードを獲得できるPacBioシーケンスでは、コンティグも少なく、ギャップが生まれにくいことから、完全長ゲノム配列の作成を目指す場合に非常に有効な手段となります。
リピート配列のシーケンス(fig.6)
従来のショートリードをアセンブルする方法では、各リード同士が似た配列となるため、リピート領域の中の繋がり方や、リピートの数が判別しにくいため、埋まりきらない領域として残っていました。
それに対し、PacBioの超ロングリードであれば、リピート領域の入り口から出口までを1つのリードでカバーできるため、リピート領域全体を決定することが可能となります。
mRNAアイソフォームのリストアップ(Iso-Seq)(fig.7)
ショートリードをアセンブルする従来の次世代シーケンサーを用いたRNA-Seqでは、アイソフォーム(スプライシングバリアント)の判別が困難でした。
それに対し、ロングリードのPacBioシーケンスでは、1つのリードで mRNA 分子全体を網羅することができる(mRNAの全長を 1リードでシーケンスできる)ため、多様なアイソフォームが混在する場合でも、それらを区別して、特性を評価することが可能です。