【BI技術者認定試験対策】ゲノム解析の出発点!「DNAシークエンサー」を攻略
バイオインフォマティクス(生物情報科学)の世界は、生体からデータを取り出すところから始まります。その最も重要な入り口となる装置「DNAシークエンサー」の役割を整理しましょう。
1. 問題:遺伝情報のデジタル化
【 問題 】 生物の細胞から抽出されたDNAサンプルを読み取り、A、T、G、Cという塩基の並び(文字配列データ)として出力する装置の名称は何でしょうか?
① DNAマイクロアレイ ② DNAシークエンサー ③ サーマルサイクラー ④ 質量分析計
2. 正解:ゲノムデータ取得に関する正解
正解: ② DNAシークエンサー
3. 解説:生命の設計図を文字列へ変換する装置
DNAシークエンサー(塩基配列決定装置)は、目に見えない化学物質であるDNAの配列を、コンピュータで処理できる「テキストデータ」に変換する、いわばバイオ界のスキャナーです。
★ 第一世代(サンガー法):長くて正確な配列を読み取れますが、スピードとコストに限界がありました。ヒトゲノム計画初期の主役です。
★ 次世代シークエンサー(NGS):現在主流の技術です。DNAを細切れにして、数億本の断片を同時並行で爆発的に読み取ります(超並列シークエンシング)。
★ 第三世代(ロングリード):ナノポアなどの技術を使い、細切れにせず長い一本の鎖のままリアルタイムに読み取ることが可能です。
1. 試験のポイント: 「サンプルのDNA = 入力」、「塩基の並び(配列データ) = 出力」という関係性をしっかり押さえましょう。試験では、大量のデータを高速に出力する「次世代シークエンサー(NGS:Next Generation Sequencer)」という用語も非常によく出題されます。
2. バイオインフォの視点: NGSから最初に出てくる出力データは、数億行に及ぶ「リード(Read)」と呼ばれる短い断片データ(主にFASTQ形式)です。このバラバラのテキストファイルを、元の巨大なゲノム配列にパズルのようにつなぎ合わせる「配列アセンブリ(マッピング)」こそが、バイオインフォマティシャンやアルゴリズムエンジニアの腕の見せ所となります。
4. まとめ
「DNAから塩基配列のデータを出力する装置=DNAシークエンサー」です。この装置が吐き出す膨大な文字列データ(ビッグデータ)を解析するために、バイオインフォマティクスという学問が大きく発展してきました。まさにすべてのデータ解析の起点となる存在ですね!