【BI試験】3-1ゲノム｜いけいけ理系NEO

【BI技術者認定試験対策】サイズで見分ける！「ノンコーディングRNAの分類」を攻略

タンパク質に翻訳されないノンコーディングRNA（ncRNA）。その種類は膨大ですが、まずは「長さ（サイズ）」によって2つのグループに大別する基本ルールを押さえましょう。

1. 問題：ncRNAの長さによる分類

【問題】 ノンコーディングRNA（ncRNA）は、その塩基長の長さによって「短鎖ノンコーディングRNA」と「長鎖ノンコーディングRNA（lncRNA）」の2つに大きく分類されます。この分類の境界（閾値）となる一般的な長さとして、最も適切なものはどれでしょうか？

① 20 塩基 ② 200 塩基 ③ 2,000 塩基 ④ 20,000 塩基

2. 正解：RNAのデータサイズに関する正解

正解： ② 200 塩基

3. 解説：200文字（塩基）を境界とするルール

ncRNAをサイズで分けるときの国際的な標準ルールが「200塩基（nucleotides：nt）」です。ITの文字数制限のように、この数字を境に呼び名と性質が変わります。

[ ncRNAの長さによる2大分類 ]

★ 短鎖ノンコーディングRNA（Small ncRNA）：

・長さ：200塩基未満（実際によく狙われるmiRNAやsiRNAは20〜30塩基程度）。

・主な役割：特定のmRNAに貼り付いて、ピンポイントで翻訳をジャミング（抑制）する。

★ 長鎖ノンコーディングRNA（lncRNA：Long non-coding RNA）：

・長さ：200塩基以上（数千〜数万塩基に及ぶものもあります）。

・主な役割：複雑に折りたたまれて立体構造を作り、ヒストンやDNAに直接作用して、ゲノムの広い領域のスイッチを一括で切り替える。

1. 試験のポイント: 試験では「長さによって短鎖と長鎖（lncRNA）に分類される」という概念そのものに加え、選択肢にある「200塩基」という具体的な閾値がピンポイントで問われることがあります。桁数の引っかけに騙されないよう、数字を頭に叩き込んでおきましょう。
2. バイオインフォの視点: 次世代シークエンサー（RNA-Seq）でRNAの量を計測する際、実験の準備段階（ライブラリ調製）で「200塩基より長いものだけを集める」「短いものだけを抽出する」といったサイズセレクション（フィルタリング）を物理的に行います。そのため、手元のデータが「短鎖RNAデータ（Small RNA-Seq）」なのか「全RNAデータ（Total RNA-Seq）」なのかによって、マッピングに使うリファレンス配列やアライメントツール（STARやBowtie2など）のパラメータ設定を最適化する必要があります。

4. まとめ

「ncRNAは長さに注目すると、短鎖（200塩基未満）と長鎖（200塩基以上）に分類される」です。前の問題で登場した『miRNAは短鎖』、『クロマチン構造を変えるlncRNAは長鎖』という関係性も、このサイズの定義を知ることでより立体的に理解できますね！

【BI技術者認定試験対策】ゲノムを支配する裏の主役！「ノンコーディングRNA」を攻略

以前の問題で、ヒトゲノムのうち「タンパク質の設計図」として使われているのはわずか1.5%程度だと学びました。では、残りの領域から作られる「タンパク質にならないRNA」の正体を整理しましょう。

1. 問題：タンパク質に翻訳されないRNA

【問題】 ゲノムから転写されて作られるRNAのうち、タンパク質へと翻訳されず、RNA分子そのものが細胞内で機能を発揮するRNAの総称（機能性RNA）を何と呼ぶでしょうか？

① mRNA（メッセンジャーRNA） ② ノンコーディングRNA（ncRNA） ③ 標的RNA ④ イントロン配列

2. 正解：RNAの分類と機能に関する正解

正解： ② ノンコーディングRNA（ncRNA：Non-coding RNA）

3. 解説：翻訳されない、だからこそできる仕事

名前に「ノン（非）コーディング（コードしない）」とある通り、タンパク質のアミノ酸配列を指定する暗号を持たないRNAです。しかし、彼らは細胞内の非常に重要なインフラや制御を担っています。

[ ノンコーディングRNA（ncRNA）の主な仲間 ]

★ インフラ系（古典的ncRNA）：

・tRNA（転移RNA）：アミノ酸を運ぶ、翻訳の必須パーツ。

・rRNA（リボソームRNA）：タンパク質工場（リボソーム）の本体。

★ 制御系（新型ncRNA）：

・miRNA（マイクロRNA）：約22塩基の短いRNA。特定のmRNAに貼り付いて、その翻訳をブロック（遺伝子発現を抑制）します。

・lncRNA（長鎖ノンコーディングRNA）：200塩基以上の長いRNA。ヒストン（第6問）に作用してクロマチンの構造を変化させ、ゲノムのスイッチを大胆に切り替えます。

1. 試験のポイント: 「タンパク質には翻訳されず、RNA自身が機能を持つ」という定義文が出たら「ノンコーディングRNA（ncRNA）」を選びましょう。また、tRNAやrRNA、miRNAなどがすべてこのncRNAの「一族（サブカテゴリ）」であるという構造関係も頭に入れておくと、選択肢の絞り込みが非常に楽になります。
2. バイオインフォの視点: ncRNAはタンパク質に翻訳されないため、DNAの3文字（コドン）の並び規則をチェックする一般的な遺伝子予測アルゴリズム（ORFサーチなど）では見つけることができません。そのため、バイオインフォマティクスでは「RNAの二次構造（分子がどう折りたたまれるか）の熱力学的安定性」を計算して予測するRNAfoldなどの特殊なツールや、次世代シークエンサー（RNA-Seq）の発現データを用いて、未知のncRNAを同定する研究が盛んに行われています。

4. まとめ

「タンパク質にならないけれど、RNAのままで重要な働きをする＝ノンコーディングRNA」です。システム開発で例えるなら、処理プログラム（mRNA）そのものではなく、プログラムの実行タイミングを制御したり、実行環境のメモリ空間を管理したりする「構成ファイルやシェルスクリプト」のような、システムの安定運用に欠かせない裏方たちだと言えますね！

【BI技術者認定試験対策】ゲノムを跳び回る居候！「トランスポゾン」を攻略

ゲノムは一度決まったら固定されているわけではありません。自らの位置を変えてゲノム内を移動する、まるで「動く遺伝子」のような特殊な塩基配列を整理しましょう。

1. 問題：ゲノム内を移動する塩基配列

【問題】 生物のゲノムにおいて、細胞内で自身の位置を他の場所に「移動（転移）」させることができる、動く塩基配列（移動性遺伝要素）を何と呼ぶでしょうか？

① イントロン ② トランスポゾン ③ プロモーター ④ プラズミド

2. 正解：動く遺伝要素に関する正解

正解： ② トランスポゾン

3. 解説：ゲノムの「カット＆ペースト」と「コピー＆ペースト」

バーバラ・マクリントック博士によってトウモロコシの斑（ふ）入りの研究から発見され、後にノーベル賞を受賞した学術的に極めてインパクトの大きい現象です。

[ トランスポゾンの種類と動き ]

★ DNA型トランスポゾン：自身をゲノムから切り出して別の場所へ挿入する、いわゆる「カット＆ペースト」型です。

★ レトロトランスポゾン：一度RNAに転写されたあと、逆転写酵素によってDNAに戻り、別の場所に挿入される「コピー＆ペースト」型です。人間のゲノムではこちら（Alu配列やLINE-1など）が圧倒的多数を占めます。

※実はヒトゲノムの約40%以上が、これらトランスポゾンの残骸やその関連配列で埋め尽くされています。

1. 試験のポイント: 「ゲノム中を移動（転移）することができる」という特徴が書かれていれば、迷わず「トランスポゾン」を選びます。移動したトランスポゾンが重要な遺伝子の真ん中に飛び込むと、その遺伝子が破壊されて病気の原因になったり、逆に生物の進化や多様性を生み出す原動力になったりします。
2. バイオインフォの視点: ヒトゲノム中に大量に存在するトランスポゾンは、配列が非常によく似た「リピート（反復）配列」です。次世代シークエンサー（NGS）の短いリード配列をマッピングする際、これらの領域は「ゲノム上のどこに由来するのか」を特定するのが難しく、マルチマッピング問題としてバイオインフォマティシャンの頭を悩ませます。これを高精度に分類・アノテーションするために、RepeatMaskerなどの専用ツールが使われます。

4. まとめ

「ゲノム中を移動できる塩基配列＝トランスポゾン」です。システム開発で言えば、ソースコードの中にいつの間にか自己増殖するコードブロックが紛れ込んでいるような状態ですが、生命はこの動く要素を完全に排除せず、進化のバリエーションとして巧みに利用しているのが面白いところですね！

【BI技術者認定試験対策】人間の設計図のボリューム！「ヒトゲノムの遺伝子数」を攻略

2003年に解読が完了したヒトゲノム計画。私たちの身体を形作る「タンパク質の設計図（遺伝子）」は、一体いくつ存在していたのでしょうか？意外なその数字をインプットしましょう。

1. 問題：ヒトのタンパク質コード遺伝子数

【問題】 ヒトゲノム（約30億塩基対）の中に存在する、タンパク質の設計図として機能している主要な遺伝子（タンパク質コード遺伝子）の数として、最も適切なものはどれでしょうか？

① 約 2,000 個 ② 約 22,000 個 ③ 約 220,000 個 ④ 約 2,200,000 個

2. 正解：ゲノムの規模に関する正解

正解： ② 約 22,000 個

3. 解説：多すぎるゲノム、少なすぎる遺伝子

人間の遺伝子数が約2万個強というのは、生物の複雑さのイメージからすると驚くほど「少ない」数字です。

[ ヒトゲノムのデータスケール ]

★ 総塩基対数：約 30億 塩基対（bp）。

★ 遺伝子の数：約 22,000 個。

[ なぜ人間はこんなに複雑になれるのか？ ]

・実は、ヒトゲノム全体の中で「タンパク質の設計図」として使われている領域は、全体のわずか 1.5% 程度 しかありません。

・それなのに人間が複雑な組織を作れるのは、1つの遺伝子から異なるタンパク質を切り出す「選択的スプライシング」の仕組みや、残りの98.5%の領域（非コード領域）が高度な制御スイッチ（RNAなど）として複雑に働いているためです。

1. 試験のポイント: 試験では「約2万個」または「22,000個」という具体的な数字（桁数）がストレートに問われます。他の生物（シロイヌナズナやマウスなど）と比べても遺伝子の「数」自体は同等レベルである、という点も知識として押さえておきましょう。
2. バイオインフォの視点: ゲノム上のどこにこの22,000個の遺伝子があるかを特定する作業を「遺伝子予測（アノテーション）」と呼びます。バイオインフォマティクスでは、DNAの文字列から「ATG（開始コドン）」や「GT-AG（スプライシングサイト）」といった特徴的なパターンを機械学習や隠れマルコフモデル（HMM）等を用いて探索し、正確な遺伝子の位置をマッピングしていきます。

4. まとめ

「ヒトの主要な遺伝子数は約22,000個」です。30億文字という膨大なソースコード（ゲノム）に対して、実際の関数（遺伝子）の数は約22,000個と非常にコンパクトにまとまっており、その呼び出し制御（エピゲノムやノンコーディングRNA）が極めて高度に行われているシステムだと言えますね！

【BI技術者認定試験対策】ゲノム編集の案内役！「crRNA」を攻略

ノーベル賞を受賞したゲノム編集技術「CRISPR/Cas9」。ハサミ役である酵素（Cas9）を、狙ったDNA配列へと正確に案内するナビゲーター「crRNA」の役割をマスターしましょう。

1. 問題：標的DNAを認識するRNA

【問題】 CRISPR/Cas9システムにおいて、CRISPR領域から転写されて作られ、標的となる対象DNAの塩基配列と相補的に結合することで、Cas9酵素を目的の場所へと誘導する役割を持つRNAは何でしょうか？

① mRNA ② crRNA（CRISPR RNA） ③ tracrRNA ④ gRNA（ガイドRNA）

2. 正解：ゲノム編集の構成要素に関する正解

正解： ② crRNA（CRISPR RNA）

3. 解説：ハサミを誘導する「指名手配書」

もともとこの仕組みは、細菌が過去に感染したウイルスの断片（DNA）を自分のゲノム（CRISPR配列）に記憶し、再感染時にそれをRNAとしてコピーして敵を撃退する「獲得免疫システム」に由来しています。

[ CRISPR/Cas9を構成するRNAたち ]

★ crRNA（CRISPR RNA）：今回の主役。標的DNAとぴったり結合する「指名手配の顔写真（配列）」にあたる部分です。

★ tracrRNA（トランス活性化型CRISPR RNA）：ハサミ（Cas9酵素）とcrRNAをがっちり繋ぎ止めるための「ホルダー（土台）」の役割をするRNAです。

★ sgRNA / gRNA（シングルガイドRNA）：研究やゲノム編集をやりやすくするため、本来バラバラだった「crRNA ＋ tracrRNA」を人工的に1本に連結したものです。

1. 試験のポイント: 「対象DNAに対応する（相補的な）配列を持つ」という、ターゲット特異的な部分を指す場合は「crRNA」が正解です。一方で、「crRNAとtracrRNAを1本にまとめた人工RNA」という文脈であれば「gRNA（ガイドRNA）」が正解になります。問題文の細かいニュアンスを読み分けましょう。
2. バイオインフォの視点: ゲノム編集を設計する際、crRNAの配列（約20塩基）をどうデザインするかが極めて重要です。ゲノム上の目的の場所だけに結合し、似たような別の場所（オフターゲット領域）を誤って切断しないよう、全ゲノム配列を対象に高速に文字列検索（ブラストやマッピングアルゴリズム）を行い、最適なcrRNA配列候補を算出するソフトウェアの開発は、バイオインフォマティクスの中心的なテーマの一つです。

4. まとめ

「標的DNAをピンポイントで見つけ出すナビゲーター＝crRNA」です。これがあるおかげで、30億塩基もある膨大なゲノムデータの中から、たった1箇所のピンポイントなバグ（狙った配列）を見つけ出して書き換えることができるのですね！