「ウイルス」が本来の意味に立ち戻る日(2/3 ページ)

» 2016年12月27日 08時00分 公開
[Kaspersky Daily]

科学者はどのようにDNAを読むか

 科学者たちは、過去数世紀にわたり、極小物質の構造を究明する方法を開発してきました。例えば、X線構造解析や質量分析、各種の分光法などです。このような方法は、2〜4個の原子で構成される分子には極めて効果的でしたが、分子量の大きな分子の実験結果は複雑すぎて、理解できませんでした。分子を構成する原子の数が多いほど、分子構造を理解するのは難しくなります。

 DNAが最大の分子と考えられているのには、もっともな理由があります。ヒトの半数体細胞のDNAには、約30億の塩基対が入っています。DNAの分子量は、これまでに知られているタンパク質の最大分子量よりも数桁大きくなります。

 要するに、DNAは原子の巨大な集合です。従来の方法で得られた実験データの解析には、最新のスーパーコンピュータをもってしても、優に何カ月、もしかしたら何年もかかるかもしれません。

 しかし、科学者たちはシークエンス法を開発し、解析処理をぐっと加速しました。この方法は、長い塩基配列を短い断片に分割し、並行して分析できるようにするという考え方に基づいています。

 この方法では、分子レベルの道具、つまりポリメラーゼと呼ばれる特別なタンパク質(酵素)を用います。このタンパク質の主な役割は、鎖に沿って移動しながら塩基のレプリカを構築して、DNAをコピーすることです。

 しかし、必要なのはDNAの完全なコピーではありません。DNAを断片に分割し、それからプライマーとターミネーターという化合物を追加してDNAを複製できればいいのです。プライマーは複製処理の開始位置を、ターミネーターは終了位置をポリメラーゼに知らせます。

 プライマーは特定のヌクレオチド配列で構成されており、相補的な塩基配列を持つDNA鎖に自分自身を結合することができます。ポリメラーゼはプライマーを見つけると、配列の複製を開始し、溶液からDNA構成分子を取得していきます。あらゆる生命過程と同様、これらのプロセスは全て、液体形態で行われます。ポリメラーゼは、ターミネーター(鎖の構築プロセスの終わりを表す、改変されたヌクレオチド)のところまで配列を複製します。

 ただし、問題があります。ポリメラーゼ、DNA鎖、プライマー、ターミネーター、DNA構成分子は全て溶液の中に分散しています。したがって、ポリメラーゼがどこから処理を開始するのか、正確な場所の定義は不可能です。私たちが定義できるのは、配列のコピーを開始する位置と終了する位置だけです。

 ここでも、ITに例えて説明しましょう。私たちのDNAは「1101100001010111010010111」というビットの組み合わせだとしましょう。プライマーを「0000」、ターミネーターを「11」とした場合、確度の高い断片から順にならべると次のようになります。

0000101011

00001010111

0000101011101001011

00001010111010010111

 プライマーとターミネーターをいろいろ組み合わせて、考えられ得る短い配列を全て調べ、配列の構成情報に基づいて、より長い配列を推測します。

 直感に反した複雑なやり方のように感じるかもしれませんが、この方法はきちんと機能しています。実際、複数の処理を並行して進めるため、処理がかなりスピードアップされ、何カ月や何年どころか数時間で終わります。ITの視点では、それほど早くありませんが。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ