ITmedia NEWS > 企業・業界動向 >
速報
» 2020年12月01日 09時01分 公開

Google系列のDeepMind、AIシステム「AlphaFold」で「タンパク質折りたたみ問題」で大飛躍 新薬開発への重要な一歩

Alphabet傘下のDeepMindのAIシステム「AlphaFold」が、世界的なタンパク質構造予測コンペ「CASP」で飛躍的なハイスコアを出した。「解明には宇宙の年齢よりも長い時間がかかる」とされる「タンパク質折りたたみ(フォールディング)問題」の解明への大きな一歩だ。

[佐藤由紀子,ITmedia]

 米Alphabet傘下のDeepMindは11月30日(現地時間)、タンパク質構造予測の重要な評価として知られるCritical Assessment of protein Structure Prediction(CASP)の予測コンペで、同社のAIシステム「AlphaFold」が飛躍的なハイスコアを出したと発表した。タンパク質構造の予測精度が上がれば、疾患の解明や新薬開発に役立てられる。

 casp CASPスコア(GDT精度の中央値)推移

 タンパク質は、ペプチド結合でアミノ酸の連なった直鎖が折りたたまって(フォールディング)立体構造を形成することで多様な機能を持つ。この構造を解明できれば、タンパク質が関わる疾患(特にアルツハイマー病やパーキンソン病などだが、新型コロナウイルスを含むほとんどの疾患にタンパク質が関わる)の解明にも近づく。だが、タンパク質が最終的な立体構造に落ち着くまでの折りたたみ方法はブラックボックスになっており、その理論的な数が天文学的なため、ブルートフォース計算によって典型的なタンパク質のすべての可能な構成を列挙するには、既知の宇宙の年齢よりも長い時間がかかると指摘されており、「タンパク質折りたたみ問題」として知られている。

 これまでの主な構造解析方法は、低温電子顕微鏡法や核磁気共鳴などを使うもので、数千ドルのコストが掛かった。

 DeepMindのAlphaFoldは、遺伝子配列情報からタンパク質の立体構造を予測するAIシステム。CASPコンペの課題解決には、約17万の解明済みのタンパク質配列とその形状を含む公開データベースでアルゴリズムをトレーニングし、約128個のTPU v3コア(約100〜200個のGPUに相当)を使って数週間かかったという。

 alphamind AlphaMindのシステム

 コンペでの、すべてのターゲットで平均92.4GDTという結果は、原子レベルでの実際の実験結果に匹敵する精度だと評価された。ただし、最も困難なターゲットでは87.0GDTで、まだ改善の余地がある。

 gdt タンパク質ターゲットの予測モデル例

 DeepMindがAlphaFoldの開発に着手したのは、AlphaGo引退宣言より前の2016年。現在は創薬や環境の持続可能性などの分野での採用を視野に入れている。今年に入って、これまで構造が不明だったORF3aを含む、SARS-CoV-2ウイルスのいくつかのタンパク質構造を予測した。このようなタンパク質構造の予測は、病気の理解を加速させる。

 DeepMindは、「AlphaFoldは、これまでで最も重要な進歩の1つだが、まだ多くの課題を解決する必要がある。(中略)外部の人々とも協力し、これらの科学的発見を新薬開発や環境管理のためにどのように使うべきかなどについて学んでいく」としている。


Copyright © ITmedia, Inc. All Rights Reserved.