このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。
X: @shiropen2
上海交通大学と、AI研究機関・SII-GAIRに所属する研究者らが発表した論文「AlphaGo Moment for Model Architecture Discovery」は、AIが自律的にニューラルアーキテクチャを発見し、改良する能力を実証した研究報告だ。
従来のアーキテクチャ探索では、人間が定義した枠組みの中での最適化にとどまっており、イノベーションに本質的な限界があった。これに対して今回開発したシステム「ASI-ARCH」は、仮説の生成から実装、実験による検証まで、研究プロセスの全てを自律的に実行する。これにより、人間の想像力の制約を超えた真に革新的なアーキテクチャの創造が可能となった。
研究チームは2万GPU時間(GPUが処理にかかった時間)をかけて1773回の自律実験を実施。その結果、106個の新規アーキテクチャを発見した。これらのアーキテクチャは全て人間が設計したベースラインを体系的に上回る性能を示した。
特に発見されたモデル「PathGateFusionNet」は、Mamba2やDeltaNetといった既存の最先端モデルを複数のベンチマークで超える性能を実証。この成果は、AlphaGoが囲碁で人間のプロ棋士が予想もしなかった第37手を打って世界を驚かせたことをほうふつとさせる。
ASI-ARCHは、「Researcher」「Engineer」「Analyst」の3つのモジュールで構成している。Researcherモジュールは過去の実験データと人間の専門知識に基づいて新しいアーキテクチャを提案する。Engineerモジュールは、提案されたアーキテクチャを実際の環境で訓練・評価。Analystモジュールは実験結果を分析し、新たな洞察を抽出する。
この研究で最も重要な発見は、投入された計算資源(GPU時間)と発見される最先端アーキテクチャの数が比例関係にあることだ。これはAIアーキテクチャの発見というプロセスが、もはや人間の専門家の数や時間に縛られるものではなく、計算能力によってスケールアップできることを意味している。
Source and Image Credits: Yixiu Liu, Yang Nan, Weixian Xu, Xiangkun Hu, Lyumanshan Ye, Zhen Qin, Pengfei Liu. AlphaGo Moment for Model Architecture Discovery
AIでコーディングはどのくらい高速化できる?→実際は遅くなっていた 米国チームが実験 原因5つを特定
全てのAI言語モデルは、プラトンが説く「イデアの世界」を共有して見ている? 米コーネル大学が研究
AIは強化学習で“人間のだまし方”を学ぶ──RLHFの副作用、海外チームが24年に報告 「正解っぽい回答」を出力
AIは知っている「今、人間に評価されていることを」――GeminiやGPT、Claudeなど対象に自己認識実験
「この人誰?」「前に何話したっけ?」を解決──対話中、前回の会話内容を呼び出すAI搭載ARメガネCopyright © ITmedia, Inc. All Rights Reserved.