AIが自律的にAIを開発する技術「ASI-ARCH」 中国チームなどが開発 「AlphaGoの“神の一手”のような設計へ導く」:Innovative Tech(AI+)
上海交通大学とSII-GAIRに所属する研究者らは、AIが自律的にニューラルアーキテクチャを発見し、改良する能力を実証した研究報告を発表した。
Innovative Tech(AI+):
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。
X: @shiropen2
上海交通大学と、AI研究機関・SII-GAIRに所属する研究者らが発表した論文「AlphaGo Moment for Model Architecture Discovery」は、AIが自律的にニューラルアーキテクチャを発見し、改良する能力を実証した研究報告だ。
従来のアーキテクチャ探索では、人間が定義した枠組みの中での最適化にとどまっており、イノベーションに本質的な限界があった。これに対して今回開発したシステム「ASI-ARCH」は、仮説の生成から実装、実験による検証まで、研究プロセスの全てを自律的に実行する。これにより、人間の想像力の制約を超えた真に革新的なアーキテクチャの創造が可能となった。
研究チームは2万GPU時間(GPUが処理にかかった時間)をかけて1773回の自律実験を実施。その結果、106個の新規アーキテクチャを発見した。これらのアーキテクチャは全て人間が設計したベースラインを体系的に上回る性能を示した。
特に発見されたモデル「PathGateFusionNet」は、Mamba2やDeltaNetといった既存の最先端モデルを複数のベンチマークで超える性能を実証。この成果は、AlphaGoが囲碁で人間のプロ棋士が予想もしなかった第37手を打って世界を驚かせたことをほうふつとさせる。
ASI-ARCHは、「Researcher」「Engineer」「Analyst」の3つのモジュールで構成している。Researcherモジュールは過去の実験データと人間の専門知識に基づいて新しいアーキテクチャを提案する。Engineerモジュールは、提案されたアーキテクチャを実際の環境で訓練・評価。Analystモジュールは実験結果を分析し、新たな洞察を抽出する。
この研究で最も重要な発見は、投入された計算資源(GPU時間)と発見される最先端アーキテクチャの数が比例関係にあることだ。これはAIアーキテクチャの発見というプロセスが、もはや人間の専門家の数や時間に縛られるものではなく、計算能力によってスケールアップできることを意味している。
Source and Image Credits: Yixiu Liu, Yang Nan, Weixian Xu, Xiangkun Hu, Lyumanshan Ye, Zhen Qin, Pengfei Liu. AlphaGo Moment for Model Architecture Discovery
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
AIでコーディングはどのくらい高速化できる?→実際は遅くなっていた 米国チームが実験 原因5つを特定
米国のAI研究機関であるModel Evaluation & Threat Research(METR)に所属する研究者らは、コーディングにおいて、AIツールを使うとどれくらい開発が効率化するかを調査した研究報告を発表した。
全てのAI言語モデルは、プラトンが説く「イデアの世界」を共有して見ている? 米コーネル大学が研究
古代ギリシャの哲学者プラトンは、私たちが見ている世界は真の実在(イデア)の影にすぎないと説いた。米コーネル大学の研究チームは、このイデア論を人工知能の世界に適用した研究を発表した。
AIは強化学習で“人間のだまし方”を学ぶ──RLHFの副作用、海外チームが24年に報告 「正解っぽい回答」を出力
中国の清華大学や米UCバークレー、米Anthropicなどに所属する研究者らは2024年、強化学習による言語モデルの訓練が、予期せぬ副作用として人間を誤導する能力の向上をもたらすという懸念すべき現象を実証的に確認した研究報告を発表した。
AIは知っている「今、人間に評価されていることを」――GeminiやGPT、Claudeなど対象に自己認識実験
MATSとApollo Researchに所属する研究者らは、最先端のAIモデルが自身が評価やテストを受けている状況を高い精度で識別できることを実証した研究報告を発表した。
「この人誰?」「前に何話したっけ?」を解決──対話中、前回の会話内容を呼び出すAI搭載ARメガネ
中国の清華大学に所属する研究者らは、ARグラスと大規模言語モデル(LLM)を活用した記憶拡張システムを提案した研究報告を発表した。


