Innovative Tech(AI+)
Sakana AI、AIの“多様性”を尊重した集団を開発する手法「CycleQD」発表 生物の“すみ分け”がヒント
Innovative Tech(AI+):
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。
X: @shiropen2
AIベンチャー「Sakana AI」が発表した論文「Agent Skill Acquisition for Large Language Models via CycleQD」は、自然界の生物の「すみ分け」の仕組みをヒントに、小規模なAIモデル(AIエージェント)を複数育て上げ、それぞれが得意分野を持ちながら協力し合える新しい開発手法を提案した研究報告である。
大規模言語モデル(LLM)に特定のスキルを習得させる訓練には、依然として大きな課題が存在している。特に問題となっているのは、異なるスキルを学習させるためのデータの比率調整と、タスク固有の性能を適切に反映できない目的関数の設計である。
これらの課題を解決するため、研究チームは「CycleQD」という手法を開発した。この研究は、生態学における「ニッチ」(生態的地位)の概念をAI開発に応用するアプローチを提案している。
生態学では、ニッチとは生物種が持つ固有の能力や特性によって決定されるもので、その環境との関係を指す。これには、捕食する餌や占有する生活空間など、種の生存を可能にする特定のスキルや能力が含まれる。一度ニッチが占有されると、他の種がその既存の種を置き換えることは困難となる。
この生態学的なニッチの概念をAIエージェントに適用すると、各エージェントのニッチはその能力、実行可能なタスク、使用するリソースによって定義できる。十分に進化したエージェントは特定のニッチを効果的に占有し、他のエージェントとの競争に対して耐性を持つようになる。このアプローチにより、それぞれが特定の能力を持ち、互いに補完し合いながら全体として進化していくAIエージェントの集団を生み出すことが可能となる。
CycleQDフレームワークは、この考えを実践に移すものである。CycleQDの核となる特徴は、Quality Diversity(QD)フレームワークを周期的に適用する点にある。QDは単一の最適解を追求するのではなく、それぞれが独自の方法で優れた多様な解を発見することに焦点を当てる。
この周期的なアプローチにより、データの比率調整が不要となり、目的関数の設計も大幅に簡素化される。さらに、モデルマージによるクロスオーバーと特異値分解(SVD)ベースの突然変異を組み合わせることで、より効果的な学習を実現している。
初期集団には特定のタスクに特化した専門家モデルを配置し、そこから一般的な言語能力を保持しながら、エージェントタスクで高い性能を発揮する多様な小規模モデルの集団を進化させていく。
実験では、LLM「Llama3-8B-Instructモデル」を使用し、コーディング(MBPP)、データベース操作、オペレーティングシステム操作という3つのコンピュータサイエンスタスクに対してCycleQDを適用。各モデルは8Bパラメータという比較的小規模なサイズながら、従来の微調整やモデルマージングアプローチを上回る性能を示し、より多くのパラメータを持つとされる「GPT-3.5-Turbo」と同等の性能を達成した。
Sakana AIは、CycleQDの技術についてブログでは「知識やスキルを忘却せず蓄積していく『生涯学習』の実現への第一歩」と述べている。
Source and Image Credits: Kuroki, So, et al. “Agent Skill Acquisition for Large Language Models via CycleQD.” arXiv preprint arXiv:2410.14735(2024).
Copyright © ITmedia, Inc. All Rights Reserved.
Innovative Tech(AI+)
2019年の開始以来、多様な最新論文を取り上げている連載「Innovative Tech」。ここではその“AI編”として、人工知能に特化し、世界中の興味深い論文を独自視点で厳選、解説する。執筆は研究論文メディア「Seamless」(シームレス)を主宰し、日課として数多くの論文に目を通す山下氏が担当。イラストや漫画は、同メディア所属のアーティスト・おね氏が手掛けている。
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
日立、Anthropicと提携 グループ29万人に「Claude」などAI導入 社会インフラ分野にも展開へ
-
2
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
3
伊藤忠商事や三菱ケミカルなど16社が参画 大手企業の「暗黙知」を活用する新プロジェクト
-
4
「AIデータセンターの電力需要が急増」はホント? 発電大手Jパワー社長が明かした“報道との温度差”
-
5
「家庭教師のトライ」が学力診断にAI活用 20問解くだけで弱点を推定 生徒と講師の負担減らす
-
6
みずほFGが実現 2週間かかるAIエージェント開発を最短数日にする仕組みとは?
-
7
「最新のAI創薬ラボ」なのに会議室みたい!? 製薬大手がラブコール送る“異色のAI企業”による新拠点とは
-
8
OpenAI、「ChatGPT」に個人向け資産管理機能 金融口座と連携
-
9
話題の「Claude Mythos」、なんて読む? 「ミトス」か「ミソス」か、はたまた「ミュトス」か
-
10
最新AI「Claude Mythos」がSFすぎる件 研究者の作った”牢”を脱出、悪用懸念で一般公開なし──まるで映画の序章
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR