計算資源競争にブレークスルー
生成AI開発に革新か “自律進化”で目的のAIを自動生成 超低コスト&短期間で高性能モデルも開発済 トップ研究者集団「Sakana AI」(1/2 ページ)
生成AIのトップ研究者らが東京で創業したAIベンチャー「Sakana AI」が、生成AI開発の新たな手法を開発したと3月21日に発表した。従来は人間が手動で設計し、多くの計算資源を使っていたが、同社の手法では設計を機械が自動で行い、“ほぼ無視できるレベル”の計算資源で開発が可能になるという。この手法で開発した日本語基盤モデルをGitHubで公開した。
同社が提案したのは「進化的モデルマージ」という手法。公開されているさまざまな基盤モデル(生成AIを含む、大規模なデータセットによる事前学習で各種タスクに対応できるモデルのこと)を組み合わせて新たなモデルを作る「マージ」に、進化的アルゴリズムを適用したものだ。
マージ自体は現在の基盤モデル開発で使われている手法で、モデルの“神経回路”(アーキテクチャ)の中に別のモデルの神経回路の一部を組み入れたり、入れ替えたり、神経同士のつながりやすさ(重み)を別のモデルを参照して混ぜたりすることで、モデルの性能を向上させられるというもの。
ただ、この組み合わせ方は無数にあり、従来は研究者の直感や経験則に基づいて行われてきたという。進化的モデルマージでは、マージの組み合わせ方法に進化的アルゴリズムを使い、モデル同士を何世代も掛け合わせることで、人間の経験に頼らず高性能なマージモデルを作ることに成功した。
しかも、AIの学習(訓練)フェーズで一般的に行われる「誤差逆伝播」は膨大な計算資源を消費するが、この方法では誤差逆伝播を全く必要とせず、ほぼ無視可能な計算資源でモデルを生成できるという。
7B同士のマージで70Bを上回る性能 たった1日の開発で
同社は進化的モデルマージの実証として、日本語大規模基盤モデル「EvoLLM-JP」、日本語画像言語モデル「EvoVLM-JP」、日本語画像生成モデル「EvoSDXL-JP」という3種類のモデルを作成。作成にかかった時間はいずれも1日以内という。
例えばEvoLLM-JPでは「日本語で数学の問題を解けるLLM」を目指し、7B(70億)パラメータの日本語モデルと、同じく7Bの数学特化な英語モデルを自動マージ。その結果、日本語での数学性能を測るベンチマークテストで既存の70Bのモデルすら上回ったという。
同社はこの結果について「日本にルーツを持つAIラボとして、まずは日本向けの最高クラスの基盤AIモデルを作成するためにこれらの技術を活用したいと考えた。しかし、今回の成果はこの技術の可能性を示したに過ぎない。このアプローチにはまだまだ多くの探求の余地があり、今回の結果は今後の長期的な研究開発の第一歩となるものと考えている」とコメントしている。
Sakana AIは、元Googleの研究者であるライオン・ジョーンズさんとデビッド・ハーさん、元メルカリ執行役員の伊藤錬さんが、東京で2023年8月に立ち上げたAIベンチャー。ジョーンズさんは現在の生成AIの中核となっているアーキテクチャ「Transformer」を提案した論文「Attention Is All You Need」の著者の一人。ハーさんはGoogle Brainの東京チーム設立時のトップやStability AIの研究トップなどを歴任した。24年1月にはシリコンバレーのベンチャーキャピタルやNTTグループ、KDDI、ソニーグループなどから45億円の資金を調達している。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
2
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
3
マイクロン、AI需要で広島工場増強へ起工式 1.5兆円投資
-
4
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
5
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
6
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
7
フィジカルAIに挑む日の丸連合、「Noetra」とは何か
-
8
ひろゆき氏「SIer衰退予測」、AI代替の「逆転現象」の理由 2026年に生き残るエンジニア“4つの役割”
-
9
ゲームエンジン「Godot」AI生成コードを原則禁止へ レビュアー疲弊「機械と話したくない」
-
10
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR