AIは「大きい」より「小さい」方がいい──AIエージェントの開発手法、米NVIDIAが主張　LLMをSLMに移行する技術も掲載：Innovative Tech（AI+）

» 2025年08月14日 12時00分公開

[山下裕毅，ITmedia]

Innovative Tech（AI+）：

このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。

X：＠shiropen2

　米NVIDIA Researchに所属する研究者らが発表した論文「Small Language Models are the Future of Agentic AI」は、大規模言語モデル（LLM）を中心に構築されている現在のエージェントAIシステムが、実際の運用では小規模言語モデル（SLM）の方が適しているという主張をした研究報告だ。

論文のトップページ

　2024年の調査によれば、大手IT企業の半数以上がすでにAIエージェントを活用しており、この市場は2034年までに約2000億ドル規模に成長すると予測されている。しかし、これらのシステムの中核を担うLLMの運用には、膨大な計算資源とコストが必要となる。

　2024年だけでもクラウドインフラへの投資は570億ドルに達したが、実際のLLM APIサービス市場は56億ドルにすぎない。この10倍もの投資格差は、現在の運用モデルの非効率性を示唆している。

　研究チームは、AIエージェントの設計におけるLLMの優位性が過剰であり、ほとんどのエージェントのユースケースにおける機能的要求と整合性が取れていないと主張する。LLMは優れた汎用性と対話の流ちょうさを提供するが、実稼働しているエージェントシステムのサブタスクの大半は反復的、限定的、非対話的なものであり、そこでは効率的で安価なモデルが求められる。

形態が異なるエージェントシステムの図

　研究チームは、100億パラメータ以下のモデルをSLMと定義し、一般的な消費者向けデバイスで実行可能なモデルとして位置付けた最新のSLMは、LLMにしかできなかったタスクを遂行できるまでに進化してりう。例えば、MicrosoftのSLM「Phi-3」（70億パラメータ）は700億パラメータモデルと同等のコード生成能力を持ち、NVIDIA の「Nemotronシリーズ」は300億パラメータのLLMと同等の性能を90億のパラメータで実現している。

　エージェントシステムにおけるSLMの優位性は、その運用特性にある。エージェントの多くのタスクは反復的で範囲が限定されており、会話的な要素を必要としない。例えば、ツール呼び出し、データ抽出、特定形式での出力生成などは、汎用的な対話能力よりも、確実性と効率性が重要となる。

　LLMは、巨大な頭脳の一部しか使わない非効率さがあるのに対し、SLMは小さい頭脳を無駄なく使うため、根本的に効率が良い。70億パラメータのSLMは、1750億パラメータのLLMと比較して、レイテンシ、エネルギー消費、計算量において10～30倍効率的だ。

　さらに、SLMのファインチューニングは数GPU時間で完了するため、新しい要求への迅速な適応が可能となる。SLMはスマートフォンやPCなどの一般的な消費者向けデバイス上での動作も可能であり、オフライン環境での利用や、プライバシー保護の観点からも大きな利点を持つ。

　また巨大なAIを一つ使うより、専門分野を持つ小さなAIをレゴのように組み合わせるモジュール方式の方が、安価で速いエージェントを作れる。

　しかし、SLMの普及には障壁も存在する。すでに中央集権型LLMインフラに巨額の投資がなされており、業界全体がこの運用モデルを前提に最適化されている。また、SLMの開発と評価は依然として汎用ベンチマークに焦点を当てており、エージェント特有のタスクに対する最適化が不十分だ。さらに、SLMはLLMほどマーケティングや報道の注目を集めていないため、その経済的利点が広く認識されていない。

　研究チームは、既存のLLMベースのエージェントをSLMに移行するための具体的なアルゴリズムも提示している。まず、エージェントの全ての呼び出しをログとして記録し、データを収集する。次に、教師なしクラスタリング技術を用いて、繰り返されるパターンやタスクを特定する。各タスクに対して適切なSLMを選択し、収集したデータでファインチューニングを行う。このプロセスを繰り返すことで、継続的な改善サイクルが形成される。

　実際の適用可能性を検証するため、研究チームは3つの人気オープンソースエージェントを分析した。ソフトウェア開発を自動化するMetaGPTでは約60％、ワークフロー自動化のOpen Operatorでは約40％、GUIアプリケーション操作のCradleでは約70％のLLMクエリがSLMで置き換え可能と推定された。

　これらの数値は、現在のエージェントシステムにおける相当な割合のタスクが、より小規模で効率的なモデルで処理可能であることを示している。

Source and Image Credits: Belcak, Peter, et al. “Small Language Models are the Future of Agentic AI.” arXiv preprint arXiv:2506.02153（2025）.

OpenAIの「オープンなAI（gpt-oss-120b）」はGPUサーバじゃないと動かない？→約30万円の自作PCで動かしてみた
米OpenAIの「オープンなAI」の実行にはサーバ向けのGPU「H100」が必要ということだったので、約30万円の自作PCで実行してみた。
OpenAI、オープンなAIモデル「gpt-oss」発表　性能は“o4-mini”に匹敵　軽量版含む2種類を公開
米OpenAIは、オープンウェイトのAIモデル「gpt-oss」を発表した。データセンターやハイエンドPC向けの大規模モデル「gpt-oss-120b」と一般向けのPCでも稼働する中規模モデル「gpt-oss-20b」の2種類を公開している。
GPT-5は「より温かみのあるもの」に調整へ　アルトマン氏「AIモデルへの愛着」に持論
OpenAIのサム・アルトマンCEOは、「GPT-5」が、前モデル「4o」に癒やしを求めていた一部のユーザーに不評だったことを受け、「GPT-5を、より温かみのあるものにする」と、自身のXで発表した。
オードリー・タン×Sakana AIデビッド・ハーCEO対談　シンギュラリティに立ち向かう「プルラリティ」がもたらすものは
東京都や経団連からなる実行委員会が5月8～10日に東京ビッグサイトで開催したスタートアップイベント「SusHi Tech Tokyo 2025」で、台湾の前デジタル担当大臣オードリー・タン氏と、AIスタートアップ・Sakana AIのデビッド・ハーCEOが対談した。
“大は小を兼ねない”生成AI　注目集める「小規模言語モデル」（SLM）　そのメリットとは？
先日行われた、米Microsoftの開発者向けイベント「Microsoft Build 2024」の目玉の一つだった「SLM」（Small Language Model）。そもそもSLMとは何か？　何が期待されているのか？　SLMの基本を整理する。