キーワードを探す
検索

「トークン」関連の最新 ニュース・レビュー・解説 記事 まとめ

最新記事一覧

コーディングエージェントの導入が進む中、「トークン浪費」が課題となっている。MicrosoftのVS Code Eval Teamは、30種類のモデルを対象に累計5万回以上の検証を実施し、AIエージェントがタスク遂行の裏側で引き起こす「過剰思考」の実態を明らかにした。今後のエージェント運用においては「評価の自動化」も焦点となりそうだ。

()

AIエージェントの普及に伴うトークンコストの爆発にどう挑むか。HPEの年次イベントで、ルッソCTOは外部モデル依存による隠れたコストを指摘。推論を自社データセンターへ回帰させるためのインフラ戦略を、AMDの事例とともにレポートする。

()

Anthropicはエージェント型コーディングツール「Claude Code」のセッション管理とコンテキストウィンドウ管理について解説した。100万トークンのコンテキストウィンドウを活用しつつ、5つの選択肢を使い分けることが作業結果を大きく左右するとしている。

()

英Google DeepMindが開発したオープンソースAIモデル「Gemma 4」(ジェマ4)が、リリースからわずか1週間で200万ダウンロードを突破した。AIが処理する文字の単位であるトークン使用量に応じた利用料の高騰の傾向が続く中、無料モデルをローカルマシンにインストールすることでトークン出費を抑えたいユーザーに歓迎されているようだ。

()

米Anthropicは自社のサブスクリプションサービス「Claude Pro」「Claude Max」の利用者に対し、第三者製のAIエージェントツールへのトークン枠適用を停止すると発表した。この一件は大規模言語モデルと、それを動かす「ハーネス」(制御機構)の関係性がどうあるべきかという、AI業界の根幹を揺るがす問いを投げかけている。

()

Microsoftは、開発者がアプリケーションにAI機能を組み込めるローカルAI実行基盤「Foundry Local」の一般提供を開始した。ユーザーの端末上でAI処理を完結させる仕組みにより、クラウドへの依存やネットワーク遅延、トークン課金が発生しないAI実装が可能になるという。

()

世界のAI支出は2029年に2.1兆ドルへ達し、インフラ構築から「企業実装」へと主戦場が移る。特に中国はMaaSやロボティクスで圧倒的成長を見せ、評価指標もFLOPSから「電力あたりトークン数」へ変容した。急加速するAIスーパーサイクルで、情シスが決断すべきコスト管理と戦略的投資のポイントとは?

()

日本企業は中国製AIの利用に慎重だとされる。しかしその間にも、企業によるAI活用の現場では大きな変化が進行している。性能面では依然として米国のクローズドモデルが上位を占めるものの、実際の利用量では中国発のオープンモデルが急速に存在感を高めている。

()

Gartnerは、2030年までに1兆パラメーターの大規模言語モデルによる推論コストが生成AIプロバイダーにとって2025年比で90%超低下すると予測した。一方、エージェント型AIの普及でトークン需要が増大するため、企業が支出する推論の総コストは増加する見通しだという。

()

気軽に試せるラップトップ環境で、チャットbotを提供するオールインワンの生成AI環境構築から始め、Kubernetesを活用した本格的なGPUクラスタの構築やモデルのファインチューニングまで解説する本連載。今回は、LLMアプリケーション開発や運用で避けて通れない課題を、AI Gatewayで解決するアプローチを解説します。

()

欧州のAIチップの新興企業であるEuclydは、トークン当たりのコストを低く抑えられるハードウェアアーキテクチャを披露した。同社のチップ「Craftwerk」は、16384個のSIMDプロセッサを搭載し、最大8PFLOPS(FP16)または32PFLOPS(FP4)を実現する。NVIDIAやCerebras Systemsをはるかに上回る、2万トークン/秒を実行できるとする。

()

Anthropicは2025年8月13日、大規模言語モデル「Claude Sonnet 4」が最大100万トークンのコンテキストを扱えるようになったと発表した。書籍を丸ごと取り込んだり、大規模なコードベースを一度に処理したりできるようになるため、同社は「研究、開発現場に新たな可能性を提供する」としている。

()

NIIは、約1720億パラメーターの大規模言語モデル「LLM-jp-3 172B beta1」のプレビュー版を公開したと発表した。フルスクラッチ学習で作成され、学習データを含めて全てオープンになっている。

()
キーワードを探す
ページトップに戻る