キーワードを探す
検索

「トークン」関連の最新 ニュース・レビュー・解説 記事 まとめ

最新記事一覧

日本企業は中国製AIの利用に慎重だとされる。しかしその間にも、企業によるAI活用の現場では大きな変化が進行している。性能面では依然として米国のクローズドモデルが上位を占めるものの、実際の利用量では中国発のオープンモデルが急速に存在感を高めている。

()

Gartnerは、2030年までに1兆パラメーターの大規模言語モデルによる推論コストが生成AIプロバイダーにとって2025年比で90%超低下すると予測した。一方、エージェント型AIの普及でトークン需要が増大するため、企業が支出する推論の総コストは増加する見通しだという。

()

気軽に試せるラップトップ環境で、チャットbotを提供するオールインワンの生成AI環境構築から始め、Kubernetesを活用した本格的なGPUクラスタの構築やモデルのファインチューニングまで解説する本連載。今回は、LLMアプリケーション開発や運用で避けて通れない課題を、AI Gatewayで解決するアプローチを解説します。

()

欧州のAIチップの新興企業であるEuclydは、トークン当たりのコストを低く抑えられるハードウェアアーキテクチャを披露した。同社のチップ「Craftwerk」は、16384個のSIMDプロセッサを搭載し、最大8PFLOPS(FP16)または32PFLOPS(FP4)を実現する。NVIDIAやCerebras Systemsをはるかに上回る、2万トークン/秒を実行できるとする。

()

Anthropicは2025年8月13日、大規模言語モデル「Claude Sonnet 4」が最大100万トークンのコンテキストを扱えるようになったと発表した。書籍を丸ごと取り込んだり、大規模なコードベースを一度に処理したりできるようになるため、同社は「研究、開発現場に新たな可能性を提供する」としている。

()

NIIは、約1720億パラメーターの大規模言語モデル「LLM-jp-3 172B beta1」のプレビュー版を公開したと発表した。フルスクラッチ学習で作成され、学習データを含めて全てオープンになっている。

()

Googleは、WebパブリッシャーがGoogleの「Bard」や「Vertex AI」の生成API(これらのサービスを支える将来の世代のAIモデルを含む)を改良するために自サイトのコンテンツを使わせるかどうかを設定できるスタンドアロン製品トークン「Google-Extended」を発表した。

()
キーワードを探す
ページトップに戻る