AIチップ市場のトレンドも変化しつつある。
AIの処理は大きく、AIの「脳」を作る「学習」と、ユーザーの要求に応える「推論」の2つに分けられる。これまでは高性能な汎用GPUで両方の処理を担うケースが主流だったが、この方法では推論時のレスポンス速度や処理効率に無駄が生じるという課題があった。
そこで現在のトレンドとなっているのが、学習と推論それぞれに特化した専用チップの開発である。
Googleもこの流れを受け、最新の第8世代TPUで、学習向けの「TPU 8t」と推論向けの「TPU 8i」の2系統を発表した。特に推論向けのTPU 8iは、前世代と比べて性能対コストを80%改善しており、大規模推論のコスト構造を大きく変える可能性を秘めている。
推論能力の重要性が高まる中、推論に特化した専用チップを開発する新興ベンチャーも存在感を強めている。
代表例が米Groq(グロック)や米Cerebras(セレブラス)である。例えば、Cerebrasの最新システムは、NVIDIAのフラッグシップGPUと比較して推論速度が21倍に達するというベンチマーク結果を示しており、推論分野では汎用GPUを凌駕しつつあるとして市場から高い評価を受けている。
もっとも、NVIDIAもこうした動きを静観しているわけではない。
同社は推論特化チップを開発するGroqと巨額のライセンス契約を結び、事実上、自社陣営へ取り込む動きを見せている。実際に、NVIDIAの次世代AIプラットフォーム「Vera Rubin」には、推論特化チップ「Groq 3 LPU」が組み込まれており、メガワット当たりの推論スループットが最大35倍向上すると発表されている。
書類でよく見る「シヤチハタ不可」、シヤチハタ社長に「実際どう思ってますか?」と聞いたら意外すぎる答えが返ってきた
「あの時気付いていれば……」 モンスター社員を面接で見抜く、たった一つの重要質問
ニトリHDの時価総額半減……「36期成長神話」が崩壊した、これだけの理由
サンリオ株価、まさかの「ほぼ半値」に……なぜ? ジャパンIPに降りかかった災難の正体Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング