Google、第8世代TPU「8t」と「8i」を発表──学習と推論の分離で効率を最大化

Googleは、独自開発のAIチップ「TPU」の第8世代となる、学習特化型「8t」と推論特化型「8i」を発表した。用途に合わせてチップを使い分ける新アプローチを採用し、前世代比で処理能力や電力効率が大幅に向上。NVIDIAの次世代GPU等とともに、最先端のAI研究や業務を支える強力なインフラとして今年後半から提供していく計画だ。

[ITmedia] PC用表示関連情報

LINE

Hatena

AI活用のいまが分かる

　米Googleは4月22日（現地時間）、年次イベント「Google Cloud Next」で、独自開発のAIチップ「TPU」の第8世代を2モデル発表した。モデル学習向けの「TPU 8t」と推論向けの「TPU 8i」だ。いずれも今年後半に提供開始の予定だ。

（画像：Google）

　AIエージェントの普及に伴い、事前学習、事後学習、リアルタイムでの推論提供に対するインフラ要件が大きく分岐したことから、同社は学習と推論のニーズにそれぞれ特化させるデュアルチップアプローチを採用したとしている。

　学習に特化したTPU 8tは、第7世代モデル「Ironwood」と比較し、単一のスーパーポッドで最大9600チップまで拡張可能であり、3倍の処理能力と最大2.7倍のコストパフォーマンス向上を実現している。

　推論に特化したTPU 8iは、前世代の3倍のオンチップSRAMを搭載し、「Boardfly」と呼ばれる新ネットワークトポロジーによって遅延を大幅に削減することで、推論のコストパフォーマンスを80％向上させた。

　また、両モデルともにワット当たりのパフォーマンス（電力効率）が最大2倍に改善された。

TPU 8tとTPU 8iの概要（表：GoogleのものをGoogle翻訳で日本語化）

　スンダー・ピチャイCEOは発表文で「AIエージェントの時代に、インフラは最も要求の厳しいAIワークロードを処理するために進化する必要がある」と語り、このアーキテクチャの重要性を強調した。

　Google Cloudでは、これら第8世代TPUを、米NVIDIAのVera Rubin、Blackwell、HopperベースなどのGPUポートフォリオとともに主要なプロセッサの選択肢として顧客に提供していく。Google Cloudのプラットフォームでは米Anthropicの最新モデルをサポートしているほか、Safe SuperintelligenceやCitadel Securitiesなどの企業がTPUインフラを活用して最先端のAI研究やワークロードを推進している。

Google、第8世代TPU「8t」と「8i」を発表──学習と推論の分離で効率を最大化

関連記事

関連リンク