米Googleは4月22日(現地時間)、年次イベント「Google Cloud Next」で、独自開発のAIチップ「TPU」の第8世代を2モデル発表した。モデル学習向けの「TPU 8t」と推論向けの「TPU 8i」だ。いずれも今年後半に提供開始の予定だ。
AIエージェントの普及に伴い、事前学習、事後学習、リアルタイムでの推論提供に対するインフラ要件が大きく分岐したことから、同社は学習と推論のニーズにそれぞれ特化させるデュアルチップアプローチを採用したとしている。
学習に特化したTPU 8tは、第7世代モデル「Ironwood」と比較し、単一のスーパーポッドで最大9600チップまで拡張可能であり、3倍の処理能力と最大2.7倍のコストパフォーマンス向上を実現している。
推論に特化したTPU 8iは、前世代の3倍のオンチップSRAMを搭載し、「Boardfly」と呼ばれる新ネットワークトポロジーによって遅延を大幅に削減することで、推論のコストパフォーマンスを80%向上させた。
また、両モデルともにワット当たりのパフォーマンス(電力効率)が最大2倍に改善された。
スンダー・ピチャイCEOは発表文で「AIエージェントの時代に、インフラは最も要求の厳しいAIワークロードを処理するために進化する必要がある」と語り、このアーキテクチャの重要性を強調した。
Google Cloudでは、これら第8世代TPUを、米NVIDIAのVera Rubin、Blackwell、HopperベースなどのGPUポートフォリオとともに主要なプロセッサの選択肢として顧客に提供していく。Google Cloudのプラットフォームでは米Anthropicの最新モデルをサポートしているほか、Safe SuperintelligenceやCitadel Securitiesなどの企業がTPUインフラを活用して最先端のAI研究やワークロードを推進している。
IntelとGoogle、次世代AIインフラで提携強化
Anthropic、GoogleとBroadcomとの提携拡大 次世代「TPU」で3.5GWのAIインフラ確保へ
Google、第7世代TPU「Ironwood」一般提供開始 Anthropicもテスト中
Google、TPU搭載の宇宙AIデータセンター構想「Project Suncatcher」発表
Google CloudとAnthropicが提携拡大 AnthropicはTPUを最大100万個利用へCopyright © ITmedia, Inc. All Rights Reserved.
Special
PR