検索
速報

Google、第7世代TPU「Ironwood」一般提供開始 Anthropicもテスト中

Googleは、第7世代TPU「Ironwood」の一般提供を発表した。「推論の時代」を支えるAIアクセラレータと位置づける。併せてARMベースの「Axion」VMの拡張も発表した。Ironwoodは専門タスク、Axionは汎用タスクを担い、両者の組み合わせでワークロードを最適化できるとした。

Share
Tweet
LINE
Hatena

 米Googleは11月6日(現地時間)、4月に発表した第7世代TPU「Ironwood」の一般提供を開始すると発表した。Google Cloudは、Ironwoodを推論の時代を支えるカスタムAIアクセラレータと紹介した。Google Cloudの顧客向けに、数週間以内に一般提供を開始する予定だ。

 tpu
9216基のIronwood TPUを直接接続するIronwoodスーパーポッドの一部(画像:Google)

 Ironwoodは、米Anthropicなどによってすでにテストされており、「Claude」モデルのトレーニングからユーザーへのコスト効率の高いサービス提供までの道のりを加速させているという。

 Googleはまた、AIアプリケーション全体を支える効率的な汎用インフラとして、カスタムARMベースのプロセッサ「Axion」を搭載した仮想マシン(VM)ファミリーの拡張も発表した。

 Axionは、Web運営、データ分析、データベースなど、日常的なワークロード向けに、高い費用対効果やエネルギー効率を提供するように設計されている。このAxionポートフォリオには、「x86 VM」と比較して最大90%優れた価格性能を提供するという「N4A」と、Androidアプリ開発など、基盤となるハードウェアへの直接アクセスを必要とする特殊なワークロード向けのARMベースのベアメタルインスタンスである「C4A metal」がある。N4Aは現在プレビュー中で、C4A metalは間もなくプレビューで提供開始される予定だ。

 これらの製品は、異なる役割を果たすよう設計されている。Ironwoodは、モデルサービングという計算負荷の高い専門的なタスクを担う目的特化型AIアクセラレータであるのに対し、Axionは、高ボリュームのデータ準備、取り込み、インテリジェントなアプリケーションをホストするアプリケーションサーバの実行など、AIワークフローの運用上のバックボーンとして機能する効率的な汎用コンピューティング基盤だ。

 axion
(画像:Googleの動画より)

 Google Cloudは、IronwoodとAxionを組み合わせて使用することで、「推論の時代」におけるすべてのアプリケーションに対して、ワークロードに最適化された基盤を得ることができるとしている。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る