米Googleは11月6日(現地時間)、4月に発表した第7世代TPU「Ironwood」の一般提供を開始すると発表した。Google Cloudは、Ironwoodを推論の時代を支えるカスタムAIアクセラレータと紹介した。Google Cloudの顧客向けに、数週間以内に一般提供を開始する予定だ。
Ironwoodは、米Anthropicなどによってすでにテストされており、「Claude」モデルのトレーニングからユーザーへのコスト効率の高いサービス提供までの道のりを加速させているという。
Googleはまた、AIアプリケーション全体を支える効率的な汎用インフラとして、カスタムARMベースのプロセッサ「Axion」を搭載した仮想マシン(VM)ファミリーの拡張も発表した。
Axionは、Web運営、データ分析、データベースなど、日常的なワークロード向けに、高い費用対効果やエネルギー効率を提供するように設計されている。このAxionポートフォリオには、「x86 VM」と比較して最大90%優れた価格性能を提供するという「N4A」と、Androidアプリ開発など、基盤となるハードウェアへの直接アクセスを必要とする特殊なワークロード向けのARMベースのベアメタルインスタンスである「C4A metal」がある。N4Aは現在プレビュー中で、C4A metalは間もなくプレビューで提供開始される予定だ。
これらの製品は、異なる役割を果たすよう設計されている。Ironwoodは、モデルサービングという計算負荷の高い専門的なタスクを担う目的特化型AIアクセラレータであるのに対し、Axionは、高ボリュームのデータ準備、取り込み、インテリジェントなアプリケーションをホストするアプリケーションサーバの実行など、AIワークフローの運用上のバックボーンとして機能する効率的な汎用コンピューティング基盤だ。
Google Cloudは、IronwoodとAxionを組み合わせて使用することで、「推論の時代」におけるすべてのアプリケーションに対して、ワークロードに最適化された基盤を得ることができるとしている。
Google、TPU搭載の宇宙AIデータセンター構想「Project Suncatcher」発表
Google CloudとAnthropicが提携拡大 AnthropicはTPUを最大100万個利用へ
OpenAIがGoogleのAIチップ採用 非NVIDIA製を初めて使用
Google、初の推論専用TPU「Ironwood」を今年後半Cloud顧客に提供開始へCopyright © ITmedia, Inc. All Rights Reserved.
Special
PR