Intel Data Center GPU Maxは、「Ponte Vecchio」という開発コード名で開発が進められてきたHPC/データセンター向けGPUだ。
HPCや機械学習のデータ処理をする観点に立つと、GPUはデータの並行処理のオフロード用途やメモリのアクセス速度(HBMの採用)においてCPUに先行している。しかし、グラフィックスメモリの容量やプログラムの移植性やリファクタリングがボトルネックになることが多かった。
その課題を解決すべく登場するのが、Intel Data Center GPU Maxである。このGPUはIntel独自のスケーラブルGPUアーキテクチャ「Xeアーキテクチャ」をベースにエクサスケールコンピューティング(1秒当たり100京回の演算を行う処理)を行える設計としたものだ。シリーズ全体の主な特徴は以下の通りである。
L2キャッシュの大容量化は効果てきめんなようだ。4K×4Kの2次元フーリエ変換を行う場合、L2キャッシュが32MBの場合の速度を「1倍」とした場合、408MB(最大値)とすると2倍の速度で処理できるようになるという(画像の32MB/80MBは、L2キャッシュの一部を無効化した状態で計測した値)Intelの説明によると、NVIDIAの「NVIDIA A100」のPCI Express接続版(グラフィックスメモリは40GB:参考記事)と比べてIntel Data Center GPU Max(詳細スペックは不明)は「OpenMC」「miniBUDE」「ExaMSR」「Riskfuel」のワークロードをより高速にこなせるという。
Intel Data Center GPU MaxはPCI Expressカードと、OAMモジュールの2形態で提供される。それぞれのラインアップと主な仕様は以下の通りとなる。
【PCI Expressカード】
【OAMモジュール】
なお、OAMモジュールには、モジュールを4枚連結できるユニット「Intel Data Center GPU Max Sybsystem」も用意される。
OAMモジュールはIntel Data Center GPU Max 1350とIntel Data Center GPU Max 1550の2製品が用意される。それぞれを4枚セットにしたIntel Data Center GPU Max Sybsystemも登場する
IntelとしてはIntel MaxシリーズでそろえることでHPCやAI処理のワークロードにおいて頂点に立てると考えているようだ。ただ、頂点をよく見ると、さらなる何かがありそうだが、詳しくは次のページで解説する
2種類のコアで「省電力」と「高パフォーマンス」を両立――Intelが「Alder Lake」の概要を公開 「Sapphire Rapids」にも新情報
Intelが「次世代Xeonプロセッサ(Sapphire Rapids)」をチラ見せ 広帯域メモリ内蔵バージョンを用意
IntelがPC向けCPU/GPUのロードマップを更新 「Raptor Lake」は2022年後半に
JEDECが「HBM3」の仕様書を公開 転送速度は毎秒819GBに
Intelがファウンドリ事業のイノベーション促進に向けて10億ドルの基金を設立 RISC-V団体にも加盟Copyright © ITmedia, Inc. All Rights Reserved.