AMDが6月12日(米国太平洋夏時間)、自社開催のイベント「ADVANCING AI 2025」の基調講演においてCDNA系列の最新GPU「Instinct MI350シリーズ」を発表した。
InstinctMI 350シリーズは新しい「CDNA 4アーキテクチャ」を採用している。この記事では本アーキテクチャのメカニズムと、競合となるNVIDIAの最新GPUアーキテクチャ「Blackwell」との違いを解説していきたい。
CDNA 4アーキテクチャ(Instinct MI350シリーズ)の論理的な全体ブロックダイヤグラムは以下の通りとなる。
演算コアとも呼べる「CU(Compute Unit/演算ユニット)」は、1つのXCD(GPUダイ)当たり36基搭載されている……のだが、そのうちの4基は無効化されている(上のダイヤグラムで灰色で示されているのが、無効であることを意味する)。
本件について、AMDは「性能の最適化と、動作クロックの確保を意図した」と説明している。まあ、これは事実上製造プロセスにおける歩留まり確保の意味合いもあると見られる。
いずれにせよ、Instinct MI350シリーズでは、1つのXCD当たり32基のCUがアクティブになるということだ。
次の図は、1つ1つのXCDにおける「Global Resorces(グローバルリソース)」と呼ばれる部分を拡大したダイヤグラムになる。
図中の「Unified Compute System」は、全XCDをまたいで動作するCDNA 4の“司令塔的”な存在、いわば全XCDにまたがるディスパッチやキューの管理を司る機能ブロックとなる。
ブロックダイヤグラムを見ても連想できるように、ここから発行されたワークキューは「ACE→HQD→CU」という流れでワークへと伝送されていく。
ACEは「Asynchronous Compute Engine」の略で、その名の通り非同期で演算ジョブを投入する機能ブロックになる。実はこれ、RadeonシリーズGPUではCDNAアーキテクチャの前身「GCN(Graphics Core Next)アーキテクチャ」から存在しており、いわゆる「GPGPU(Compute Shader)」の処理系を発行する役割を持つ。アーキテクチャ名をCDNAになってからも、仕事内容は事実上同じだ。
ちなみに、据え置き型ゲーム機「PlayStation 4」のGPUコア(GCNベース)や、近代的3Dグラフィックス処理を重視して「RDNAアーキテクチャ」に移行した近年のRadeonにも、ACEブロックは備わっている。これはコンピュートシェーダーを動かすために必要だからだ。
RadeonではACEと並んで、3Dグラフィックス処理を行うために「Graphics Command Processor(GCP)」「Geometry Processor(GP)」といったジョブ発行ブロックも用意されている。しかし、CDNA系GPUではこれらが省かれている。前編でCDNA系GPUでは「3Dグラフィックスパイプラインを基本的に利用できない」と言ったが、それはGCPとGPが“ない”からに他ならない。
HQDは「Hardware Queue Descriptor」の略で、CUに演算ジョブを発行するキューのスケジューリングを司る役割を持つ。0〜7のナンバリングが施されているのは、最大8本の独立したハードウェアキューを備えることを表している。つまり、CDNA 4アーキテクチャでは最大8個のカーネルやコマンドストリームを、ハードウェアレベルで並列処理ができることになる。
演算の実務自体は、先述した36基のCU(CU0〜CU35)のうちアクティブな32基に各ジョブを割り当てて実践していくことになる。
AMDのデータセンター向けGPU「Instinct MI350シリーズ」って? 歴史と構造、シリコンなどをチェック!
AMDが「Instinct MI350シリーズ」を2025年第3四半期に出荷開始 275台以上のラックシステムを2030年までに“1台”にまとめる計画も
AMDのGPUアクセラレーター「Instinct」のロードマップを公表 「Insinct MI350X」は2025年内に登場
AMDが新型GPUアクセラレータ「Instinct MI300シリーズ」の詳細を発表 「NVIDIA H100」よりも強い?
AMD、HPC向けのGPUアクセラレーター「AMD Instinct MI200」シリーズを発表 業界初のマルチダイGPU構成を採用Copyright © ITmedia, Inc. All Rights Reserved.