プロナビ

AMDの「Instinct MI350シリーズ」は競合NVIDIAよりもワッパに優れるAIドリブンなGPU 今後の展開にも注目(1/4 ページ)

» 2025年07月15日 18時00分 公開
[西川善司ITmedia]

 AMDが6月12日(米国太平洋夏時間)、自社開催のイベント「ADVANCING AI 2025」の基調講演においてCDNA系列の最新GPU「Instinct MI350シリーズ」を発表した。

 InstinctMI 350シリーズは新しい「CDNA 4アーキテクチャ」を採用している。この記事では本アーキテクチャのメカニズムと、競合となるNVIDIAの最新GPUアーキテクチャ「Blackwell」との違いを解説していきたい。

Instinct MI350 Instinct MI350シリーズのボード

CDNA 4の動作メカニズムは?

 CDNA 4アーキテクチャ(Instinct MI350シリーズ)の論理的な全体ブロックダイヤグラムは以下の通りとなる。

CDNA 4アーキテクチャ(Instinct MI350シリーズ) CDNA 4アーキテクチャ(Instinct MI350シリーズ)の論理的な全体ブロックダイヤグラム

 演算コアとも呼べる「CU(Compute Unit/演算ユニット)」は、1つのXCD(GPUダイ)当たり36基搭載されている……のだが、そのうちの4基は無効化されている(上のダイヤグラムで灰色で示されているのが、無効であることを意味する)。

 本件について、AMDは「性能の最適化と、動作クロックの確保を意図した」と説明している。まあ、これは事実上製造プロセスにおける歩留まり確保の意味合いもあると見られる。

 いずれにせよ、Instinct MI350シリーズでは、1つのXCD当たり32基のCUがアクティブになるということだ。

 次の図は、1つ1つのXCDにおける「Global Resorces(グローバルリソース)」と呼ばれる部分を拡大したダイヤグラムになる。

GRブロックダイアグラム Global Resorcesのブロックダイヤグラム

 図中の「Unified Compute System」は、全XCDをまたいで動作するCDNA 4の“司令塔的”な存在、いわば全XCDにまたがるディスパッチやキューの管理を司る機能ブロックとなる。

 ブロックダイヤグラムを見ても連想できるように、ここから発行されたワークキューは「ACE→HQD→CU」という流れでワークへと伝送されていく。

 ACEは「Asynchronous Compute Engine」の略で、その名の通り非同期で演算ジョブを投入する機能ブロックになる。実はこれ、RadeonシリーズGPUではCDNAアーキテクチャの前身「GCN(Graphics Core Next)アーキテクチャ」から存在しており、いわゆる「GPGPU(Compute Shader)」の処理系を発行する役割を持つ。アーキテクチャ名をCDNAになってからも、仕事内容は事実上同じだ。

 ちなみに、据え置き型ゲーム機「PlayStation 4」のGPUコア(GCNベース)や、近代的3Dグラフィックス処理を重視して「RDNAアーキテクチャ」に移行した近年のRadeonにも、ACEブロックは備わっている。これはコンピュートシェーダーを動かすために必要だからだ。

 RadeonではACEと並んで、3Dグラフィックス処理を行うために「Graphics Command Processor(GCP)」「Geometry Processor(GP)」といったジョブ発行ブロックも用意されている。しかし、CDNA系GPUではこれらが省かれている前編でCDNA系GPUでは「3Dグラフィックスパイプラインを基本的に利用できない」と言ったが、それはGCPとGPが“ない”からに他ならない。

 HQDは「Hardware Queue Descriptor」の略で、CUに演算ジョブを発行するキューのスケジューリングを司る役割を持つ。0〜7のナンバリングが施されているのは、最大8本の独立したハードウェアキューを備えることを表している。つまり、CDNA 4アーキテクチャでは最大8個のカーネルやコマンドストリームを、ハードウェアレベルで並列処理ができることになる。

 演算の実務自体は、先述した36基のCU(CU0〜CU35)のうちアクティブな32基に各ジョブを割り当てて実践していくことになる。

       1|2|3|4 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

最新トピックスPR

過去記事カレンダー