メディア

Sponsord｜

PHILIPS

ITmedia PC USER >

AMDの「Instinct MI350シリーズ」は競合NVIDIAよりもワッパに優れるAIドリブンなGPU　今後の展開にも注目（3/4 ページ）

» 2025年07月15日 18時00分公開

[西川善司，ITmedia]

前のページへ 1|2|3|4 次のページへ

NVIDIAの「Blackwell」と比べて性能はどうなのか？

　ここまで来て、中には「ご託はいいから性能はどうなんだ？」と思っている人もいるだろう。それを意識してか、AMDもその辺のアピールを忘れていない。

　下の図は、Instinct MI355Xと競合製品である「NVIDIA GB200」「NVIDIA B200」の理論性能値を比べたものだが、GPU単体ではほぼ同等の性能を発揮できていることが分かる。

競合製品のNVIDIA GB200／B200を「1」とした場合のInstinct MI355Xの理論性能値。基本的には同等かそれ以上の性能を確保できている

　実際の大規模言語モデル（LLM）でパフォーマンスを比較した場合でも、FP4／FP8／BF16演算を用いる場合は同等かそれ以上の結果を出せているという。

代表的なLLMのFP4における実効パフォーマンス

代表的なLLMのFP8／BF16における実効パフォーマンス

　AMDとしては「絶対性能において、NVIDIAのBlackwellには引けを取らない」ということをアピールしたいのだろう。

「Infinty Fabric」と「Infinity Cache」の様子

　AMDでは、半導体のインターコネクト（内部接続）に「Infinity Fabric」を利用している。

　先代のCDNA 3アーキテクチャ世代のInfinity Fabricは、4基の小さな「I／O Base Die（IOD）」を互いに全て接続する「フルメッシュ接続」状態だった。それに対してCDNA 4アーキテクチャのInfinity Fabricは、2基のIODが“一辺で”2.5D的に接合されている。ネットワーク網としては、随分と簡略化されている。

　ただし、AMDによるとIOD間のデータ伝送帯域は毎秒5.5TBで、「Accelerator Compex Die（XCD）」の伝送速度も最大14％高速化されたという。

　IODの構成自体は大きく変わった一方で、CDNA 4のメモリ階層を支える「Infinity Cache」システムは、CDNA 3から大きく変わっていない。

CDNA 4（Instinct MI350シリーズ）における8基のXCDと8スタックのHBM3Eメモリは、Infinty Fabricで結ばれている

　HBM3Eの各メモリスタックには、2MB単位のバンク型アレイが16基ある構成となっている。このスタックは全部で8個あるので、Infinity Cacheの総容量は「2MB×16バンク×8スタック＝256MB」となる。

　Infinity Cacheは、事実上のL3キャッシュだ。「なぜ2MB単位でバンク管理がなされているの？」という点だが、これは256MBの単一キャッシュ構成にすると、キャッシュの当落判定時間が増大する上に、アクセスの並列性も悪化するからだ。

　今回のInstinct MI350シリーズでは、2MBバンクが全体で128個（16バンク×8スタック）あるため、HBM3Eメモリ全体がカバーするアドレスの全域を128分割したイメージで均等にカバー可能だ。さらに、128バンク分の並列アクセスも実現できる。

　なお、AMDによれば、Infinity Cacheのキャッシュ構成は「16ウェイのセットアソシエイティブ」だという。実際の運用においては、恐らくアドレスの一部ビットに基づいて、自動的に特定の2MBバンクが決定される方式となっていると思われる。

CDNA 4における演算とメモリのパーティショニングを深掘り

　CDNA4アーキテクチャは、1万6384基ものシェーダーコアがもたらす強大な演算パワーと、毎秒8TBの超高速なアクセスが可能な288GBのHBM3Eメモリを、用途に応じて内部構造（リソース配分）を仮想的に変えつつ利用可能だ。

Instinct MI350シリーズのリソース配分例。DPXは「Dual Processor Expansion」、QPXは「Quad Processor Expansion」を意味する。

　まず演算能力については、8基のXCDを「1基」「2基」「4基」「8基」の4形態に設定することが可能だ。

　8基のXCDを全て活用する「SPX（Single Processor Expansion）モード」は、大規模なデータに対して“全力で”演算に取りかかる必要のあるAI開発におけるトレーニングフェーズに向いている。逆に、小規模な推論モデルを動作させるフェーズでは、8基のXCDを個別に使う「CPX（Coherent Processor Expansion）」が適している。

　グラフィックスメモリに関しては、「2基のIODを1つに連結して統合した」という物理構造に起因したパーティショニングモードが2種類用意される。

　1つ目の「NPS1モード」は、1ソケットを1NUMAノードとして取り扱う。全てのXCDが8基のHBM3Eメモリの全体に渡ってインターリーブアクセスを行えるため、大規模AI開発における学習フェーズにおいて有効だ。

　2つ目の「NPS2モードは、2ソケットを1NUMAノードとして取り扱う。物理IODごとにメモリパーティションを区切る形で、具体的には1基のIOD当たり4つのHBM3Eスタックを割り当てて、2つのメモリーパーティションとして管理する。

　どちらのモードにしても、反対側のIODに実装されているHBM3Eメモリへのアクセスは遅延が大きくなることに変わりない。しかし、NPS2モードでは各XCDに割り当てられるメモリ空間が、優先的に同じIOD側にあるHBM3Eメモリで確保されるようになる。

　この特性を理解していれば、CDNA 4アーキテクチャでボトルネックとなりうるIOD間通信を抑止しつつ、システムを運用可能だ。ただし、演算パーティションとメモリーパーティションの切り替えは、GPUシステムの再起動が必要となる。

CDNA系アーキテクチャの未来とロードマップ

AMDのデータセンター向けGPU「Instinct MI350シリーズ」って？　歴史と構造、シリコンなどをチェック！
AMDが新型のデータセンター向けGPU「Instinct MI350シリーズ」を発表した。どのようなGPUなのか、そのあらましを見てみよう。【訂正】
AMDが「Instinct MI350シリーズ」を2025年第3四半期に出荷開始　275台以上のラックシステムを2030年までに“1台”にまとめる計画も
AMDが、新しいGPUアクセラレーター「Instinct MI350シリーズ」の出荷を2025年第3四半期に開始する。今後のGPUアクセラレーターに関するロードマップもチラ見せされた。
AMDのGPUアクセラレーター「Instinct」のロードマップを公表　「Insinct MI350X」は2025年内に登場
AMDが、AI処理やハイパフォーマンスコンピューティング向けに発売しているGPU「AMD Instinct」のロードマップを発表した。2024年後半には現行アーキテクチャにおける改良版をリリースし、2025年には新アーキテクチャ、2026年にはさらなる新アーキテクチャの製品を投入する予定だという。
AMDが新型GPUアクセラレータ「Instinct MI300シリーズ」の詳細を発表　「NVIDIA H100」よりも強い？
AMDが、投入を予告していたGPUアクセラレータ「Instinct MI300シリーズ」の詳細情報を公表した。「NVIDIA H100」のSMX5ボード版と比べると、ほぼ同じか上回るパフォーマンスを発揮できるという。
AMD、HPC向けのGPUアクセラレーター「AMD Instinct MI200」シリーズを発表　業界初のマルチダイGPU構成を採用
米AMDは、このほど開催したオンラインイベント「AMD Accelerated Data Center Premiere」にて最新GPUアクセラレーターとなる「AMD Instinct MI200」シリーズの発表を行った。

前のページへ 1|2|3|4 次のページへ

SpecialPR

アクセストップ10

2026年02月14日更新

カラー電子ペーパーで好きな画像を飾れる「SwitchBot AIアートキャンバス」が楽しい　13.3型の迫力と魅力（2026年02月13日）
珍しい縦折り＆日本語配列の「Ewin 折りたたみ式ワイヤレスキーボード」がセールで25％オフの3980円に（2026年02月13日）
手のひらサイズの小型PCがお得に！　GEEKOMが「冬セール」を開催中（2026年02月12日）
6500円でデスクに新風！　Thermalrightの小型液晶がヒット、背景にメモリ高騰？（2026年02月09日）
PC値上げの波はVAIOにも？　糸岡社長が明かす「マウスエフェクト」への対応とブランド価値の向上（2026年02月13日）
「雲」から降りてきたAIは「パーソナル」な存在になれるのか――開催から1カ月経過した「CES 2026」を振り返る（2026年02月12日）
ワコムが安い？　驚きの2025年を振り返り　メモリ高騰におびえる2026年の「自作PC冬眠」と「次世代CPU」への期待（2026年02月12日）
アイ・オー、拡張ドック機能を備えたType-C接続対応の27型4K液晶ディスプレイ（2026年02月12日）
デスクトップの音響環境を改善する「Edifier M60」が21％オフの1万8979円に（2026年02月13日）
MSI、ロープロ対応のGeForce RTX 3050グラフィックスカード（2026年02月13日）

ランキングトップ30

最新トピックスPR

過去記事カレンダー

2026年

2月
1月

2025年

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

Feed Back

利用規約

ITmediaはアイティメディア株式会社の登録商標です。

AMDの「Instinct MI350シリーズ」は競合NVIDIAよりもワッパに優れるAIドリブンなGPU 今後の展開にも注目（3/4 ページ）