コラム
» 2020年11月18日 12時00分 公開

「Tiger Lake」×「Iris Xe MAX Graphics」はなぜ速い? インテルが説明 (1/2)

Intelが久しぶりの外部GPU製品として発売した「Iris Xe MAX Graphics」。Tiger Lakeと協調動作することでより高速に動作することが特徴だ。その仕組みを、日本法人であるインテルが説明した。

[井上翔,ITmedia]

 IntelがノートPC向けに開発した外部GPU「Iris Xe MAX Graphics」は、第11世代Coreプロセッサ(開発コード名:Tiger Lake)と協調して動作する「Intel Deep Linkテクノロジー」に対応することが特徴だ。

 CPUとGPUを協調動作させるメリットはどこにあるのか――日本法人のインテルが報道関係者に説明した。

Iris Xe MAX Graphics Iris Xe MAX GraphicsはAcer、ASUS、Dellから搭載製品が順次発売される
安生さん 説明を担当したIntelの安生健一朗氏(技術本部長)

Iris Xe Graphics/Iris Xe MAX Graphicsを簡単におさらい

 Iris Xe MAX GraphicsとTiger Lakeの内蔵GPU「Intel UHD Graphics」「Intel Iris Xe Graphics」は、いずれも「Xe-LPアーキテクチャ」に基づき開発されたものだ。

 Xe-LPアーキテクチャは、「TFLOPSからPFLOPSまでカバーできるスケーラビリティ(拡張可能性)」を持つGPUアーキテクチャ「Xe(エックスイー)」の土台となる。LPは「Low Power」を意味し、ノートPCでも使いやすい低消費電力で稼働することが特徴だ。

Xe Xeアーキテクチャは低消費電力で使える「Xe-LP」から、データセンターで使われるの「Xe-HPC」(高性能計算向け)までをカバーできるスケーラビリティが特徴。Xe-LPアーキテクチャはXeアーキテクチャの基礎となる

 Tiger Lakeに内蔵されるXe-LPベースのGPUのスペックは以下の通りとなる。

  • 演算ユニット(EU):48基/80基/96基(モデルによる)
  • 最大稼働クロック:1.1GHz〜1.35GHz(モデルによる)
  • 可変レートシェーディング対応
  • 「Intel Deep Learning Boost」対応
  • 「AV1」のハードウェアデコードに対応
  • PCI Express 4.0接続

 ノートPC用外部GPUとして開発されたIris Xe MAX Graphicsは、Tiger Lakeの内蔵GPUを強化し、専用のグラフィックスメモリを追加した構成となっている。

  • 演算ユニット(EU):96基
  • 最大稼働クロック:1.65GHz
  • グラフィックスメモリ:4GB(帯域幅は毎秒68GB)
  • 可変レートシェーディング対応
  • 「Intel Deep Learning Boost」対応
  • 「AV1」のハードウェアデコードに対応
  • PCI Express 4.0接続
Tiger Lake Tiger Lakeに統合されたGPUのスペック(最上位構成の場合)
Iris Xe MAX Graphics Iris Xe MAX Graphicsのスペック

Deep Linkの「深さ」はどこに?

 先述の通り、Tiger Lakeの内蔵GPUとIris Xe MAX Graphicsは、Deep Linkテクノロジーによる協調動作に対応する。どのくらい“深く”協調動作し、そのメリットはどこにあるのだろうか。

共通のソフトウェアフレームワークで利用できる

 Tiger Lakeの内蔵GPUとIris Xe MAX Graphicsは、共通のソフトウェアフレームワークを利用する。簡単にいうと、1つのデバイスドライバーでCPU内蔵GPUと外部GPUを一元管理できるようになっている。

 これにより、後述する「ダイナミックパワーシェア」を始めとする高度な協調機能を実現した。

統合 Tiger Lakeの内蔵GPUとIris Xe MAX Graphicsは、1つのデバイスドライバーで一元管理できるようになっている

電力と放熱を融通し合うことで単体よりも高いパフォーマンスを発揮

 外部GPUを搭載するノートPCでは、CPUと外部GPUで電力や放熱といったリソースを“共有”することが多い。

 そうなると「CPUの負荷が高いときは外部GPUへのリソースを融通する」「外部GPUの負荷が高い時はCPUへのリソースを融通する」といったことができると、より高い電力効率とパフォーマンスを実現できそうなものだ。しかし、一般にCPUと外部GPUのメーカーは異なることが多いため、相互に連携して動作させることは難しい。

 だがTiger LakeとIris Xe MAX Graphicsは同じIntel製で、先述の通りGPU部分は1つのドライバーで一元管理できる。そのメリットを生かした機能が、CPUと外部GPUで電力と放熱のリソースを融通し合える「ダイナミックパワーシェア」である。

 ダイナミックパワーシェアを使うと、CPUと外部GPUをそれぞれ単体で稼働した場合よりも処理性能を引き上げることができる。Intelが実際に行ったテスト(一部シミュレーション)によると、CPUに負荷が掛かる処理、GPUに負荷が掛かる処理の両方において、第10世代プロセッサ(開発コード名:Ice Lake)やTiger LakeにNVIDIAの「GeForce MX350」を組み合わせたノートPCよりも高いパフォーマンスを発揮できたという。

両方に融通 ダイナミックパワーシェアを使ってCPUと外部GPUの電力と放熱能力を融通し合うことで……
パフォーマンスアップ CPUに負荷が掛かる処理、GPUに負荷が掛かる処理の両方でより高いパフォーマンスが発揮できるという

2つのGPUでの並列処理も可能

 繰り返しだが、Tiger LakeとIris Xe MAX Graphicsは同じアーキテクチャのGPUを搭載している。Deep Linkでは、2つのGPUを並列動作させることで、DP4a命令による機械学習(AI)処理や、メディアエンコーダーを使った動画のエンコード処理を高速化できるという。

 とりわけ、動画のエンコードは「GeForce RTX 2080 SUPER」の「NVENC」と比べると、最大で2倍のスループットを実現できるという。ただし、この性能は「PoC(Proof of Concept)」、つまり本格実装前の計測値となる。本格的な機能実装は2021年上期を予定している。

Additive AI DP4a命令に対応するTopaz Labsの写真超解像処理ソフトウェア「Gigapixel AI」では、Deep Linkを利用することでGeForce MX350を搭載するノートPCと比べて最大7倍の処理速度を実現
Hyper Encoding メディアエンコーダーを協調動作させると、GeForce RTX 2080 SUPERのNVENCの4倍のスループットを実現できるという。ただし、協調動作の本格実装は2021年上期を予定している

Deep Linkは「Xe-HPG」への布石

 Deep Linkを最大限発揮するには、ソフトウェアの最適化も欠かせない。既に対応済みのソフトウェアもあるが、今後もソフトウェアの最適化を促していくという。

 この動きは、高性能ゲーミングPC向けの「Xe-HPGアーキテクチャ」のGPUの発売に向けたものでもある。Xe-HPGはラボ(研究拠点)での動作テストに入っているという。

最適化 Xe-HPGアーキテクチャの外付けGPUのリリースに向けて、Deep Linkへの対応を進める
       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

この記事が気に入ったら
ITmedia PC USER に「いいね!」しよう