別記事で解説したが、GeForce RTX 50シリーズは新世代の動画エンコーダー(第9世代)/デコーダー(第6世代)を搭載している。
今回比較している3つのGPUのエンコーダー/デコーダーの搭載状況は以下の通りだ。
3080 Tiと比べると、5080はエンコーダーもデコーダーも2倍となっている。4080と比べた場合でも、デコーダーが1基増えているため、マルチストリーム再生時のパフォーマンスが改善しているものと思われる。
今回は時間の都合で、ULの総合ベンチマークテストアプリ「Procyon」に内包されたテスト「Video Editing Benchmark」を実施した。このテストは、「Adobe Premiere Pro」を使ってフルHD(H.264コーデック)と4K(H.265コーデック)の動画を2種類ずつ書き出す際のパフォーマンスを点数化する。負荷の大きい2つ目のテストは、エフェクト処理でGPUによるアクセラレーションを有効にできる。
総合スコアではなく、あえて書き出しに掛かった時間をチェックしてみると、以下の通りとなる。
順当に「5080>4080>3080 Ti」という結果となった。2つ目のテストは、GPUアクセラレーションをオフ(=CPU処理)にすると時間がめっぽう掛かり、ハイエンドCPU/GPUを搭載するPCであっても、全テスト終了までに1時間近く要することもある。エフェクトを多用する場合は、エンコーダー/デコーダーを含めたGPUの全体性能も重要となる。
5080は、グラフィックスメモリがGDDR7規格であり、PCとの接続にPCI Express 5.0バスを利用する。メモリやバスの高速化が積み重なった結果、従来モデルよりも高速な動画書き出しを実現できている。
動画の書き出しは、長尺になるほどわずかの差が大きな差となる。一層の時短を狙うなら、5080の導入は効果が高そうだ。
最近、NPUを搭載する「AI PC」が評判だが、AI(人工知能)の演算処理にGPUを用いるアプリ(プログラム)も多い。そこで動画の書き出しテストでも登場したULのProcyonを使って、GPU演算を利用するAIのパフォーマンステストを実施してみた。
「AI Computer Vision Benchmark」は、機械学習データを使って物体を検知する「コンピュータビジョン」の処理パフォーマンスを確認するテストだ。複数のAPI(命令セット)で同種のテストを実行可能で、命令セットによってはCPU/NPU/GPUのパフォーマンス差もチェックできる。
NVIDIA製GPUを搭載しているWindows PCの場合、本来はGPU演算のAPIとして「Windows ML(Direct ML)」か「NVIDIA TensorRT」を選択できる。しかし、現在のAI Computer Vision BechmarkはGeForce RTX 50シリーズにおけるTensorRT APIに対応していない(対応に向けた修正を準備している)。そこで今回は、Windows ML APIを使った場合の演算パフォーマンスを比較する。総合スコアは以下の通りだ。
やはり順当な「5080>4080>3080 Ti」という結果だった。Windows MLという汎用(はんよう)APIを使うことによるオーバーヘッドはさておいて、5080は4080比で1.14〜1.21倍、3080 Ti比で1.39〜1.53倍のパフォーマンスとなっている。機械学習ベースのAIを使う場合は、やはり「なるべく新しいGPU(グラフィックスカード)」がよさそうである。
ProcyonにはStable Diffusionベースの画像生成AIテスト「AI Image Generation Benchmark」もある。しかし、本テストも現時点ではTensorRT APIに対応していない。「ONNX」APIを使えばテスト可能なのだが、今回は時間の都合で見送った。
その代わり、ULとNVIDIAがβ提供しているFLUX.1ベースのAI Image Generation Benchmarkを実行してみた。このテストは、グラフィックスメモリの容量の都合から3080 Tiでの測定を行っていない。生成完了までの所要時間は以下の通りだ。
「5080>4080」なのはもちろんなのだが、FP4の演算で“大差”が付いている。これはGeForce RTX 50シリーズのTensorコアでFP4演算をネイティブサポートした成果である(GeForce RTX 40シリーズではFP8に変換してから演算するためオーバーヘッドが生じてしまう)。
生成AIにおいて、より高速な処理を行うには「精度をあえて低くする」ことが求められる場合がある。しかし、単に精度を低くしても演算器(ここではTensorコア)が低精度演算に対応していないと精度の変換にリソースを割かれてしまうという“本末転倒”な事態もあり得る。
その点、GeForce RTX 50シリーズでは低精度演算(FP4)をネイティブサポートしたのは、生成AI時代を踏まえた大きな変化といえる。
NVIDIAが新型GPU「GeForce RTX 50シリーズ」を発表 新アーキテクチャ「Blackwell」でパフォーマンスを約2倍向上 モバイル向けも
容積14Lで空冷だけどパワフル! Core i9-13900K搭載でコンパクトな「Intel NUC 13 Extreme Kit」を試す
これから買うなら3090 Tiよりも「GeForce RTX 4080」 そのワケを探る
今度のSUPERはどうだ? 17万円切りで4Kでも快適に使える「GeForce RTX 4080 SUPER」を試す
3090 Tiより高速な「GeForce RTX 4070 Ti」突如登場 発売中止の「GeForce RTX 4080(12GB)」を“リネーム”Copyright © ITmedia, Inc. All Rights Reserved.