プロナビ

Intel Ignite 2023で優勝! AV1やH.266を超える圧縮率を実現するDeep Renderの「AIベースの動画圧縮技術」って何?Intel Ignite 2023(2/4 ページ)

» 2023年12月12日 17時00分 公開
[西川善司ITmedia]

Deep Renderの「AI圧縮技術」は何が違う?

 ここまでを踏まえた上で、Deep Renderの「AIベースの圧縮アルゴリズム」とはどのようなものなのかを、Deep Renderのジャン・スー氏(シニアリサーチエンジニア)と、クリ・ベセンバーチ氏(共同創業者)に聞いてみた。

スー氏 Deep Renderの圧縮技術の解説をしてくれたジャン・スー氏
クリス氏にトロフィー授与 クリスチャン・ベセンバーチ氏(左)に優勝トロフィーを渡すIntelのパット・ゲルシンガーCEO。ゲルシンガー氏が「君たちには期待しているよ」と言っているようにも見える一コマだ

 スー氏は「特許絡みで公にできない、あるいは公開しない概念もある」と前置きをしつつも、自社の技術について、いくつかの重要な“ヒント”を説明してくれた。同氏とベセンバーチ氏の話を聞くと、Deep Renderの「AI圧縮技術」はMPEG系の動画圧縮技術と似ている部分と、似ていない(ユニークな)部分の両方が混在していることが分かった。

 まず、似ている部分としては空間的な「フレーム内圧縮」と、時間方向の「フレーム相関圧縮」の概念を取り入れていることが挙げられる。一方で、ユニークなポイントとして各フレームをブロックに分解して処理していないのだという。

 Deep Renderでは、フレーム内圧縮に「CNN(Convolutional Neural Network:畳み込みニューラルネットワーク)」ベースのAIを活用しているという。話を聞く限りでは、着目しているフレーム内の適当な箇所に配置した「CNNカーネル」に、そこを基点とした全周領域の相似性を求めさせて、高い相似性があれば分布情報を量子化していく――というアルゴリズムとしているらしい。

 相似性の解析にブロックを用いないため、原理的に低ビットレートでもブロックノイズが発生しないのだという。CNNカーネルをフレーム内の「どこに」「どのくらい(いくつ)」「どういう基準で」配置するのかは説明してもらえなかったが、イメージとしてはMPEG系動画圧縮技術において離散コサイン変換を使う部分を、CNNベースのAIで置き換えているようである。ゆえに、これまた原理上低ビットレートでもモスキートノイズが発生しないそうだ。

ブロックノイズのイメージ図 ブロックノイズは「圧縮率が高すぎる(≒ビットレートが低すぎる)」ことによって起こることが多い。Deep Renderでは、ブロック単位で相似性解析を行わないため、低ビットレートでもブロックノイズが発生しないという(画像はイメージ図)
モスキートノイズのイメージ図 モスキートノイズは、色や明るさの変化が激しい箇所にモスキート(蚊)のように細かく発生するノイズだ。動画の場合、離散コサイン変換を行う際に発生しがちだが、Deep RenderではCNNベースのAIで画像の相似性を判断するため、モスキートノイズも発生しないそうだ(画像はイメージ図)

 Deep Renderでは、時間方向のフレーム間の相似性もCNNベースのAIで相似性を探索する

 MPEG系の動画圧縮技術ではフレーム内のブロック単位で「動きベクトル(Motion Vector)」を検出することで動き補償を行っている。しかし、先述の通りDeep Renderではそもそもブロック分解を行っていないため、同じ方法は使えない。そこで代替手段として、Deep Renderでは「Optical Flow」という概念を使ってフレーム間の相似性を検出し、動き補償を行っている。

 Optical Flowは、直訳すると「光学的な流れ(動き)」という意味だが、意訳すると「映像における光の移り変わり」という意味。昨今のデジタル画像解析(特にコンピュータービジョン分野)では、よく使われる定番キーワードだ。

 Deep Renderでは、Optical Flowを活用してフレーム内のオブジェクト(物体)の移動を追跡することで動き補償を行い、圧縮率を高めている。オブジェクトが複雑な形状でもしっかりと追跡できるそうだ。

比較 同じビットレートで圧縮したDeep Render(中央から左)とH.264(中央から右)の動画を見比べる。画質の違いは想像以上で、驚いてしまった

 Deep Renderによると、現在の試作版ではH.264/H.265と同等画質なら5倍程度の圧縮率を達成しているという。これからも各部分のチューニングと改良を進めるとのことで、圧縮率を50倍にまで高められる見通しが立っていると豪語する。

 これが本当ならば、1層のBlu-ray Discでなければ録画できない25GBの動画を、単にCD-Rに収められるだけでなく、容量が約150MB余ることになる。なかなかにスゴい。

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2026年04月05日 更新
  1. アキバの一部ショップでHDD購入制限の動き――大容量モデルを中心に品薄感 (2026年04月04日)
  2. 迷走の5年間を経て――MicrosoftがWindows 11の“不都合な真実”を認め、改善を宣言した背景 (2026年04月01日)
  3. デジタル化もできるレコードプレーヤー「オーディオテクニカ AT-LP120XBT-USB」が20%オフの4万4000円に (2026年04月03日)
  4. 安いMacは「使えない」? MacBook Neo 8GBモデルで試す、後悔しないための活用術と注意点 (2026年04月02日)
  5. Windows 11(24H2/25H2)の3月オプション更新でインストールできないトラブル 「帯域外更新」で対処 (2026年04月02日)
  6. 3COINSで880円の「3D構造マウスクッション」を試す 通気性抜群、これはトラックボールや分割キーボードに適したリストレストかも (2026年04月03日)
  7. 視野2.4倍に拡大したオートフォーカスアイウェア「ViXion2」を試す 近視と老眼の悩みを一気に解消、11万円の価値はあるか? (2026年04月03日)
  8. 広いデスクを隅々まで照らして目の負担を抑える「BenQ ScreenBar Pro」が10%オフの1万7910円に (2026年04月03日)
  9. フリップ式スピーカー搭載のプロジェクター「Nebula P1i」が25%オフの3万7490円に (2026年04月03日)
  10. 液晶なのにE Ink風? 約10万円の価値はある? TCLの異色電子ノート「Note A1 NXTPAPER」徹底レビュー (2026年04月03日)
最新トピックスPR

過去記事カレンダー

2026年