Intel Ignite 2023で優勝! AV1やH.266を超える圧縮率を実現するDeep Renderの「AIベースの動画圧縮技術」って何?:Intel Ignite 2023(4/4 ページ)
Intelのスタートアップ企業支援プログラム「Intel Ignite」の2023年度プログラムでは、イギリスのDeep Renderが優勝した。同社は「AI技術を使った高圧縮率/高画質な動画コーデック」を開発しており、世界中から注目を集めている。AIベースの動画圧縮コーデックとはどのようなものなのか、話を聞いた。
Deep Renderは「有償ライセンス」とする方向 勝ち目はある?
デモを見る限りにおいて、Deep Renderの「圧縮率」と「画質」のバランスはとても優秀だった。だが、会社としてのDeep Renderは、このコーデックをどのように広げていく方針なのだろうか。
ブースでの説明を聞く限り、Deep Renderは「AV1コーデック」のようなロイヤリティーフリー(※1)形態ではなく、ライセンス料を徴収して稼ぐビジネスモデルの構築を検討しているとのことだった。
(※1)ライセンス(利用許諾契約)の範囲内であれば無償利用できる
映像圧縮技術である以上、コーデックはエンコーダーとデコーダーの両方をセットで利用してもらわないといけない。ベセンバーチ氏は「具体的には、既存の映像配信事業者への提案が(行動として)分かりやすい」と語る。
同氏が語る提案はこうだ。まず、PCやスマホのCPU/SoCに、何らかの形でハードウェアベースのDeep Renderエンコーダー(場合によってはデコーダーも)搭載してもらう。次に、配信事業者がDeep Render形式で動画を配信してもらう。そして「低ビットレートなのに高画質」というプレミアム感を求めて、Deep Render対応CPU/SoCを備えるPCやスマホを選ぶ人が増え、それに呼応する形で、Deep Render形式での配信サイトも増える――この“好循環”によって、ライセンス収入を増やしていく算段だ。
ただ、「Amazon Prime Video」「Apple TV」「Netflix」「YouTube」といったグローバルの主要な動画配信サービスでは、H.264の後継コーデックとして、H.265ではなくAV1を採用した。「なぜAV1か?」といえば、ずばりロイヤリティーフリーだからである。
有償ライセンスで提供されるDeep Renderを“積極的に”採用する配信事業者は、果たしているのだろうか。
大手の動画配信サービスがこぞって次世代コーデックとして採用した「AV1」は、Amazon、Apple、Facebook(現Meta)、Google、Intel、Microsoftなどが共同で設立した非営利団体「Alliance for Open Media(AOMedia)」が策定した規格だ
この点をユー氏に尋ねると「(Deep Renderは)AV1と比較しても、圧縮率と画質の高さが全然違う。それに、大手配信事業者がH.265の(メインコーデックとしての)採用を見送ったのは、ライセンスが有償だったことよりも、ライセンス料金を(少なくとも)4カ所に支払わないとならないことと(※1)、その総額が高いことが大きな要因だと考える。その点、私たちのライセンス料金は決して高額でなく、支払い先も我々だけ。(有償ライセンスでも)十分に採用される見込みはあると考える」と、自身ありげに応えた。
(※1)H.265は少なくともVia La(Via Licensing)、AccessAdvance、Velos Media」(ここまで特許プール)とInterdigitalの4社にライセンス料を支払う必要がある。H.265に関わる特許権の行使を保留している企業も存在するため、将来的に権利に関するトラブルを排除しきれないことも課題である
H.265コーデックを利用する場合、少なくとも4社(特許プールを利用した場合)と有償のライセンス契約を締結する必要がある(総務省公開資料より:MPEG LAの特許プールは、現在はVia Laに移管されている)
Deep Render以外にも「AIベースの画像圧縮技術」は存在する
Intel Innovation 2023にブースを構えたDeep Renderの面々は、非常に野心的でエネルギッシュで、若さに満ちあふれていた。しかし、実は既存コーデックの新規格も含めて、ライバルも少なからず存在する。簡単ではあるが、動画コーデックの近況について軽く整理しておこう。
“伝統的な”動画圧縮コーデックであるMPEG系では、H.265の次世代に相当するH.266が既に完成している。2023年現在、日本では「地上デジタル放送」の次世代規格策定でH.266が用いられることがほぼ確定的なものの、その実用化はまだこれからだ。世界に目を広げても、H.266の商用利用の目立つ事例は見当たらない。
。→地上波でも「4K/60fps」が当たり前に? 総務省の審議会が「次世代地デジ」の技術的条件を答申 実現に向けて大きな一歩
H.266の圧縮性能は「H.265の半分のビットレートで同等の画質」となる性能を持つとされる。一方で、エンコード/デコードに必要な演算量は、H.265の5倍以上ともいわれる。
次の「H.267(仮)では、Deep RenderのようにAIの活用が始まるともうわさされるが、規格策定に向けた具体的な動きや情報はまだ見られない。
他方、Deep Render以外にも、昨今のAIブームの影響もあり、AI技術を活用した動画圧縮技術を開発するプレーヤーは増えている。
ビジネス面で、Deep Renderと同等かそれ以上の存在感を放っているのが、イギリスのiSIZEだ。同社が開発した「BitSave」は、AIベースの超解像技術を中核にした映像圧縮技術だ。
BitSaveはH.265やAV1と同画質で半分のビットレートを実現できるといい、理論性能だけでいえばH.266に近い。
iSIZEが開発した「BitSave」はAIベースの超解像技術を中核にした映像圧縮技術である。コーデックそのものではなく、「既存のエンコーダーと組み合わせて使って画質を向上しつつ、ビットレートを削減しよう」というアプローチを取っている
AOMediaの設立メンバーであるAppleも、AIベースの映像圧縮技術に大きな関心を寄せている。2023年3月には、AIベースの映像コーデックを開発していた米国のベンチャー企業「WaveOne」を“こっそりと”買収しており(参考リンク)、今後の動向に注目が集まっている。
日本でも、富士通研究所が2020年、自社開発したAIベースの高次元データ解析技術「DeepTwin」を転用した映像圧縮技術を発表している。この技術は通信量の削減が主目的で、高圧縮状態でも画像認識に耐える画質を確保していることが特徴だ。
富士通研究所は、自社開発の「DeepTwin」をベースに高精度で画像認識を行える品質を保持したまま映像の圧縮率を高める技術を開発した。H.265で圧縮した場合と比べると、100~300倍の容量削減効果があるという
Deep Renderを含め、AIを活用した映像圧縮技術の開発競争は始まったばかりといったところか。今後の動向に注目したい。
関連記事
地上波でも「4K/60fps」が当たり前に? 総務省の審議会が「次世代地デジ」の技術的条件を答申 実現に向けて大きな一歩
総務省において「次世代(高度化)地上波デジタルテレビ放送」の技術的条件が答申された。これにより、現行の「地デジ」の後継規格を策定する作業が加速するものと思われる。薄型モバイル向け「Ryzen 7040U」登場 Zen 4+RDNA 3にRyzen AI(一部)で「Apple M2やCore i7-1360Pよりも高速」
AMDのモバイル向けAPU「Ryzen 7040シリーズ」に、メインストリームの「Uプロセッサ」が登場する。AIプロセッサは上位製品にのみ搭載されるが、CPUコアやGPUコアのパフォーマンスアップは、全ての製品に恩恵があるようだ。モバイル向けGPU「Intel Arc Aシリーズ」が発進 スペック別に3シリーズを順次投入
Intelが、モバイル向けGPU「Intel Arc Aシリーズ」を正式に発表した。米国ではエントリー製品を搭載するノートPCの受注が始まっており、4月から搭載製品が順次お披露目される見通しだ。NVIDIA、ワークステーション向けGPU「NVIDIA RTX A2000」を発表
NVIDIAは8月10日、新たなGPUとして「NVIDIA RTX A2000」を発表した。価格は450ドルで、10月より発売される予定だ。「Tiger Lake」×「Iris Xe MAX Graphics」はなぜ速い? インテルが説明
Intelが久しぶりの外部GPU製品として発売した「Iris Xe MAX Graphics」。Tiger Lakeと協調動作することでより高速に動作することが特徴だ。その仕組みを、日本法人であるインテルが説明した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.