米NVIDIAは10月5日(現地時間)、開発者向けの新Web会議プラットフォーム「NVIDIA Maxine」を発表した。クラウド側の同社のGPUでAIを使って動画や音声を処理し、Web会議の品質を向上させる。
既にZoomなどでおなじみの仮想背景やMicrosoft Teamsの翻訳機能、Google Duoのオートフレーム機能、ノイズキャンセル機能に加え、斜め横から撮影している顔を正面に修正したり、互いの視線が合うように補正したり、表情をリアルタイムで反映できるアバターの利用などが可能になる。
すべてクラウド側で処理するので、Web会議参加者はスペックの低い端末でもこれらの機能を享受できる。
また、AIにより、動画全体のピクセルをストリーミングするのではなく、顔の動きにとって重要なポイントを分析し、顔をアニメーション化する。これにより、送受信するデータ量を大幅に減らし、動画による帯域幅の消費をH.264の10分の1に削減できるとしている。
Maxineは、NVIDIA AI開発ツールのSDKおよびAPIの技術を統合したプラットフォーム。NVIDIAは、コンピュータビジョンAI開発者やWeb会議サービス・プロバイダーなどを対象に、Maxineへの早期アクセスを受け付けている。
顔を位置合わせやノイズキャンセル性能などを紹介するデモ動画を以下に転載した。
NVIDIA、“スマート病院エッジAI”システム「Clara Gurdian」で新型コロナ対策支援
NVIDIA、データセンター向け新GPU「A100」発表 AI性能はV100の20倍
NVIDIA、1枚の静止画で動きを合成 GANを用いた手法を開発 ダビデ像も踊り出す
ベタ塗りの落書きをリアルな風景に変える「GauGAN」、NVIDIA開発Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR