Innovative Tech:
このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
スロベニアのリュブリャナ大学とチェコ工科大学による研究チームが開発した「D3S」は、動画内の物体を高速に追跡する高性能なセグメンテーショントラッカーだ。
このトラッカーは、指定した対象が動画上をどのように移動しているかを推定する物体検出だけでなく、同時に領域検出も行う。
出力結果は、指定した対象の位置を四角形の枠線で囲み、囲んだ中の物体自体を縁取り塗り潰す。これにより出力されたデータは、領域情報付きデータセットとして機械学習に利用する。
この手法の特徴は、GEM(Geometrically constrained Euclidean Model)と、GIM(Geometrically Invariant Model)を組み合わせる点にある。GEMは、指定した対象の位置を予測するモデル。GIMは、セグメンテーション間の分類として機能するモデル。
両モデルの相補的な強みを生かしたアーキテクチャを採用することで、指定した対象に大幅な変形があっても、高速定位と正確なセグメンテーションの両方が可能だとしている。
D3Sはリアルタイムに近い速度と正確性で、ほとんどの主要トラッキングベンチマークにおいて、最先端のトラッカー(SiamMaskなど)を凌駕する結果となった。
関連記事
- “実在しないリアルな顔”を自在に編集できる「StyleRig」 StyleGANで生成した顔の向き、表情、照明を制御
存在しない顔を自由に動かせるようになる。 - 他人の化粧を自分に転写できるバーチャルメイク技術「PSGAN」 動画にも対応
あの人のお化粧を自分にも、そして動きたい、というニーズに応えられる。 - 画像を半分入れたら残りを自動生成 OpenAI、文章自動生成モデルの画像版「Image GPT」開発
半分残っていれば後の半分はAIで推定できる。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.