ITmedia NEWS >

動画内の物体を高速で追跡する技術「D3S」 トラッカーのベンチマークで高成績Innovative Tech

» 2020年08月05日 21時35分 公開
[山下裕毅ITmedia]

Innovative Tech:

このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。

 スロベニアのリュブリャナ大学とチェコ工科大学による研究チームが開発した「D3S」は、動画内の物体を高速に追跡する高性能なセグメンテーショントラッカーだ。

 このトラッカーは、指定した対象が動画上をどのように移動しているかを推定する物体検出だけでなく、同時に領域検出も行う。

 出力結果は、指定した対象の位置を四角形の枠線で囲み、囲んだ中の物体自体を縁取り塗り潰す。これにより出力されたデータは、領域情報付きデータセットとして機械学習に利用する。

photo D3Sは、動画上の指定した対象を追跡し、同時にセグメンテーションを行う

 この手法の特徴は、GEM(Geometrically constrained Euclidean Model)と、GIM(Geometrically Invariant Model)を組み合わせる点にある。GEMは、指定した対象の位置を予測するモデル。GIMは、セグメンテーション間の分類として機能するモデル。

photo D3Sアーキテクチャ

 両モデルの相補的な強みを生かしたアーキテクチャを採用することで、指定した対象に大幅な変形があっても、高速定位と正確なセグメンテーションの両方が可能だとしている。

 D3Sはリアルタイムに近い速度と正確性で、ほとんどの主要トラッキングベンチマークにおいて、最先端のトラッカー(SiamMaskなど)を凌駕する結果となった。

photo D3SとSiamMaskを比較した出力結果

Copyright © ITmedia, Inc. All Rights Reserved.