携帯動画パノラマの柱となる技術は2つ。「パーソナル映像インデクシング技術」と「モバイル映像ハンドリング技術」だ。
SceneCabinetのようなこれまでのインデクシング技術は、主に編集済みの映像(ニュースや映像アーカイブなど)を対象とした技術だった。つまり、プロが撮影した素材で、シーンの境目がはっきりした「完成品」の映像を対象としている。しかし、それだとアマチュアが撮影した未編集の映像などはインデクシング精度が大幅に低下し、検出漏れなどの問題が多発してしまう恐れがある。しかも、ケータイ動画は低解像度で画像品質が悪く、かつ手ブレや速すぎるカメラワークなど撮影品質も悪いという悪条件が揃っている。
同研究所のメディアコンピューティングプロジェクトで主幹研究員を務める森本正志氏は、今回の携帯動画パノラマについて「個人が撮影する映像をターゲットとした技術。家庭用VCRのほか、ケータイカメラによる低解像度の映像からでも高精度に検出できるように機能を強化した」と解説する。
パーソナル映像インデクシング技術では、カメラワークと被写体の動きに着目した。まず、ケータイのカメラで撮影した粗い映像からでも、画面全体に含まれる輪郭のクロスポイントを特徴点として抽出し、それらの動きを分類することで、背景の動きと動物体の動きとを分離。背景の一定の動きのみから、カメラワークがどんな動きなのかを推定し、高精度にパノラマ画像を生成する。さらに、動物体の動きと分布から、動物体が大きく写っているシーンをアップショット(クローズアップ映像)として検出することで、別途検出した映像内容が大きく変化するシーンとともに、特徴的なサムネイル画像を、効率的かつ高精度に生成できるようにした。
そして、もう1つのモバイル映像ハンドリング技術は、ケータイだけで操作できるようにした編集支援システムともいうべきものである。数十秒程度の短時間の映像でも、変化が激しいシーンが連続すると、パーソナル映像インデクシング技術がサムネイル画像を数多く生成してしまうことがある。また、サムネイル画像とパノラマ画像が混在してしまい、それをケータイの画面で確認するにはいささか困難な作業を伴う。
そこで、多数生成されたサムネイル画像や冗長なパノラマ画像に関しては、全体の時間変化を分析し、間隔が短かく似たような画像を間引いてしまう。つまり、映像内容を理解するのに適切な枚数に絞り込むことで、編集しやすい制御を行う。また、チェックボックスやプルダウン式の編集メニューを加えることにより、ケータイ画面からでも映像付きの記事作成を容易にする機能を盛り込んだ。
Copyright © ITmedia, Inc. All Rights Reserved.