News 2001年9月26日 11:55 PM 更新

しゃべるだけでビデオや音楽を簡単検索できるソフトに「注目」

IDFの基調講演で,1つのソフトウェアが来場者の注目を集めていた。メディアドライブが開発した「CrossMediator for Video」がそれで,しゃべるだけで目的のビデオや音楽を簡単に引き出すことができる。

 インテルが26日から開催している開発者向け会議「Intel Developer Forum Japan 2001」の基調講演で,ちょっとしたソフトウェアが注目を浴びた。ビデオファイルから音声情報を抽出しインデックス化することで,キーワードにマッチした動画を検索。該当箇所の頭出しをしてくれるビデオ・音楽管理ソフトの「Cross Mediator for Video 2.0」だ。開発元は日本語OCRソフトで知られるメディアドライブである。


ビデオ・音楽管理ソフト「Cross Mediator for Video 2.0」

あらゆる動画,音声から該当箇所を順次に検索

 CrossMediatorの使い方は至って簡単だ。あらかじめ登録し,インデックスを作成した動画・音声ライブラリに対して,4通りの方法で検索の指示を出すと,条件にヒットしたメディアファイルをリストアップ。該当ファイルを開くと,実際に検索にヒットした場所をインデックス表示し,目的の場所を簡単に探せる。

 たとえば「東京ディズニーシー」を検索すると,東京ディズニーシーのオープニングを報道するニュース番組や,その内容を紹介するバラエティ番組の該当部分を頭出ししてくれる。キーワードの指定はテキスト入力と音声による入力の2種類が可能だ。

 面白いのはハミング検索という手法だ。これは音楽ファイルに対してインデックスを作成しておくと,メロディの一部をハミングすることで,類似するメロディが含まれる音声データおよび該当箇所を探し出すというもの。大量の音楽データをMP3やWMAなどの形式で保存しておき,サビの部分をハミングすれば,タイトルを思い出せなくとも簡単に目的の曲を探し当てることができる。

 さらに動画に関しては静止画との類似性で検索することもできる。たとえばあるニュース番組で登場した場面を静止画で保存しておき,その静止画と似た画像フレームを持つ(つまり,おそらくは同じ内容を報道しているだろう)別のニュース番組を探すといったことが可能になる。

 デモンストレーションでは,あらかじめキャプチャされた動画に対してのみ検索を行っていたため,実利用環境でどの程度の検索品質があるかは判断できなかった。しかし,検索そのものはあらかじめインデックスを作成するため瞬間的に行われ,また検索精度もかなり高いという印象を持った。

 インデックスの作成時間はPentium III/1GHzで動画の実再生時間の2倍速,インデックスサイズは1時間の動画で1Mバイト以下。現在はPentium IIIのSSEに最適化しているが,今後はPentium 4に搭載されたSSE2への対応を進めることで,さらなる高速化を図る。

 メディアドライブ開発本部主任研究員の保科雅洋氏によると,SSE2に対応することで類似性検索の速度を大幅に上げることが可能だという。また,インデックス作成時間の多くは動画データ再生に割かれており,動画CODECが高速に動作することでインデックス作成時間の短縮が図れる。

単体製品のほか,開発キットの提供で他製品への組み込みも狙う

 CrossMediatorは同社Webサイトにて直接販売される単体製品として10月12日にリリースされる予定(バージョン2,バージョン1はすでに発売済み)で,価格は2万9800円。対応するメディアファイルの形式は「基本的にDirectShowで再生できるすべてのメディアフォーマットに対応(保科氏)」する。また,体験版が同社Webサイトからダウンロード可能になる。

 また,同社はCrossMediatorで使われている動画・音声のインデックス化,類似検索のエンジンを,開発キットの形でもソフトウェアベンダー各社に対して提供していく考えだ。ライセンス条件や価格は「別途相談(保科氏)」とのことだが,バーティカルマーケット向けのソリューション製品への組み込みはもちろん,テレビ録画ソフトやMP3録音・管理・プレーヤソフトに組み込むといった用途もあるだろう。

 CrossMediatorと似たアプローチは,すでに様々な学術機関や企業などで数年前から研究成果が発表されていたが,価格と実用性のバランスにおいてCrossMediatorはコンシューマユーザーにもかなり近づいた製品と言える。従来のPCは各種メディアの作成や再生に関しては,十分な機能と性能を有するに至っている。しかしながら,大量のメディアデータをデータベース化して管理する用途はまだ開拓されきっていない。

 CrossMediatorのように,メディアを扱うだけでなく,文字情報と同じように管理,検索できるシステムが一般化し,ごく普通にエンドユーザーアプリケーションの中から利用できるようになれば,閉塞感のあるPC向けマルチメディアアプリケーションの活性化にも繋がるのではないだろうか。

[本田雅一, ITmedia]

Copyright © ITmedia, Inc. All Rights Reserved.