Google、動画内検索を可能にするディープラーニング採用APIのβ提供開始

Googleが、例えば「犬」「野球」などのキーワードで関連する動画を検索し、動画のどの部分に関連シーンがあるかを特定するためのディープラーニング採用API「Cloud Video Intelligence API」のプライベートβ版を公開した。

[佐藤由紀子，ITmedia] PC用表示関連情報

LINE

Hatena

　米Googleは3月8日（現地時間）、サンフランシスコで開催の「Google Cloud Next ‘17」の基調講演で、動画内のオブジェクトを検索できるディープラーニング採用API「Cloud Video Intelligence API」のプライベートβ版を発表した。

Cloud Video Intelligence API

　同社は静止画内のオブジェクトを認識し、検索できる「Cloud Vision API」は2015年12月に発表しているが、動画は「デジタル業界にとってのダークマターだった」と同社のGoogle Cloudチームのチーフサイエンティスト、フェイフェイ・リー氏は語る。

　GoogleはこのAPIを同社のオープンソースの機械学習ライブラリ「TensorFlow」を使って開発し、既にYouTubeで採用している。

　基調講演のデモでは、1本の動画内で「犬」を検索すると、動画のどの部分に犬が登場するかをタイムライン上の赤いポイントで示す様子や、動画ライブラリ内で「野球」を検索すると、野球に関連する動画一覧が、関連する場面が分かるタイムライン付きで表示されるWebサービスなどが披露された。

関連するシーンがどのあたりにあるかまで分かる検索結果

　このAPIでは、上記のような動物名などの名詞による検索だけでなく、「泳ぐ」「走る」などの動詞での検索もできる。また、シーンの切り替え箇所も検出できる。

　このAPIは、Google Cloud Storage上の動画で利用できる。プライベートβへの参加は特設ページから申し込める。