Google、動画内検索を可能にするディープラーニング採用APIのβ提供開始
Googleが、例えば「犬」「野球」などのキーワードで関連する動画を検索し、動画のどの部分に関連シーンがあるかを特定するためのディープラーニング採用API「Cloud Video Intelligence API」のプライベートβ版を公開した。
米Googleは3月8日(現地時間)、サンフランシスコで開催の「Google Cloud Next ‘17」の基調講演で、動画内のオブジェクトを検索できるディープラーニング採用API「Cloud Video Intelligence API」のプライベートβ版を発表した。
同社は静止画内のオブジェクトを認識し、検索できる「Cloud Vision API」は2015年12月に発表しているが、動画は「デジタル業界にとってのダークマターだった」と同社のGoogle Cloudチームのチーフサイエンティスト、フェイフェイ・リー氏は語る。
GoogleはこのAPIを同社のオープンソースの機械学習ライブラリ「TensorFlow」を使って開発し、既にYouTubeで採用している。
基調講演のデモでは、1本の動画内で「犬」を検索すると、動画のどの部分に犬が登場するかをタイムライン上の赤いポイントで示す様子や、動画ライブラリ内で「野球」を検索すると、野球に関連する動画一覧が、関連する場面が分かるタイムライン付きで表示されるWebサービスなどが披露された。
このAPIでは、上記のような動物名などの名詞による検索だけでなく、「泳ぐ」「走る」などの動詞での検索もできる。また、シーンの切り替え箇所も検出できる。
このAPIは、Google Cloud Storage上の動画で利用できる。プライベートβへの参加は特設ページから申し込める。
関連記事
- Google、データサイエンティストコミュニティKaggle買収で「AIの民主化」を加速
Googleが、データ分析コンペ開催で知られるKaggleを買収する。Kaggleと協力し、機械学習トレーニングをサポートしてAIの民主化を促進するとしている。 - Google、機械学習で低解像度画像をシャープに見せる「RAISR」をサービスで実用化
Googleは、高解像度画像の4分の1のサイズで高品質な画像を表示できる機械学習技術「RAISR」を、まずはGoogle+で実用化した。今後他のサービスにも適用する計画だ。 - Google、アプリに画像認識機能を追加できる「Cloud Vision API」を公開
Googleが、GoogleフォトやSafeSearchで採用している機械学習画像認識機能をアプリに追加できる「Cloud Vision API」をGoogle Cloud Platformユーザー向け限定プレビューとしてリリースした。 - GoogleのAIライブラリ「TensorFlow」がVer.1.0に 高速化してより柔軟に、新APIも追加
Googleがオープンソースで公開しているディープラーニング対応の機械学習ライブラリ「TensorFlow」が“プロダクトレディ”なバージョン1.0にアップデートした。58倍高速化し、多数の新APIが追加され、Python APIの安定性が向上した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.