Google DeepMind、YouTubeショートの検索に視覚言語モデル(VLM)の「Flamingo」提供
Google DeepMindは、系列のYouTubeの「YouTubeショート」の検索に単一視覚言語モデル(SimVLM)「Flamingo」が採用されたと発表した。動画の最初のフレームを説明するテキストを生成する。これをメタデータとすることで膨大な量のショートの検索機能が強化されたとしている。
米Google傘下のAI企業Google DeepMindは5月25日(現地時間)、同社が開発するSimVLM(Simple Visual Language Model、単一視覚言語モデル)の「Flamingo」を系列企業YouTubeの人気コンテンツ「YouTubeショート」の検索に提供したと発表した。
VLMは、視覚的な入力に言語を対応させる言語モデル。SimVLMは、追加のトレーニングなしでタスク固有の少数のサンプルを使うだけで問題に取り組める。Flamingoは、画像、動画、テキストで構成されるプロンプトを受け取り、関連する言語を出力する。
FlamingoはYouTubeで、ショートの最初のフレームを分析し、何が表示されているかをテキストで説明する。例えば「海岸に立つフラミンゴ」などだ。こうしたテキストをYouTubeにメタデータとして保存することで、ショートをより適切に分類し、検索結果に反映させる。
YouTubeはFlamingoを既にショート動画全体に展開している。「視聴者はより関連性の高い動画を視聴できるようになり、より多様な世界的クリエイターから探しているものをより簡単に見つけることができるようになった」。
YouTubeによると、ショートは1日当たり500億回以上視聴されているという。
関連記事
- YouTube、「ストーリー」を6月26日に終了へ
YouTubeは、2017年から提供している「ストーリー」機能を終了する。「YouTubeショート」と「コミュニティ投稿」の方が効果的なためとしている。 - Google、生成AI搭載検索エンジンのお試し利用を米国で開始
Googleは、生成AI搭載版Google検索のテストを米国で開始した。複合的なクエリに対応し、フォローアップの質問にも答える。ショッピングの相談では従来通りの広告も表示される。 - Google、AGIのある未来を目指しGoogle DeepMind立ち上げ
Alphabet傘下のGoogleは、自社のAI部門Google Brainと系列のDeepMindを統合し、Google DeepMindの立ち上げを発表した。CEOに就任するDeepMindのハサビス氏は、「史上最大の変革を推進するAGIの未来により早く到達できる」と語った。 - Google、動画内検索を可能にするディープラーニング採用APIのβ提供開始
Googleが、例えば「犬」「野球」などのキーワードで関連する動画を検索し、動画のどの部分に関連シーンがあるかを特定するためのディープラーニング採用API「Cloud Video Intelligence API」のプライベートβ版を公開した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.