米Google傘下のAI企業Google DeepMindは5月25日(現地時間)、同社が開発するSimVLM(Simple Visual Language Model、単一視覚言語モデル)の「Flamingo」を系列企業YouTubeの人気コンテンツ「YouTubeショート」の検索に提供したと発表した。
VLMは、視覚的な入力に言語を対応させる言語モデル。SimVLMは、追加のトレーニングなしでタスク固有の少数のサンプルを使うだけで問題に取り組める。Flamingoは、画像、動画、テキストで構成されるプロンプトを受け取り、関連する言語を出力する。
FlamingoはYouTubeで、ショートの最初のフレームを分析し、何が表示されているかをテキストで説明する。例えば「海岸に立つフラミンゴ」などだ。こうしたテキストをYouTubeにメタデータとして保存することで、ショートをより適切に分類し、検索結果に反映させる。
YouTubeはFlamingoを既にショート動画全体に展開している。「視聴者はより関連性の高い動画を視聴できるようになり、より多様な世界的クリエイターから探しているものをより簡単に見つけることができるようになった」。
YouTubeによると、ショートは1日当たり500億回以上視聴されているという。
YouTube、「ストーリー」を6月26日に終了へ
Google、生成AI搭載検索エンジンのお試し利用を米国で開始
Google、AGIのある未来を目指しGoogle DeepMind立ち上げ
Google、動画内検索を可能にするディープラーニング採用APIのβ提供開始Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR