米Google傘下のAI企業Google DeepMindは5月25日(現地時間)、同社が開発するSimVLM(Simple Visual Language Model、単一視覚言語モデル)の「Flamingo」を系列企業YouTubeの人気コンテンツ「YouTubeショート」の検索に提供したと発表した。
VLMは、視覚的な入力に言語を対応させる言語モデル。SimVLMは、追加のトレーニングなしでタスク固有の少数のサンプルを使うだけで問題に取り組める。Flamingoは、画像、動画、テキストで構成されるプロンプトを受け取り、関連する言語を出力する。
FlamingoはYouTubeで、ショートの最初のフレームを分析し、何が表示されているかをテキストで説明する。例えば「海岸に立つフラミンゴ」などだ。こうしたテキストをYouTubeにメタデータとして保存することで、ショートをより適切に分類し、検索結果に反映させる。
YouTubeはFlamingoを既にショート動画全体に展開している。「視聴者はより関連性の高い動画を視聴できるようになり、より多様な世界的クリエイターから探しているものをより簡単に見つけることができるようになった」。
YouTubeによると、ショートは1日当たり500億回以上視聴されているという。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR