米Googleは11月21日(現地時間)、生成AIチャット「Bard」が「YouTube動画を理解する能力の第一歩を踏み出した」と発表した。
同社は9月に、YouTubeからリアルタイム情報を取得できるようにしているが、今回のアップデートで、動画の概要や、長い動画のどの当たりで目的の情報が得られるかなどを答えられるようになったようだ。
Googleは例として、ケーキのレシピ動画を探している場合、そのレシピに必要な卵の数を尋ねられるようになるとしている。
「美味しいミルクティーの入れ方を紹介するYouTube動画から、手順を教えてください」と尋ねたところ、複数の画像入りの説明が表示された。最初の手順に「ティーポットに水と紅茶を入れ」とあるが、それがどのようなYouTubeからの情報かは不明だ。
画像をクリックするとYouTube動画ではなく、画像を掲載しているWebサイトに飛ぶ。
「ポトフの作り方を紹介したYouTube動画を教えてください」という質問には、3つの動画タイトルとその概要説明が表示された。ただし、動画のURLは表示されず、さらに「それぞれの動画のURLを教えてください」と頼んだところ、「大規模言語モデルとして私はまだ学習中であり、そちらについてお手伝いできる機能がありません」という回答だった。
YouTubeでタイトルを検索して確認し、「以下の動画で紹介しているポトフの材料をすべてリストアップしてください」と頼んだところ、この動画のレシピのポイントになっている「白菜」が表示されなかった。それについて問いただすと、「その理由は、動画の説明文に、白菜は「お好みで」と記載されていたためです。また、動画の冒頭で、白菜は「なくてもOK」と紹介されていました」との回答だった。
別の検索で、OpenAI DevDayの動画のURLに「以下の動画で「GPT-4 Turbo」を発表しているのは何分目ですか?」と問うたところ、「動画の2:28〜4:56の約2分半です」という回答だったが、実際には5分32秒目だ。
また、DevDayの動画の内容を要約するよう頼んだところ、発表されていない「GPT-6」について説明した。
Bard自身も語っているように、まだまだ学習中のようではあるが、レシピの手順表示がうまくいけば役に立ちそうだ。ただし、クリエイターにとっては、動画の視聴数が減ることに繋がりそうだ。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR