検索
ニュース

“画像の面白さ”を解説できるAI「MiniGPT-4」 写真からラップや詩、料理レシピ作成 デモサイトも公開中Innovative Tech(2/2 ページ)

サウジアラビアのキング・アブドゥッラー科学技術大学に所属する研究者らは、画像の視覚的特徴を捉えて大規模言語モデル(LLM)で高品質な言語出力を行うシステムを提案した研究報告を発表した。

Share
Tweet
LINE
Hatena
前のページへ |       

「MiniGPT-4」の出力例


ライブデモの例

画像の詳細を説明してもらっている例

「この画像は現実世界でもよくあることなのか?」などと質問している例

「この画像の植物は何が問題なのか?」などと質問した例

なぜこの画像が面白いかを教えてもらっている例

画像をもとに物語文を生成している例

画像に対しての広告を生成している例

画像内の人は誰なのかを聞いている例

この絵画の詳細を教えてもらっている例

画像を参考にWebサイトを構築するためのHTMLとCSS、JSを記述している例

Source and Image Credits: Deyao Zhu, Jun Chen, Xiaoqian Shen, Xiang Li, and Mohamed Elhoseiny. MiniGPT-4: Enhancing Vision-Language Understanding with Advanced Large Language Models



前のページへ |       

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る