検索
ニュース

画像を説明できるAI「Japanese InstructBLIP Alpha」 Stability AI Japanが公開

英Stability AIの日本法人であるStability AI Japanは、画像を入力すると、その説明文を生成できるAIモデル「Japanese InstructBLIP Alpha」を公開した。

Share
Tweet
LINE
Hatena

 英Stability AIの日本法人であるStability AI Japan(東京都渋谷区)は8月17日、画像を入力すると、その説明文を生成できるAIモデル「Japanese InstructBLIP Alpha」を公開した。「画像を使った検索エンジンや、画像の情景説明やそれに関する質疑応答、目の不自由な人などへの利用が考えられる」(Stability AI Japan)という。


画像を説明できるAIモデル「Japanese InstructBLIP Alpha」

 Japanese InstructBLIP Alphaは、同社が10日に公開した、ユーザーの指示に受け答えできるAIモデル「Japanese StableLM Instruct Alpha 7B」を拡張し、開発したAIモデル。日本語テキストを生成できる他、東京スカイツリーや金閣寺など日本特有の建造物を正しく認識できる機能を備える。


日本特有の建造物を正しく認識できる

建造物を認識する例

 画像について質問することも可能。例えば路面に速度制限が描かれた道路の画像を入力し「道路に書かれた速度制限は?」と質問すると「30km/h」と回答する。


「道路に書かれた速度制限は?」と質問すると「30km/h」と回答

画像についての質問に答える例(1)

画像についての質問に答える例(2)

 同社は「英語圏と比べ、日本語のデータセットは限られており、マルチモーダル(複数のデータ形式に対応する)なデータセットはさらに限られている」と説明。「今後も日本向けの生成基盤モデルを構築・公開し、日本のAIコミュニティーのさらなる活性化に貢献したい」と述べている。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る