ITmedia NEWS > 社会とIT >
ITmedia AI+ AI活用のいまが分かる

画像を説明できるAI「Japanese InstructBLIP Alpha」 Stability AI Japanが公開

» 2023年08月17日 19時05分 公開
[松浦立樹ITmedia]

 英Stability AIの日本法人であるStability AI Japan(東京都渋谷区)は8月17日、画像を入力すると、その説明文を生成できるAIモデル「Japanese InstructBLIP Alpha」を公開した。「画像を使った検索エンジンや、画像の情景説明やそれに関する質疑応答、目の不自由な人などへの利用が考えられる」(Stability AI Japan)という。

画像を説明できるAIモデル「Japanese InstructBLIP Alpha」

 Japanese InstructBLIP Alphaは、同社が10日に公開した、ユーザーの指示に受け答えできるAIモデル「Japanese StableLM Instruct Alpha 7B」を拡張し、開発したAIモデル。日本語テキストを生成できる他、東京スカイツリーや金閣寺など日本特有の建造物を正しく認識できる機能を備える。

日本特有の建造物を正しく認識できる
建造物を認識する例

 画像について質問することも可能。例えば路面に速度制限が描かれた道路の画像を入力し「道路に書かれた速度制限は?」と質問すると「30km/h」と回答する。

「道路に書かれた速度制限は?」と質問すると「30km/h」と回答
画像についての質問に答える例(1)
画像についての質問に答える例(2)

 同社は「英語圏と比べ、日本語のデータセットは限られており、マルチモーダル(複数のデータ形式に対応する)なデータセットはさらに限られている」と説明。「今後も日本向けの生成基盤モデルを構築・公開し、日本のAIコミュニティーのさらなる活性化に貢献したい」と述べている。

Copyright © ITmedia, Inc. All Rights Reserved.