検索

ニュース

2023年8月17日

画像を説明できるAI「Japanese InstructBLIP Alpha」　Stability AI Japanが公開

英Stability AIの日本法人であるStability AI Japanは、画像を入力すると、その説明文を生成できるAIモデル「Japanese InstructBLIP Alpha」を公開した。

[松浦立樹，ITmedia] PC用表示関連情報

Share

Tweet

LINE

Hatena

AI活用のいまが分かる

　英Stability AIの日本法人であるStability AI Japan（東京都渋谷区）は8月17日、画像を入力すると、その説明文を生成できるAIモデル「Japanese InstructBLIP Alpha」を公開した。「画像を使った検索エンジンや、画像の情景説明やそれに関する質疑応答、目の不自由な人などへの利用が考えられる」（Stability AI Japan）という。

画像を説明できるAIモデル「Japanese InstructBLIP Alpha」

　Japanese InstructBLIP Alphaは、同社が10日に公開した、ユーザーの指示に受け答えできるAIモデル「Japanese StableLM Instruct Alpha 7B」を拡張し、開発したAIモデル。日本語テキストを生成できる他、東京スカイツリーや金閣寺など日本特有の建造物を正しく認識できる機能を備える。

日本特有の建造物を正しく認識できる

建造物を認識する例

　画像について質問することも可能。例えば路面に速度制限が描かれた道路の画像を入力し「道路に書かれた速度制限は？」と質問すると「30km/h」と回答する。

「道路に書かれた速度制限は？」と質問すると「30km/h」と回答

画像についての質問に答える例（1）

画像についての質問に答える例（2）

　同社は「英語圏と比べ、日本語のデータセットは限られており、マルチモーダル（複数のデータ形式に対応する）なデータセットはさらに限られている」と説明。「今後も日本向けの生成基盤モデルを構築・公開し、日本のAIコミュニティーのさらなる活性化に貢献したい」と述べている。

Copyright © ITmedia, Inc. All Rights Reserved.

一覧ページへ生成AIのビジネスユースケース一覧を見る

関連記事

Stability AI Japan、日本語言語モデル「Japanese StableLM Alpha」公開　他社上回る性能、商用利用も可能
英Stability AIの日本法人であるStability AI Japanは、日本語向け大規模言語モデル（LLM）「Japanese StableLM Base Alpha 7B」を公開した。パラメータは70億。ライセンスはApache License 2.0で、商用利用可能だ。
LINE、日本語の大規模言語モデル公開　オープンソースで　商用利用もOK
LINEが、日本語に特化した大規模言語モデル「japanese-large-lm」を発表した。オープンソースとして公開し、商用利用も可能としている。
ChatGPT（3.5）に匹敵する「Llama 2」をローカルPCで動かしてみた
生成AIのトップランナーといえば、米OpenAIが提供するGPT-4などを使ったChatGPTですが、その対抗馬として期待されているのが米Metaが提供する大規模言語モデル「Llama 2」です。Llama 2ならば自宅のローカルPCでも動作させられるかもしれません。ということで、Text Generation web UIを使って、Llama 2を試してみました。
生成AIに“性格診断テスト”実施　GPTやLlamaに個性はある？　中国ByteDanceの研究者らが検証
中国のByteDanceに所属する研究者らがは、大規模言語モデル（LLM）に個性があるかを検証した研究報告を発表した。
OpenAI、GPT-4の活用で人間のコンテンツモデレータの負担軽減が可能と主張
OpenAIは、コンテンツモデレーションにGPT-4のようなLLM（大規模言語モデル）を活用できるとし、そのプロセスをブログで紹介した。これにより、人間のモデレータの負担を軽減できるとしている。

関連リンク

プレスリリース

SpecialPR