ニュース
画像を説明できるAI「Japanese InstructBLIP Alpha」 Stability AI Japanが公開
英Stability AIの日本法人であるStability AI Japanは、画像を入力すると、その説明文を生成できるAIモデル「Japanese InstructBLIP Alpha」を公開した。
英Stability AIの日本法人であるStability AI Japan(東京都渋谷区)は8月17日、画像を入力すると、その説明文を生成できるAIモデル「Japanese InstructBLIP Alpha」を公開した。「画像を使った検索エンジンや、画像の情景説明やそれに関する質疑応答、目の不自由な人などへの利用が考えられる」(Stability AI Japan)という。
Japanese InstructBLIP Alphaは、同社が10日に公開した、ユーザーの指示に受け答えできるAIモデル「Japanese StableLM Instruct Alpha 7B」を拡張し、開発したAIモデル。日本語テキストを生成できる他、東京スカイツリーや金閣寺など日本特有の建造物を正しく認識できる機能を備える。
画像について質問することも可能。例えば路面に速度制限が描かれた道路の画像を入力し「道路に書かれた速度制限は?」と質問すると「30km/h」と回答する。
同社は「英語圏と比べ、日本語のデータセットは限られており、マルチモーダル(複数のデータ形式に対応する)なデータセットはさらに限られている」と説明。「今後も日本向けの生成基盤モデルを構築・公開し、日本のAIコミュニティーのさらなる活性化に貢献したい」と述べている。
関連記事
- Stability AI Japan、日本語言語モデル「Japanese StableLM Alpha」公開 他社上回る性能、商用利用も可能
英Stability AIの日本法人であるStability AI Japanは、日本語向け大規模言語モデル(LLM)「Japanese StableLM Base Alpha 7B」を公開した。パラメータは70億。ライセンスはApache License 2.0で、商用利用可能だ。 - LINE、日本語の大規模言語モデル公開 オープンソースで 商用利用もOK
LINEが、日本語に特化した大規模言語モデル「japanese-large-lm」を発表した。オープンソースとして公開し、商用利用も可能としている。 - ChatGPT(3.5)に匹敵する「Llama 2」をローカルPCで動かしてみた
生成AIのトップランナーといえば、米OpenAIが提供するGPT-4などを使ったChatGPTですが、その対抗馬として期待されているのが米Metaが提供する大規模言語モデル「Llama 2」です。Llama 2ならば自宅のローカルPCでも動作させられるかもしれません。ということで、Text Generation web UIを使って、Llama 2を試してみました。 - 生成AIに“性格診断テスト”実施 GPTやLlamaに個性はある? 中国ByteDanceの研究者らが検証
中国のByteDanceに所属する研究者らがは、大規模言語モデル(LLM)に個性があるかを検証した研究報告を発表した。 - OpenAI、GPT-4の活用で人間のコンテンツモデレータの負担軽減が可能と主張
OpenAIは、コンテンツモデレーションにGPT-4のようなLLM(大規模言語モデル)を活用できるとし、そのプロセスをブログで紹介した。これにより、人間のモデレータの負担を軽減できるとしている。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.