Stability AIはこのほど、日本語に対応した画像言語モデル「Japanese Stable VLM」の公開を行った。
画像を基としてその説明を行うテキストを生成できる言語モデルで、従来の「Japanese InstructBLIP Alpha」と同等レベルの性能を達成しつつ、商用利用が可能となっているのが特徴だ。
チャット形式で画像について質問を行うことができる他、動画のフレームを抜き取って動画キャプショニングやリアルタイム動画の質問応答を行うこともできる。
Copyright © ITmedia, Inc. All Rights Reserved.