メディア
ITmedia AI+ >

“目”を持つAI「VLM」のまとめ資料、ソフトバンクのAI開発企業が公開 基礎やトレンドを全95ページで紹介

» 2025年06月17日 19時07分 公開
[松浦立樹ITmedia]

 ソフトバンクの子会社でAIの研究開発などを手掛けるSB Intuitions(東京都港区)は6月17日、大規模視覚言語モデル(VLM)の基礎などをまとめた資料「大規模視覚言語モデルの開発」を無料公開した。5月に開催した人工知能学会全国大会(JSAI)の講演で使用した資料で、ページ数は全95ページに及ぶ。

SB Intuitions、“目”を持つAI「VLM」のまとめ資料を無料公開

 資料は、SB IntuitionsでVLM開発を担当する4人の社員が作成した。VLMのトレンドや、学習データの構築、学習方法、評価までの開発のフローなどを記載。近年の研究事例やSB Intuitionsが公開しているVLM「Sarashina2-Vision」の開発経験から得た知見や課題などを紹介している。

公開した資料の一部(1/2)
公開した資料の一部(2/2)

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ