ソフトバンクの子会社でAIの研究開発などを手掛けるSB Intuitions(東京都港区)は6月17日、大規模視覚言語モデル(VLM)の基礎などをまとめた資料「大規模視覚言語モデルの開発」を無料公開した。5月に開催した人工知能学会全国大会(JSAI)の講演で使用した資料で、ページ数は全95ページに及ぶ。
資料は、SB IntuitionsでVLM開発を担当する4人の社員が作成した。VLMのトレンドや、学習データの構築、学習方法、評価までの開発のフローなどを記載。近年の研究事例やSB Intuitionsが公開しているVLM「Sarashina2-Vision」の開発経験から得た知見や課題などを紹介している。
日本語に強いVLM「Sarashina2-Vision」 ソフトバンクのAI開発企業が公開 MITライセンスで商用利用OK
「Claude Code」って何? KDDI子会社の解説資料が話題 動画で使い方やデモも紹介
AI活用は「必須事項」――では、ソフトウェアアーキテクチャの設計にどう生かす? CAの新卒研修資料が話題
GWにAIの勉強はいかが? ChatGPTの“公式活用術”から話題の「MCP」まで 無料の教材・資料まとめ
“目を持つAI”は「犬がいる/いない」を区別できない? 否定表現を無視する傾向、OpenAIの研究者らが発表Copyright © ITmedia, Inc. All Rights Reserved.