ニュース
“目”を持つAI「VLM」のまとめ資料、ソフトバンクのAI開発企業が公開 基礎やトレンドを全95ページで紹介
ソフトバンクの子会社でAIの研究開発などを手掛けるSB Intuitionsは、大規模視覚言語モデル(VLM)の基礎などをまとめた資料「大規模視覚言語モデルの開発」を無料公開した。
ソフトバンクの子会社でAIの研究開発などを手掛けるSB Intuitions(東京都港区)は6月17日、大規模視覚言語モデル(VLM)の基礎などをまとめた資料「大規模視覚言語モデルの開発」を無料公開した。5月に開催した人工知能学会全国大会(JSAI)の講演で使用した資料で、ページ数は全95ページに及ぶ。
資料は、SB IntuitionsでVLM開発を担当する4人の社員が作成した。VLMのトレンドや、学習データの構築、学習方法、評価までの開発のフローなどを記載。近年の研究事例やSB Intuitionsが公開しているVLM「Sarashina2-Vision」の開発経験から得た知見や課題などを紹介している。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
日本語に強いVLM「Sarashina2-Vision」 ソフトバンクのAI開発企業が公開 MITライセンスで商用利用OK
ソフトバンクの子会社でAIの研究開発などを手掛けるSB Intuitionsは、日本語に強い大規模視覚言語モデル(VLM)「Sarashina2-Vision(8B・14B)」を公開した。
「Claude Code」って何? KDDI子会社の解説資料が話題 動画で使い方やデモも紹介
「やさしいClaude Code入門」と題された資料が、はてなブックマークなどで注目を集めている。米Anthropicが提供するコーディング向けのAIエージェント「Claude Code」の概要などを解説している。
AI活用は「必須事項」――では、ソフトウェアアーキテクチャの設計にどう生かす? CAの新卒研修資料が話題
「AI時代のソフトウェアアーキテクチャ」と題する資料が、はてなブックマークで話題だ。AIを活用したソフトウェアアーキテクチャの設計方法などを解説しており、サイバーエージェントの2025年度新卒研修で利用したという。
GWにAIの勉強はいかが? ChatGPTの“公式活用術”から話題の「MCP」まで 無料の教材・資料まとめ
ChatGPTの“公式活用術”や「MCP」の初心者向けの解説など、企業が無料で公開しているAI関係の教材・資料を紹介する。
“目を持つAI”は「犬がいる/いない」を区別できない? 否定表現を無視する傾向、OpenAIの研究者らが発表
米MITや米OpenAIなどに所属する研究者らは、最新の視覚・言語モデル(VLM)が「no」や「not」といった否定表現を理解する能力に深刻な欠陥があることを発見した研究報告を発表した。


