国産LLM「Sarashina3」登場 高品質データ、独自検証で日本語能力を強化 ソフトバンク傘下
ソフトバンク傘下のSB Intuitionsは6月30日、国産大規模言語モデル(LLM)「Sarashina3シリーズ」の提供を始めた。独自の技術や品質評価によって、高品質な日本語を安定して出力できるとうたう標準モデルと軽量モデルに加え、3つの専門モデルも提供する。ソフトバンクが米Oracleの基盤を利用して国内データセンターで運用するクラウドサービス「Cloud PF Type A」を通して提供する。
標準モデル「Sarashina3 mini」(以下、3 mini)は外部APIを自律的に呼び出すエージェント機能や、数理的理解力、コード生成能力を備えるとうたう。日本語・英語を中心とした30兆トークン超のデータで事前学習を行い、事後学習では高性能な教師モデルの知識を学習させる「蒸留」と強化学習を組み合わせることで、ビジネスシーンで必要な能力を高めたという。
3 miniは、日本語対話やコーディングなどのベンチマークにおいて前世代の「Sarashina2 mini」から性能が向上。他社の「Qwen3-235B-A22B-Instruct-2507」や「GPT-5.4 mini(non-reasoning)」と同等性能とされる。
3 miniと軽量モデル「Sarashina3 nano」(以下、3 nano)の事前学習で使用したデータ構築においては、独自の品質フィルタリングやデータ合成技術によって、多様かつ有用性の高いデータを拡充したと説明。また、両モデルが出力する日本語の自然さ、丁寧さ、簡潔さ、実用性をSB Intuitionsの専門チームが評価、検証し、その結果を強化学習などに利用することで、高品質な日本語を安定して出力できるよう調整したという。
Sarashina3シリーズのラインアップは、3 miniと3 nanoに加えて、入出力テキストの有害性を判定するガードモデル「Sarashina3 guard」、テキストをベクトル化する「Sarashina3 embedding」、複数の文書を入力クエリと関連度の高い順に並び替えるリランキングモデル「Sarashina3 rerank」の5種類だ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
ひろゆき氏「SIer衰退予測」、AI代替の「逆転現象」の理由 2026年に生き残るエンジニア“4つの役割”
-
2
「“社長AI”って意味ある?」→言った本人も手のひら返し 幹部の9割が高評価したNTTドコモビジネスの「AI小島社長」開発録
-
3
解剖・孫正義氏の「ガチョウ論」 「ソフトバンクG株価が低過ぎ」主張を信じてよいのか
-
4
日立、メインフレーム事業から撤退へ ハード製造終了から9年後の決断
-
5
「Fable 5を全タスクに使う必要はない」 Anthropic開発者直伝のトークンコスト節約術
-
6
「ヤフコメまとめ」開始 ヤフコメの論点、AIがグラフで可視化
-
7
AIは設計者を置き換えるのか Autodesk幹部に聞くCADと設計データの未来
-
8
国内大手が共同出資のAI開発企業「日本AI基盤モデル開発」、新名称「Noetra」で始動 産総研と国産マルチモーダルAI開発へ
-
9
ルネサスが2035年の売上高3倍増も視野に、AIで3段階の成長を目指す
-
10
AI避けて「人間にだけ届く」広告配信へ、博報堂DYが新会社設立 虹彩認証「World ID」活用
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR