リコー、“日本語で推論”できるマルチモーダルLLMを開発 「Gemini 2.5 Pro」に匹敵うたう
リコーは3月30日、推論のプロセスを日本語化したマルチモーダルLLM「Qwen3-VL-Ricoh-32B-20260227」を開発したと発表した。320億パラメータを持ち、複雑な図表を含む日本語の資料も読解できるという。米GoogleのAIモデル「Gemini 2.5 Pro」に匹敵する性能をうたう。
Qwen3-VL-Ricoh-32B-20260227は、複雑なフロー図や複数ページにわたるグラフなどにも対応する。図表を含む日本語の文書をもとに、質問に回答する性能を測るベンチマークでは、Gemini 2.5 Proに匹敵する性能を示したとアピールしている。また回答の根拠や前提条件などを日本語で確認できる。
Qwen3-VL-Ricoh-32B-20260227の開発では、中国AlibabaのAIモデル「Qwen3-VL-32B-Instruct」をベースにした。同モデルの弱点を改善するのに有効な学習データを用意し、事後的に特定のタスクに最適化するファインチューニングを行った。
さらにAIが試行錯誤し、結果に応じた報酬をもとに出力を改善する強化学習も実施した。出力の正確さに加えて、日本語による推論の出力にも高い報酬を設定するといった工夫を施した。
自社AIプラットフォーム「H.D.E.E.N」で提供
リコーは、独自のAIプラットフォーム「H.D.E.E.N」(ひでん)や、リコー製のLLMを搭載した小型のAIサーバを展開するなど、企業向けのAIサービスに注力している。Qwen3-VL-Ricoh-32B-20260227の開発では、画像を含むさまざまな企業内データを扱いながら推論でき、オンプレミスで導入できるAIモデルを目指した。
同社の児玉哲氏(リコーデジタルサービスビジネスユニット AIサービス事業本部 AI事業開発センター所長)は、リコーのAI開発の戦略について「AIモデル単体でビジネスしようとは考えていない」と説明する。Qwen3-VL-Ricoh-32B-20260227についても、H.D.E.E.Nなどを通じて提供する。
また児玉氏は、リコー自らAIモデルを開発する理由として「自社で手掛けることで獲得できる技術やノウハウを、顧客にソリューションとして提供できる」と語る。今回の取り組みでは、AIが処理する際の画像トークンを減らす技術なども開発した。これにより、AIモデルの運用コストの削減につなげたい考えだ。
Qwen3-VL-Ricoh-32B-20260227の開発では、経済産業省と新エネルギー・産業技術総合開発機構の国内企業向けAI開発支援プロジェクト「GENIAC」第3期の補助を受けた。同モデルの軽量版「Qwen3-VL-Ricoh-8B-20260227」をHugging Faceで公開しているほか、画像を含む文書をもとに推論する性能を測るリコー独自のベンチマークも公開する予定だ。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
ひろゆき氏「SIer衰退予測」、AI代替の「逆転現象」の理由 2026年に生き残るエンジニア“4つの役割”
-
2
「今日言うつもりはなかったが……」 孫正義氏が明かした「ロボット自動量産工場」の実態
-
3
ローカルLLMは本当に手元で動くのか? ハードウェアとモデルの現実的な選び方【2026年春】
-
4
日立、メインフレーム事業から撤退へ ハード製造終了から9年後の決断
-
5
Excelの10万行データを3分でAIに処理させる、M365 Copilotの使い方
-
6
ループエンジニアリングとは? チャットとAIコーディングの往復から卒業する新しい開発スタイル
-
7
東電出資に意欲 孫正義氏が「国内データセンター誘致」で狙うインフラ戦略
-
8
【解説】キオクシアなぜ急成長? 半導体メモリって何? AIブームを見通すための基礎知識
-
9
OpenAI、次世代「GPT-5.6」シリーズを限定プレビュー 米政府と調整、命名は「Sol/Terra/Luna」に刷新
-
10
AIコーディングはなぜ後から苦しくなるのか? 技術負債に続く「理解負債」「認知負債」という新たな落とし穴
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR