リコー、“日本語で推論”できるマルチモーダルLLMを開発 「Gemini 2.5 Pro」に匹敵うたう
リコーは3月30日、推論のプロセスを日本語化したマルチモーダルLLM「Qwen3-VL-Ricoh-32B-20260227」を開発したと発表した。320億パラメータを持ち、複雑な図表を含む日本語の資料も読解できるという。米GoogleのAIモデル「Gemini 2.5 Pro」に匹敵する性能をうたう。
Qwen3-VL-Ricoh-32B-20260227は、複雑なフロー図や複数ページにわたるグラフなどにも対応する。図表を含む日本語の文書をもとに、質問に回答する性能を測るベンチマークでは、Gemini 2.5 Proに匹敵する性能を示したとアピールしている。また回答の根拠や前提条件などを日本語で確認できる。
Qwen3-VL-Ricoh-32B-20260227の開発では、中国AlibabaのAIモデル「Qwen3-VL-32B-Instruct」をベースにした。同モデルの弱点を改善するのに有効な学習データを用意し、事後的に特定のタスクに最適化するファインチューニングを行った。
さらにAIが試行錯誤し、結果に応じた報酬をもとに出力を改善する強化学習も実施した。出力の正確さに加えて、日本語による推論の出力にも高い報酬を設定するといった工夫を施した。
自社AIプラットフォーム「H.D.E.E.N」で提供
リコーは、独自のAIプラットフォーム「H.D.E.E.N」(ひでん)や、リコー製のLLMを搭載した小型のAIサーバを展開するなど、企業向けのAIサービスに注力している。Qwen3-VL-Ricoh-32B-20260227の開発では、画像を含むさまざまな企業内データを扱いながら推論でき、オンプレミスで導入できるAIモデルを目指した。
同社の児玉哲氏(リコーデジタルサービスビジネスユニット AIサービス事業本部 AI事業開発センター所長)は、リコーのAI開発の戦略について「AIモデル単体でビジネスしようとは考えていない」と説明する。Qwen3-VL-Ricoh-32B-20260227についても、H.D.E.E.Nなどを通じて提供する。
また児玉氏は、リコー自らAIモデルを開発する理由として「自社で手掛けることで獲得できる技術やノウハウを、顧客にソリューションとして提供できる」と語る。今回の取り組みでは、AIが処理する際の画像トークンを減らす技術なども開発した。これにより、AIモデルの運用コストの削減につなげたい考えだ。
Qwen3-VL-Ricoh-32B-20260227の開発では、経済産業省と新エネルギー・産業技術総合開発機構の国内企業向けAI開発支援プロジェクト「GENIAC」第3期の補助を受けた。同モデルの軽量版「Qwen3-VL-Ricoh-8B-20260227」をHugging Faceで公開しているほか、画像を含む文書をもとに推論する性能を測るリコー独自のベンチマークも公開する予定だ。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
GPT-5.5は最高性能ではないのに、なぜエンジニアが熱狂? カギは“最後まで自走する力”
-
2
Google、“動画版Nano Banana”こと「Gemini Omni」公開 会話で映像を生成・編集
-
3
Appleが5年がかりで開発したセキュリティ対策を5日で突破 「Mythos」が見せつけた脆弱性攻撃の威力
-
4
日立、Anthropicと提携 グループ29万人に「Claude」などAI導入 社会インフラ分野にも展開へ
-
5
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
6
【やさしいデータ分析】ベイズ統計入門 ~ 古典的な統計との違いと使い分け
-
7
「最新のAI創薬ラボ」なのに会議室みたい!? 製薬大手がラブコール送る“異色のAI企業”による新拠点とは
-
8
みずほFGが実現 2週間かかるAIエージェント開発を最短数日にする仕組みとは?
-
9
キオクシア社長「記録的な増収増益」 3カ月の売上収益1兆円、純利益は2990%増 好決算の背景は
-
10
アクセンチュアらが「エージェント型工場」を開発 製造現場の計画外停止の削減図る
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR