みずほFGの自社LLM、「GPT-5.2と同精度」でオンプレ運用可能 「Qwen3-32B」ベース
みずほフィナンシャルグループは3月5日、独自で開発を進めている「金融特化LLM」が、銀行の実務テストで、推論に依存しない条件下での正答率89.0%を達成したと発表した。実務実装を想定した評価では、平均回答時間1秒未満を実現したという。
汎用LLMの「GPT-5.2」推論あり設定(平均回答時間67.4秒)と比較し、応答時間を大幅に短縮。銀行内のセキュアなオンプレミス環境で運用でき、機密性の高いデータもGPT-5.2同等のAI処理を安全に適用できるとしている。
オープンウェイトモデルの「Qwen3-32B」をベースに構築した。
回答生成やタスクの正誤を分析することで、モデルの得意・不得意領域を特定。汎用知識に加え、金融基礎や業務手続、社内ルール、コンプライアンス上の注意点などを見極めた。
不得意領域については、正答を導き出すために必要な金融知識や、社内ルールの根拠となるコンテキストを教師データに付与。回答と根拠の対応関係が学習されるようデータ設計を最適化し、教師ありファインチューニングを行った。
今後、パラメータサイズがさらに大きいモデルで学習するなどして精度を向上させる他、より専門性の高い融資や外為、法務などへの適用拡大を進める。さらに、複数の特定領域特化モデルを連携させ、部門横断的な判断を支援できるようにする計画だ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
2
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
3
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
4
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
5
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
6
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
7
ひろゆき氏「SIer衰退予測」、AI代替の「逆転現象」の理由 2026年に生き残るエンジニア“4つの役割”
-
8
え、21日で37テラも? 高性能SSDを食いつぶす「あのAIツール」にご用心:886th Lap
-
9
日本の「完璧主義」から脱却し中国ヒューマノイドにどう立ち向かうか
-
10
AWSの「静かな」戦略シフト OpenAIとAnthropic“1日違い登壇”の意味を読み解く
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR