みずほフィナンシャルグループは3月5日、独自で開発を進めている「金融特化LLM」が、銀行の実務テストで、推論に依存しない条件下での正答率89.0%を達成したと発表した。実務実装を想定した評価では、平均回答時間1秒未満を実現したという。
汎用LLMの「GPT-5.2」推論あり設定(平均回答時間67.4秒)と比較し、応答時間を大幅に短縮。銀行内のセキュアなオンプレミス環境で運用でき、機密性の高いデータもGPT-5.2同等のAI処理を安全に適用できるとしている。
オープンウェイトモデルの「Qwen3-32B」をベースに構築した。
回答生成やタスクの正誤を分析することで、モデルの得意・不得意領域を特定。汎用知識に加え、金融基礎や業務手続、社内ルール、コンプライアンス上の注意点などを見極めた。
不得意領域については、正答を導き出すために必要な金融知識や、社内ルールの根拠となるコンテキストを教師データに付与。回答と根拠の対応関係が学習されるようデータ設計を最適化し、教師ありファインチューニングを行った。
今後、パラメータサイズがさらに大きいモデルで学習するなどして精度を向上させる他、より専門性の高い融資や外為、法務などへの適用拡大を進める。さらに、複数の特定領域特化モデルを連携させ、部門横断的な判断を支援できるようにする計画だ。
みずほ証券、自律型AIエンジニア「Devin」を大規模導入 国内大手金融で初
フェイクなどAIリスクに対抗、国際団体「Frontria」富士通が設立 みずほFGやLINEヤフーなど参加、開発者コミュニティも
リコー、日本語で“GPT-5と同等性能”うたう金融業務特化型LLMを開発
みずほFG、ソフトバンクとAIで提携 「Cristal intelligence」導入、24時間経営アドバイス可能にCopyright © ITmedia, Inc. All Rights Reserved.