日本産AIが“日商簿記1級”で合格レベル 選択&計算問題で正答率99.8% AIベンチャー企業が発表
AIベンチャー企業のファーストアカウンティングは、経理特化型AI「Deep Dean」が簿記検定試験(日商簿記)で合格レベルの記録を出したと発表した。
AIベンチャー企業のファーストアカウンティング(東京都港区)は1月26日、同社が研究する経理特化型AI「Deep Dean」が簿記検定試験(日商簿記)で合格レベルの記録を出したと発表した。同検定1級の試験問題で正答率99.8%を記録した他、2級と3級では100%の正答率を達成したという。
日商簿記は、日本商工会議所が主催する簿記検定の最上位資格で、合格率は約10〜15%前後の難関試験として知られている。科目は「商業簿記」「会計学」「工業簿記」「原価計算」の4つで、1級の出題範囲は2級と比較しても広い。合格基準は全科目において40%以上、かつ総合得点で70%以上で、独学ならば一般的に500〜1000時間以上の学習が必要とされる。
今回の検証では、日商簿記1級試験の過去問題や予備校などが公開する模範解答を評価に利用。用語選択や勘定科目に関する設問を含む、数値計算問題と選択式問題のみを対象とした。自由記述問題は採点基準の非公開性や主観的要素を含むため、検証対象から除外した。AIの推論結果の確率的な揺らぎも考量し、計5回の推論を実施してその平均値を算出し、正答率99.8%を記録した。
Deep Deanは約40億パラメータの軽量LLM。汎用的なAIではなく、経理・会計分野に特化して設計・学習されていることが特徴だ。Deep Deanはこれまでにも、USCPA(米国公認会計士)の過去問題でも全6科目中、必須3科目(FAR、AUD、REG)を含む5科目で正答率90%以上、日本の公認会計士試験短答式4科目などでも満点を記録。いずれも合格ラインを上回る水準の性能を示していた。
ファーストアカウンティングは「日商簿記1級は、上場企業の会計実務を前提とした難関試験。Deep Deanが高い水準でその合格基準をクリアしたことは、慢性的な人手不足に直面するプロフェッショナルな経理実務を支える上で、大きな意義を持つ」と説明。同社は今後も、上場企業の経理現場で実戦的に活躍できるAIの研究・開発を目指す。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
KDDI傘下のELYZA、日本語特化の「拡散言語モデル」公開 商用利用も可
KDDIの子会社で、AIを研究開発するELYZAは、日本語に特化した拡散大規模言語モデル(dLLM)「ELYZA-LLM-Diffusion」シリーズを公開した。同シリーズはHugging Faceで公開しており、商用利用もできる。
Anthropic、医療・創薬特化のClaude発表 新技術「Agent Skills」を投入
Anthropicは医療特化型の「Claude for Healthcare」を発表した。最新の「Opus 4.5」を基盤に、HIPAA準拠の環境で診療支援や創薬研究を加速させる。新技術「Agent Skills」により、必要な専門データのみを動的に読み込み、低コストで高度なタスクを実行可能にするとしている。
Cygames、“AI特化”の子会社設立 「クリエイターが安心・安全に利用できるAI技術」の開発目指す
Cygamesは、AIを活用したサービスやツールを開発する子会社Cygames AI Studio(東京都渋谷区)を設立したと発表した。Cygamesがゲーム制作で培った知見をもとに、「クリエイターが安心・安全に利用できるAI技術」の開発を目指す。
三井不動産、「社長AI」を独自開発 “本人の思考”再現 「社長をより身近に感じながら業務に生かす」
三井不動産は、同社の植田俊代表を模したチャットAI「社長AIエージェント」を独自開発したと発表した。植田代表の経歴や発信内容などをもとに、同氏の「ものの見方・考え方」を再現したという。
マネーフォワード、AIエージェント事業参入へ DXならぬ「AX」支援
マネーフォワードの辻庸介代表取締役社長は、法人向けAIエージェント事業に参入すると発表した。同社のサービスを使った経費精算や、会計業務、人事関連業務を自動化するエージェントを開発し、2025年中に順次リリースするという。