ITmedia NEWS > 社会とIT >
SaaS セレクト with ITreview

マネーフォワード、大規模言語モデル「houou」公開 理研との共同研究 日本語の指示データ2900件を追加学習に利用

» 2023年12月06日 14時34分 公開
[松浦立樹ITmedia]

 マネーフォワードは12月6日、理化学研究所(理研)と共同開発した大規模言語モデル(LLM)「houou」を公開した。出力精度を上げるため、日本語の指示データ(インストラクションデータ)を追加学習に活用した点が特徴という。ライセンスは「LLAMA 2 Community License」に準拠しており、研究や商業目的で利用できる。

 特定分野に特化したAIモデルで精度の高い出力結果を得るには、LLMの追加学習が必要になる。今回マネーフォワードは、タスクとそれに対する出力の指示(インストラクション)のデータセットを学習させる方法「インストラクションチューニング」を採用。rinnaが開発したAIモデル「Youri7B」に対して、理研と共同作成した日本語のインストラクションデータ2903件を追加学習させることで、精度の向上を図ったという。

 マネーフォワードは「当社でチューニングを行ったモデル『houou-7b』と、他のインストラクションデータを使って学習したモデルを比較すると、回答生成の精度の大幅な改善が認められた」とし「少量であっても質の高い日本語データを作成することで、効果的にLLMを学習できることが確認した」と研究成果に自信を見せている。

 hououという名前の由来については「『お金を前へ。人生をもっと前へ。』という当社のミッションに基づき、日本の紙幣にデザインされている鳥・鳳凰から採用した」という。今後は2024年3月まで継続的にAIモデルをリリースしていく方針。

1万円にデザインされた“鳳凰”に由来(国立印刷局のWebサイトから引用

Copyright © ITmedia, Inc. All Rights Reserved.