検索
ニュース

“医療特化”の日本語LLM開発、東大松尾研やさくらなど 研究者に無償提供

AIの研究で知られる東京大学の松尾・岩澤研究室は、医療分野に特化した日本語LLM「Weblab-MedLLM-Qwen-2.5-109B-Instruct」を開発したと発表した。

Share
Tweet
LINE
Hatena

 AIの研究で知られる東京大学の松尾・岩澤研究室は3月5日、医療分野に特化した日本語LLM「Weblab-MedLLM-Qwen-2.5-109B-Instruct」を開発したと発表した。2025年の医師国家試験の正答率は、米OpenAIのAIモデル「o1」「GPT-4o」などを上回ったという。チャットAIとして研究者向けに無償提供する。

 中国AlibabaのオープンなAIモデル「Qwen-2.5-72B-Instruct」をベースに開発した。さくらインターネットやAI開発企業のELYZA(東京都文京区)、ABEJA(東京都港区)のほか、理化学研究所や医療機関とも連携した。医療分野のデータなどを学習しており、日本語の医学や国内の医療制度に関する知識を備える。

 25年の医師国家試験の正答率は93.3%で、o1の92.8%や中国DeepSeekのAIモデル「R1」の91.5%を上回った。外部データを参照して回答を出力する「RAG」などを組み合わせると、図の参照が必要な問題や計算問題を除き、正答率は最大約98%まで高まったという。


2025年の医師国家試験の正答率(出典:プレスリリース、以下同)

 医療現場における電子カルテデータの標準化を想定し、感染症や検査の名前を厚生労働省が定める標準名称に変換するタスクでも性能を調べた。その結果、Qwen-2.5-72B-InstructやGPT-4oなどよりも高い性能を示したとアピールしている。


電子カルテデータの標準化における既存の課題と目指す姿

感染症や検査の名前を厚生労働省が定める標準名称に変換するタスクの例

同タスクの性能

 Weblab-MedLLM-Qwen-2.5-109B-Instructは、チャットAIとして研究者向けに無償提供する。期間は3月5日から8月31日まで。なお、診断や診療、治療行為には利用できない。

 同LLMの開発は、政府が主導するプロジェクト「戦略的イノベーション創造プログラム」第3期で、医療分野におけるデータやAIの活用を目指す「統合型ヘルスケアシステムの構築」の補助を受けて実施した。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る