AIの研究で知られる東京大学の松尾・岩澤研究室は3月5日、医療分野に特化した日本語LLM「Weblab-MedLLM-Qwen-2.5-109B-Instruct」を開発したと発表した。2025年の医師国家試験の正答率は、米OpenAIのAIモデル「o1」「GPT-4o」などを上回ったという。チャットAIとして研究者向けに無償提供する。
中国AlibabaのオープンなAIモデル「Qwen-2.5-72B-Instruct」をベースに開発した。さくらインターネットやAI開発企業のELYZA(東京都文京区)、ABEJA(東京都港区)のほか、理化学研究所や医療機関とも連携した。医療分野のデータなどを学習しており、日本語の医学や国内の医療制度に関する知識を備える。
25年の医師国家試験の正答率は93.3%で、o1の92.8%や中国DeepSeekのAIモデル「R1」の91.5%を上回った。外部データを参照して回答を出力する「RAG」などを組み合わせると、図の参照が必要な問題や計算問題を除き、正答率は最大約98%まで高まったという。
医療現場における電子カルテデータの標準化を想定し、感染症や検査の名前を厚生労働省が定める標準名称に変換するタスクでも性能を調べた。その結果、Qwen-2.5-72B-InstructやGPT-4oなどよりも高い性能を示したとアピールしている。
Weblab-MedLLM-Qwen-2.5-109B-Instructは、チャットAIとして研究者向けに無償提供する。期間は3月5日から8月31日まで。なお、診断や診療、治療行為には利用できない。
同LLMの開発は、政府が主導するプロジェクト「戦略的イノベーション創造プログラム」第3期で、医療分野におけるデータやAIの活用を目指す「統合型ヘルスケアシステムの構築」の補助を受けて実施した。
博報堂、東大・松尾豊教授ら設立のAIスタートアップと業務提携
東大松尾研発のAIスタートアップ燈、三菱電機から50億円調達 「企業価値1000億円と評価」
東大・松尾豊教授が設立のAIスタートアップ、80億円の資金調達 三菱UFJ銀行などから
ANA、生成AIで一部業務時間を90%削減へ 東大松尾研発のスタートアップと協力
IBM、日本にAI開発拠点 さくらや松尾研との協力も視野Copyright © ITmedia, Inc. All Rights Reserved.