メディア
ITmedia AI+ >

中国発AI「DeepSeek-R1」がアップデート 長考での推論やコーディング性能向上か

» 2025年05月29日 12時25分 公開
[ITmedia]

 AI開発企業の中国DeepSeekは5月28日(現地時間)、大規模言語モデル「DeepSeek-R1」のアップデート版を公開した。パラメータ数は6850億で、商用利用もできるMITライセンスの下で提供する。29日午前10時の時点(日本時間)で、公式から性能に関するアナウンスはないが、X上では「性能が上がっている」などの声が出ている。

「DeepSeek-R1」アップデート版が登場(画像はHugging Faceの公開ページより)

 DeepSeek-R1は、DeepSeekが1月に公開したAIモデル。その性能の高さに加え、同等の性能を持つAIモデルに比べ、開発コストを大幅に削減したとして注目を集めた。これにより、AIの計算資源であるGPU開発大手の米NVIDIAの株価が一時大きく下落するなど、「DeepSeekショック」と呼ばれる影響をもたらした。

 今回登場したのは「DeepSeek-R1-0528」というアップデート版で、Hugging Face上で公開している。同ページで性能に関する説明は確認できない一方、同モデルに関し、複数のXユーザーが言及している。

 それによると、DeepSeek-R1の特長の1つであった、問題を解く際に複数のステップに分解して取り組む「CoT」(Chain of Thought、思考連鎖)の挙動が変化。長考による推論性能が高まったという。また、コーディング性能が向上したとする声も出ている。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ