中国発AI「DeepSeek-R1」がアップデート　長考での推論やコーディング性能向上か

AI開発企業の中国DeepSeekは、大規模言語モデル「DeepSeek-R1」のアップデート版を公開した。パラメータ数は6850億で、商用利用もできるMITライセンスの下で提供する。

[ITmedia] PC用表示関連情報

LINE

Hatena

　AI開発企業の中国DeepSeekは5月28日（現地時間）、大規模言語モデル「DeepSeek-R1」のアップデート版を公開した。パラメータ数は6850億で、商用利用もできるMITライセンスの下で提供する。29日午前10時の時点（日本時間）で、公式から性能に関するアナウンスはないが、X上では「性能が上がっている」などの声が出ている。

「DeepSeek-R1」アップデート版が登場（画像はHugging Faceの公開ページより）

　DeepSeek-R1は、DeepSeekが1月に公開したAIモデル。その性能の高さに加え、同等の性能を持つAIモデルに比べ、開発コストを大幅に削減したとして注目を集めた。これにより、AIの計算資源であるGPU開発大手の米NVIDIAの株価が一時大きく下落するなど、「DeepSeekショック」と呼ばれる影響をもたらした。

　今回登場したのは「DeepSeek-R1-0528」というアップデート版で、Hugging Face上で公開している。同ページで性能に関する説明は確認できない一方、同モデルに関し、複数のXユーザーが言及している。

　それによると、DeepSeek-R1の特長の1つであった、問題を解く際に複数のステップに分解して取り組む「CoT」（Chain of Thought、思考連鎖）の挙動が変化。長考による推論性能が高まったという。また、コーディング性能が向上したとする声も出ている。

中国発AI「DeepSeek-R1」がアップデート　長考での推論やコーディング性能向上か

関連記事

関連リンク

中国発AI「DeepSeek-R1」がアップデート 長考での推論やコーディング性能向上か

関連記事

関連リンク

中国発AI「DeepSeek-R1」がアップデート　長考での推論やコーディング性能向上か