速報
中国発AI「DeepSeek-R1」がアップデート 長考での推論やコーディング性能向上か
AI開発企業の中国DeepSeekは、大規模言語モデル「DeepSeek-R1」のアップデート版を公開した。パラメータ数は6850億で、商用利用もできるMITライセンスの下で提供する。
AI開発企業の中国DeepSeekは5月28日(現地時間)、大規模言語モデル「DeepSeek-R1」のアップデート版を公開した。パラメータ数は6850億で、商用利用もできるMITライセンスの下で提供する。29日午前10時の時点(日本時間)で、公式から性能に関するアナウンスはないが、X上では「性能が上がっている」などの声が出ている。
DeepSeek-R1は、DeepSeekが1月に公開したAIモデル。その性能の高さに加え、同等の性能を持つAIモデルに比べ、開発コストを大幅に削減したとして注目を集めた。これにより、AIの計算資源であるGPU開発大手の米NVIDIAの株価が一時大きく下落するなど、「DeepSeekショック」と呼ばれる影響をもたらした。
今回登場したのは「DeepSeek-R1-0528」というアップデート版で、Hugging Face上で公開している。同ページで性能に関する説明は確認できない一方、同モデルに関し、複数のXユーザーが言及している。
それによると、DeepSeek-R1の特長の1つであった、問題を解く際に複数のステップに分解して取り組む「CoT」(Chain of Thought、思考連鎖)の挙動が変化。長考による推論性能が高まったという。また、コーディング性能が向上したとする声も出ている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「DeepSeek V3」に“改良版”がひっそり登場 「性能が大幅に向上」とXで話題に 応答速度も4倍速く?
中国AI企業のDeepSeekは、AIモデル「DeepSeek V3-0324」をHugging Faceで公開した。2024年12月にリリースしたAIモデル「DeepSeek V3」の改良版とみられる。
DeepSeek、“理論上のコスト利益率”は545%と主張
中国DeepSeekは、自社のオンラインサービスの“理論上のコスト利益率”が545%だと主張した。H800のリリースコストの試算値と、R1とV3がすべて有料で使われたと仮定した場合の数値だ。
Anthropic、「Claude 3.7 Sonnet」公開 「o1」を大きく上回るコーディング性能
米Anthropicは、ハイブリッド推論モデル「Claude 3.7 Sonnet」を発表した。
DeepSeekで注目された「蒸留」って何だ? 識者が解説
中国のAI企業DeepSeekが、OpenAIの最新モデルに匹敵する性能を持つAIを、わずか10分の1以下のコストで開発したと発表し、AI業界に衝撃が走っている。NVIDIAの株価は一時17%下落。その背景には「蒸留」と呼ばれる技術の存在が取り沙汰されているが、その評価は専門家の間で分かれている。同社の快進撃の真相と、AI開発の新たなパラダイムとは何か。
「DeepSeekショック」とは何だったのか? 2025年、AI開発の最新事情を解説
1月27日に株式市場を襲った「DeepSeekショック」。中国のAI開発企業DeepSeekが開発した、低コストながらも高性能な生成AIモデルをきっかけに、米国の株式市場においてハイテク株が下落した。なぜこのような株価の急落が起きたのか。
