中国発AI「DeepSeek-R1」がアップデート 長考での推論やコーディング性能向上か
AI開発企業の中国DeepSeekは5月28日(現地時間)、大規模言語モデル「DeepSeek-R1」のアップデート版を公開した。パラメータ数は6850億で、商用利用もできるMITライセンスの下で提供する。29日午前10時の時点(日本時間)で、公式から性能に関するアナウンスはないが、X上では「性能が上がっている」などの声が出ている。
DeepSeek-R1は、DeepSeekが1月に公開したAIモデル。その性能の高さに加え、同等の性能を持つAIモデルに比べ、開発コストを大幅に削減したとして注目を集めた。これにより、AIの計算資源であるGPU開発大手の米NVIDIAの株価が一時大きく下落するなど、「DeepSeekショック」と呼ばれる影響をもたらした。
今回登場したのは「DeepSeek-R1-0528」というアップデート版で、Hugging Face上で公開している。同ページで性能に関する説明は確認できない一方、同モデルに関し、複数のXユーザーが言及している。
それによると、DeepSeek-R1の特長の1つであった、問題を解く際に複数のステップに分解して取り組む「CoT」(Chain of Thought、思考連鎖)の挙動が変化。長考による推論性能が高まったという。また、コーディング性能が向上したとする声も出ている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
データセンター建設に足りないのは「発電」ではなく「送電」 AI需要で電力消費26%増、Gartner予想
-
2
「Claude Fable 5」「Mythos 5」全面停止 米政府の指令により Anthropicは早期復旧を宣言
-
3
最新AI「Fable 5」でYouTube動画作ってみた 想像以上の出来に驚愕、ただし大きな弱点も
-
4
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
-
5
トヨタが抜かれる日――キオクシア首位奪取、2005年「時価総額トップ10」を振り返る
-
6
NTT、独自のAIモデル「tsuzumi 2」発表 “国産AI開発競争”に「負けられない」と島田社長
-
7
中国が人型ロボット開発競争をリードする「納得の理由」 日本に残された逆転シナリオは?
-
8
「もはや宗教」のClaudeに焦るOpenAI 流出メモが暴いた覇権交代のリアル
-
9
「人型ロボ世界シェア1位」中国Unitreeに聞く“普及戦略” 日本市場をどう開拓?
-
10
時価総額3兆ドルの原動力 NVIDIAトップが貫く「誰もやらない」逆張りの経営
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR