中国発AI「DeepSeek-R1」がアップデート 長考での推論やコーディング性能向上か
AI開発企業の中国DeepSeekは5月28日(現地時間)、大規模言語モデル「DeepSeek-R1」のアップデート版を公開した。パラメータ数は6850億で、商用利用もできるMITライセンスの下で提供する。29日午前10時の時点(日本時間)で、公式から性能に関するアナウンスはないが、X上では「性能が上がっている」などの声が出ている。
DeepSeek-R1は、DeepSeekが1月に公開したAIモデル。その性能の高さに加え、同等の性能を持つAIモデルに比べ、開発コストを大幅に削減したとして注目を集めた。これにより、AIの計算資源であるGPU開発大手の米NVIDIAの株価が一時大きく下落するなど、「DeepSeekショック」と呼ばれる影響をもたらした。
今回登場したのは「DeepSeek-R1-0528」というアップデート版で、Hugging Face上で公開している。同ページで性能に関する説明は確認できない一方、同モデルに関し、複数のXユーザーが言及している。
それによると、DeepSeek-R1の特長の1つであった、問題を解く際に複数のステップに分解して取り組む「CoT」(Chain of Thought、思考連鎖)の挙動が変化。長考による推論性能が高まったという。また、コーディング性能が向上したとする声も出ている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
東大松尾研が「LLM講座 基礎編」の講義資料を無料公開 期間限定で
-
2
ローカルLLMは本当に手元で動くのか? ハードウェアとモデルの現実的な選び方【2026年春】
-
3
AIコスト高騰で中国DeepSeekへの“乗り換え”続出か 米国決済サービスの支出調査で明らかに
-
4
2年間で「1万時間」削減 「1円の誤りも許されない」ソニー経理が“まず試してみる”DX集団に化けたワケ
-
5
「家庭教師のトライ」が学力診断にAI活用 20問解くだけで弱点を推定 生徒と講師の負担減らす
-
6
Google Chromeの新機能「Skills」 AIプロンプトの“毎回手打ち”を不要に
-
7
X、画像投稿時に「Grokによる修正をブロック」選べるように
-
8
人型ロボブームを“先駆者ホンダ”はどう見る? 「悔しさもあるが……」 次の一手を聞いた
-
9
なぜ一部のAIモデルは「日本文化」に執着するのか? 「4o-mini」などの出力が日本に偏る実態、欧州チームが研究発表
-
10
英ケンブリッジ大学、AIが設計したワクチンの臨床試験に成功 未知の変異株にも備える“万能型”
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR