1月20日(日本時間)に登場した大規模言語モデル「DeepSeek-R1」に、AI開発者やユーザーたちが驚いている。中国のスタートアップDeepSeekが開発したこのモデルは、分野によっては米OpenAIの「o1」に匹敵するとうたう性能が特徴。モデルは無料でダウンロードも可能で、商用利用も認められている。
DeepSeekはChatGPTに似たチャットUIも無料で提供しており、同サービス上では、現時点ではo1と併用できないWeb検索機能も利用できる。つまり、OpenAIをはじめとした他社のハイエンドモデルに近い性能のモデルがスタートアップから突然公開され、さらに同等以上の機能とコストパフォーマンスを持つサービスとしてもリリースされたわけだ。
それだけでも衝撃だが、開発コストや地政学的リスクなど、業界に影響を与える話題は枚挙にいとまがない。世界中のハイテク株に影響を与えた可能性も出ており、SNSではインフルエンサーが盛んに(時には扇情的に)取り上げている。
米国では、DeepSeekがApp Store無料アプリランキングで一時1位になるほどの注目度だ。そこで、本記事ではDeepSeek-R1のどんなポイントが、業界に大きな衝撃を与えているかまとめる。
OpenAIや「Claude」提供会社の米Anthropicが自社のモデルを広く公開せず、APIやチャットUI形式でのみ提供する中、DeepSeek-R1はモデルそのものをダウンロード可能にしている。
求められる計算リソースが大きく、さすがにR1そのものを個人のPCで手軽に動かすことは難しい。しかし、DeepSeekは蒸留(既存の大きなモデルを基に、近い性能を持ったより小さいモデルを開発する手法)モデルも複数公開している。蒸留モデルはある程度スペックの高いGPUを搭載したPCがあれば、個人でも手元で試せる。
もちろん、蒸留モデルも無料でダウンロード可能。R1と同じように商用利用も認めている。SNSでは「OpenAIよりはるかにオープン」と評する声もある。
それでいて、機能や性能が他社モデルに見劣りしないのも特徴だ。特に注目されているのはやはりWebサービスとしてのDeepSeek R1。ChatGPTに似たUIのWebアプリ・スマートフォンアプリを提供しており、どちらも高速で回答を求められる通常モードと、時間をかけて深い思考をしてもらう「Deepthink」モードを使い分け可能。Deepthinkは思考の過程ものぞくことができる。そしてWeb検索を併用する「Search」も各モードで使える。
性能も高い。DeepSeekはR1について、ベンチマークでは一部のタスクで「GPT-4o」などを超える性能としている。記者が軽く試した際もClaudeの「Claude 3 Sonnet」や「GPT-4o」「o1」などとそん色のないものが出てくると感じた。SNSでは早速小説の執筆や、コーディングでの活用を模索する人も見られる。
チャットUIと違って有料だが、R1はAPIも利用可能だ。しかも利用料も安い。GPT-4oと比べると5分の1程度、o1と比べると27分の1程度だ。
真偽が明確でない情報も含まれるが、DeepSeek R1の成り立ちも注目の的だ。OpenAIはGPT-4oやo1の開発コストを公表していないが、GPT-4の開発コストが百数十億円と報道されている。
Copyright © ITmedia, Inc. All Rights Reserved.