メディア
ITmedia AI+ >

「DeepSeekショック」とは何だったのか? 2025年、AI開発の最新事情を解説(1/5 ページ)

» 2025年02月04日 11時44分 公開
[小林啓倫ITmedia]

 1月27日に株式市場を襲った「DeepSeekショック」。中国のAI開発企業DeepSeekが、低コストながらも高性能な生成AIモデルを発表し、さらに同社のiPhone向けアプリが、無料アプリランキングでChatGPTをおさえて1位を獲得したことをきっかけに、米国の株式市場においてハイテク株が下落した出来事を指す。

「DeepSeekショック」とは何だったのか?

 特にGPU市場を支配する米NVIDIAについては、DeepSeekの技術がGPUへの需要を減らすのではないかとの懸念から株価が急落。一時は時価総額で約6000億ドル(約92兆円)もの価値が一気に失われた。

 なぜこのような株価の急落が起きたのか。それがAIを利用する一般企業にとって、何を意味するのかを考えてみたい。

DeepSeekショックとは何だったのか?

 まずはそもそもの話として、いまや珍しいものではなくなった生成AIモデル/サービスの発表が「ショック」と称されるほどの衝撃を持って迎えられたかを整理しておこう。

 現在のAI開発、特にトップクラスのAIモデルを開発・運用する際には、とにかく莫大なリソースと予算が必要であるとされている。中でも重要な要素の1つがGPUだ。まずAIモデルの開発段階では、現在主流の開発手法において膨大な計算処理が行われる。この計算処理を高速化するために、従来のCPUよりも並列処理に優れるGPUが欠かせない。

 また開発後の運用段階において、ユーザーへの迅速な応答が求められることから、リアルタイムでの推論処理が必要となるケースが多い。しかしGPUは並列計算によって複雑なモデルの推論処理を高速に行えるため、ここでもその活用が必須となっている。

 もちろん高度なAIモデルの開発には、ハードウェア以外の要素でもさまざまなコストがかかるため、最先端のモデルは非常に高額な製品となっている。例えば、米OpenAIのGPT-4の開発には、実に1億ドル(約155億円)以上もの開発費がかかったと推測されている。

 当然ながらそのコストは、ユーザーへの利用料金となってはね返ってくる。こちらもOpenAIでの一例を挙げると、ChatGPTの最上位モデル(o1 pro mode)を個人として使いたければ、月額200ドル(約3万1000円)の料金を払わなければならないことはご存じの通り。

ChatGPTの最上位モデルを使うには月額200ドルが必要

 要するに、最先端のAIの恩恵にあずかりたければ「大量の予算とリソースを投じてAIモデルを開発するか、そうやって開発したモデルに高額の使用料を払わなければならない」というのがこれまでの考え方だったわけだ。

 ところがDeepSeekは、米国がAI向け半導体輸出規制措置の対象国としている中国の企業であり、そもそも最先端のGPUへのアクセスが限られている。そこで彼らは最新の研究成果や技術革新を活用し、AIモデルを開発する際、従来に比べて学習や推論に必要な計算資源を大幅に削減することに成功した。またその運用面においても、GPU負荷を低減する工夫がなされている。

 その結果、例えばDeepSeekのAIモデル「v3」は、各種ベンチマークでOpenAIの上位AIモデル「o1」に匹敵する性能を持つと評価されながら、開発費は557.6万ドル(約8億7000万円)しかかからなかったと説明されている(しかしDeepSeekの会社としてのハードウェア支出は5億ドル(約775億円)をはるかに上回っており、これらのコストをモデル開発費から除外して考えるのは適切ではないとの指摘もある)。

 こうした開発費の抑制を反映してか、現在DeepSeek-v3のAPI利用料金は、OpenAIの旧モデルであるGPT-3.5-turboと比較した場合でも10分の1以下となっており、非常に利用しやすい。

DeepSeek-v3のAPI利用料金

 またDeepSeekがv3をベースに、その後続として発表している一連のモデル(R1やその蒸留モデルなど)は、計算能力の小さい端末でも動作できる設計で、エッジコンピューティング環境での活用などさまざまな展開が可能だ。さらに言えば、DeepSeekのAIモデルはオープンソースモデルとして開発されており、ライセンス条件を順守すれば、ユーザーは自分の端末に彼らのモデルをダウンロードして、実行したり改変したりできる。

 ちなみにDeepSeekショックの最大の被害者であるはずのNVIDIAは、DeepSeekのAIモデルが「広く利用可能なモデルと、輸出規制に完全に準拠したコンピューティングを活用している」と説明し、米国の技術輸出規制に準拠した「AI技術の優れた進歩」だとの認識を示している。

 仮にDeepSeekの取り組みが1回きりの奇跡ではなく、同じことを繰り返し行えるのなら。DeepSeekがAI向け半導体輸出規制措置を何らかの形で逃れ、隠れて高度なリソースを使っているのでないのなら。欧米のAI企業が主張するよりもずっと少ないGPUで、ひいてはもっと少ない予算やリソースで最先端のAIを開発・運用できるのではないか。

 そんなパラダイムシフトとも呼べる状況への期待が高まったことで、従来のパラダイムでビジネスモデルを設計しているAI関連企業の株価が下がったのである。ではなぜDeepSeekは低開発・低運用コストのAIモデル開発に成功したのか、その手法について、現在判明している点を整理してみよう。

       1|2|3|4|5 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ