中国のAIスタートアップDeepSeekが、世界最先端クラスのAIモデル「DeepSeek-R1」をリリースしたことで、AI業界のみならず、投資家や政治家まで巻き込んだ大騒ぎになった。
そのことは前回の原稿に書いた通り。その「DeepSeekショック」と呼ばれるような大騒ぎから1週間が経った(2月4日時点)。これまでに多くの憶測や情報が飛び交っているが、ここで現時点までで明らかになったことと、まだ不明な点について整理してみたい。
まずなぜここまでいろいろな情報が錯綜するのだろうか。恐らく「R1」が中国企業によって開発されたことや、オープンソースでリリースしたことで、米国を応援する人、中国を応援する人、オープンソースを支持する人、クローズドソースを支持する人など、さまざまな立場の人々がそれぞれの思惑や憶測を事実のように広めていて、何が本当で何が誇張なのかを見極めるのは難しくなっているのだと思う。
こういうときは、情報の発信者が信頼に足る人物かどうかを見極めることが重要だ。個人的に信頼できる情報を提供していると思われるのが以下の人物である。この原稿ではこの2人に加え、信頼できる人たちの発言を集めてみた。
DeepSeek-R1のベースとなった基盤モデル「DeepSeek V3」を詳述した論文「DeepSeek-V3 Technical Report」によると、「V3はNVIDIAのH800を278万8000時間稼働させて開発された」とある。
仮に利用料金が1時間当たり2ドルだとすれば、開発コストは約557万6000ドルとなる。一方で、OpenAIのGPT-4oの開発コストは8000万〜1億ドルと推測されている。この数字だけ見れば、GPT-4oの約20分の1の開発コストでV3が開発されたことになる。この数字の比較だけで、米国のAI企業が中国に負けたかのような意見が散見された。
しかし、この「20分の1の開発コスト」という主張には疑問が残る。デビッド・サックス氏によると、600万ドルという数字は最終的な1回のトレーニングランのコストに過ぎず、事前の研究費用や人件費などは含まれていないという。
確かに米国の半導体専門の調査会社SemiAnalysisの分析によれば、DeepSeekは約1万個の半導体H800とH100を所有し、5億ドル以上のハードウェア投資を行ってきたとみられる。従って、開発コストが600万ドルというのは過小評価されている可能性が高い。
【現時点で分かったこと】
これは、どこまでを開発コストとして定義しているのか、という問題に過ぎない。DeepSeekの論文に書かれているのは、研究開発が全て終わった後のトレーニングに掛かった費用のみ。一方で米国企業のいう1億ドルとは、人件費、設備費など研究開発の全てを含んだ金額。つまり話を面白くするために、マスメディアなどが異なる性質の数字を並べて比較したことによる誤解ではないか。ただ20分の1という数字ほど大きな差はないが、コスト効率の高い開発手法が採用されたのは事実と考えられる。
著名投資家のチャマス・パリハピティヤ氏は「DeepSeekに素晴らしい技術力があることは事実」と述べている。同氏によると、DeepSeek-R1では次の2つのアプローチを採用することでコスト削減に成功したという。
米国の研究機関であるAllen Institute for AIのネイサン・ランバート氏によると、NVIDIAの半導体活用の最適化ができるような優れた技術者は非常に少なく、「その数少ない優秀な技術者の一人がDeepSeekにいるということだ」とその技術力を絶賛している。
他にも技術面でDeepSeekを評価する経営者は多く、Uberの創業者のトラヴィス・カラニック氏は「DeepSeekの論文を読んだが、彼らはすごい技術者だと思った」と語っている。
アンドリュー・ン氏は、DeepSeekのAI研究への大きな貢献の1つは「AIの進歩にはスケールアップ以外の道もあると示したことだ」と語っている。同氏もこれまでAIの研究開発の方向性をスケールアップによる性能強化と考えていた時期があったという。だがDeepSeekのおかげでAIの研究開発の方向性には、コストパフォーマンスの最適化という分野もあるのだと認識するようになったと指摘している。
【現時点で分かったこと】
DeepSeekの技術力は確かに素晴らしく、米中間のAI技術格差が縮まったのは間違いない。
Bloomberg通信や日本経済新聞が「DeepSeekと関連するグループがOpenAIのAIモデルから大量のデータを不正に取得していた」と報じている。現在、MicrosoftとOpenAIが調査中であり、不正利用があったのかどうか、現時点では断定できない。
問題となっているのは「蒸留」と呼ばれる開発手法で、新しいAIモデルを開発する際に、すでに存在する基盤モデルに質問し、そのモデルが出してきた回答を新しいモデルの学習データとして利用する方法のことだ。多くのオープンソースモデルはこの方法を使って開発されているが、OpenAIでは同社のモデルを使った蒸留を禁止、もしくは一部企業に限定している。今回の問題は、DeepSeekがOpenAIの利用規約に反してOpenAIのモデルを使った蒸留を行っていたのではないかという疑惑だ。
DeepSeek-R1に対して「あなたは誰ですか」と質問すると「私はOpenAIのモデルです」と答えたという報告がX上に上がっている。これが蒸留が行われていた証拠だとして大騒ぎになっているわけだ。
ところがAIエンジニアの間では、R1の基盤モデルであるDeepSeek V3が1カ月前にリリースした際にも蒸留のうわさが出ていた。V3に同様の質問をすると、やはり「私はOpenAIのモデルです」と答えていた。しかしその時は、それほど大きな問題として取り上げられることはなかった。
デビッド・サックス氏によると、こうした回答をするのは(1)実際に蒸留されたから、(2)学習データとしてネット上のテキスト情報の中にOpenAIのモデルの名称が多く存在するから、の両方のケースが考えられるので、必ずしも蒸留が行われたと断定はできないと言う。ただメディアの取材に対し「蒸留の可能性がある」と語ったところ、DeepSeekのモデルがOpenAIの不正にコピーであるというような論調で大きく報道されたという。
「不正取得」というとかなり大きな問題のように感じられるかもしれないが、シリコンバレーの有識者の間では、もしこの疑惑が事実であったとしても単なる利用規約違反なので、それほど大きな問題だとは感じていないようだ。
「不正利用があったとすれば、それをすぐに阻止できなかったクラウド側の責任ではないのか」(チャマス・パリハピティヤ氏)、「規約違反があったのかどうかは分からないが、DeepSeekの論文を読んだ限りでは、不正をする必要のない優れた技術者集団だと思う」(トラヴィス・カラニック氏、Uberの創業者)、「OpenAIは元々はオープンソースで提供したかったのに、クローズドソースの会社になった。ネット上のデータを盗んでNew York Timesから訴えられた。ところが中国の会社がOpenAIのデータを盗んでオープンソースで公開した。なんという皮肉。OpenAIには全く同情できない。全てオープンソースになってよかったさえと思っている」(ジェイソン・カラカニス氏、起業家、投資家)といった意見が多い。
【現時点で分かったこと】
利用契約に違反する行為があったのかどうかはまだ分からないが、シリコンバレーの有識者たちはDeepSeekの行為にそれほど批判的ではないようだ。それどころかAllen Institute for AIのネイサン・ランバート氏のように「DeepSeekは世界中の研究者のために素晴らしい仕事をした。彼らの論文は非常に詳細で、世界中の研究者にとって非常に実用的な内容になっている」と絶賛する意見が多い。
DeepSeek-R1がオープンウェイトで公開されたことにより、AIの研究開発におけるオープンソースの重要性が改めて浮き彫りになった。
アンドリュー・ン氏は「オープンウェイトモデルはAIサプライチェーンの重要な要素になりつつある」と述べており、基盤モデルのコモディティ化が進む可能性が高いと予測している。
このような価格差が、オープンソースモデルの競争力を高めている。
【現時点で分かったこと】
クローズドソースが最終的に負けるかどうかは不明だが、DeepSeekなどのオープンソースモデルの影響で、OpenAIやAnthropic、Googleなどのクローズドモデルに対する値下げ圧力がかかるのは間違いない。基盤モデルがコモディティ化するわけで、そうなると基盤モデルの利用料金だけで投資のリターンを確保するのは難しくなるだろう。基盤モデルの利用料金以外の収入源が必要になってきそうだ。
基盤モデルがコモディティ化すれば、基盤モデルの利用料金だけでは、膨大な投資のリターンを回収できない。利用料金以外の大きな収入源になりそうなのがパーソナルAIだ。パーソナルAIとは、ユーザー一人一人のニーズを熟知した、秘書のようなAIモデルだ。パーソナルAIはPCやスマートフォンに常駐していて、ユーザーの活動履歴などのプライベートな情報を把握した上で、旅行の予約などを代行してくれたり、的確なアドバイスをくれたりするようになると考えられている。
テック大手の多くはパーソナルAIが次のテクノロジー業界の主戦場だと考えて戦う準備を進めているわけだが、その戦いを最も有利に進められそうな一社がFacebookやInstagram、WhatsAppなどを傘下にもつMetaだ。
MetaのCEOのマーク・ザッカーバーグ氏はこのほど、全社員向けに「今年は勝負の年だ」というビデオメッセージを送っている。その中で同氏は「(2025年は)高度にインテリジェントでパーソナライズされたAIのユーザー数が10億人に達する年になる」「(パーソナルAIを最初に普及させた)企業は、歴史上最も重要な製品の一つを作る上で長期的かつ永続的な優位性を得ることになるだろう」と語ったという。
Metaの各サービスの合計デイリーアクティブユーザー数(DAU)は、2024年7〜9月期の報告では32億7000万人に達したと報告されている。確かにMetaならパーソナルAIユーザー10億人を達成できるかもしれない。
そんな中、OpenAIが3400億ドルの評価額で400億ドルの追加調達を計画中だという報道があった。チャマス・パリハピティヤ氏は「OpenAIがさらなる資金調達を行うのは、(コモディティ化して大きなリターンが期待できない)基盤モデルではなく、パーソナルAIで勝負しようとしているからではないか」と指摘する。
技術力で先頭を走るOpenAIと、ユーザー数で先頭を走るMeta。「正面衝突するようになる」とチャマス・パリハピティヤ氏は言う。
基盤モデルはいずれコモディティ化する。以前からそうした指摘はあったが、DeepSeekがそのシナリオをより現実的なものにしたと言えるだろう。もはや中国VS.米国、オープンソースVS.クローズドソースという勢力争いではなく、実は別の勢力争いが始まろうとしているのかもしれない。
本記事は、エクサウィザーズが法人向けChatGPT「exaBase 生成AI」の利用者向けに提供しているAI新聞「DeepSeekショックから1週間:分かったこと、分からないこと」(2025年2月4日掲載)を、ITmedia ビジネスオンライン編集部で一部編集の上、転載したものです。
有力AI企業が東京に拠点を設けるワケ 「日本は機械学習パラダイス」
マイクロソフト、アマゾンも熱視線 人型ロボット市場、生成AIで加速
AIは2024年、産業界をどう変える 4つの重要な視点
AIが「自分自身を改良する時代」に sakana.aiの発表が示す革命とは?
OpenAI、Soraで「超知能の開発目指す」 どういう意味なのか?© エクサウィザーズ AI新聞
Special
PR注目記事ランキング