2015年7月27日以前の記事
検索
連載

DeepSeek-R1とOpneAI「o3-mini」を徹底比較 性能面から見た賢い使い方は?その悩み、生成AIが解決(3/4 ページ)

DeepSeekをユーザー視点で性能面などに注目した場合、どの程度使えるサービスなのだろうか? 同社の推論モデルDeepSeek-R1と、OpneAIの最新の推論モデルo3-miniを比較し、使いどころを探ってみた。

Share
Tweet
LINE
Hatena
-

Web検索して情報をまとめる能力を比較

 Web検索を必要とするタスクについても試してみた。DeepSeek-R1、o3-miniともに、推論モデルとWeb検索を併用することが可能だ。DeepSeekの場合は、入力ボックスの「DeepThink(R1)」と「Search」のボタンを共にオンにした状態で指示を行えばよい。

プロンプト

2024年12月以降のOpenAI、Google、DeepSeekの生成AIモデルの進化についてまとめてください。

 最近数カ月のニュースをまとめる指示では、取り上げるトピックに若干の差はあるものの、いずれも指示から大きく外れることのない回答が出力された。

DeepSeek-R1の回答

1. OpenAIの進化:推論能力とコストの両軸での拡張

o1とo3モデルのリリース

  • o1:数学やプログラミングなどの推論タスクで専門家を超える性能を達成。例えば、数学試験AIME2024で93%の正解率を記録し、思考プロセスを可視化する「思考時間」機能を導入。
  • o3:2024年12月に発表された後継モデル。汎用人工知能(AGI)のベンチマーク「ARC-AGI」で人間の平均スコア(85%)を超える87.5%を達成。ただし、高コンピューティングモードでは1タスクあたり約53万円のコストが発生し、ビジネス用途での適用には課題が残る。
  • o3 mini:コスト効率を改善したモデル。タスクの難易度に応じて推論時間を3段階で調整可能。

マルチモーダル機能の強化

  • Advanced Voice Mode:ChatGPTとのビデオ通話機能を実装。音声と映像を組み合わせた対話が可能に。
  • Realtime API:音声処理に特化したモデルを提供。ただし、音声入出力のコストはテキストの約20倍と高額。

(中略)

3. DeepSeekの台頭:オープンソースと圧倒的なコスト効率

DeepSeek-V3とR1シリーズ

  • V3:6710億パラメータの大規模モデル。Mixture-of-Experts(MoE)アーキテクチャにより、活性化パラメータを370億に抑えつつ、GPT-4oを上回る性能を実現。数学タスク(GSM8K)で89.3%、プログラミング(HumanEval)で65.2%のスコアを記録。
  • R1:OpenAIのo1と同等の推論能力を3.6%のコストで実現。MITライセンスで公開され、商用利用や改変が可能。
  • R1-Zero:強化学習のみで開発された軽量モデル。推論プロセスを完全に可視化するが、出力の可読性に課題あり。

技術革新と業界への影響

  • トレーニングコストの劇的削減:H800 GPUを2ヶ月間使用し、約560万ドルでGPT-4o級のモデルを開発。従来の大規模モデルの学習コスト(数億ドル)を大幅に下回る。
  • 日本語対応:多言語処理能力が高く、ローカル環境での利用によりプライバシー保護を実現。ただし、中国発のモデルであることからデータセキュリティへの懸念も指摘される。

4. 業界全体のトレンド

  • 推論能力の競争:OpenAIのo3、DeepSeek-R1、GoogleのGemini 2.0が、複雑な問題解決や論理的思考でしのぎを削る。

(後略)

OpneAI o3-miniの回答

OpenAIの進化

  • 新世代モデルの登場

 2024年末から2025年初頭にかけ、OpenAIは従来のo1シリーズに続く新たなモデル群(「o3」シリーズや、よりコンパクトな「o3 Mini」)を発表しました。これらのモデルは、従来モデルよりも「考える」時間(test time compute)を拡充することで、複雑な推論や数学的問題、プログラミング課題への対応能力を向上させています。特にo3 Miniは、小型でありながら高い推論性能を発揮し、従来の大規模モデルと同等の結果をより効率的に実現しています

  • 製品・サービスの拡充と競争への対応

 Sam Altman CEOは、DeepSeekなど外部の低コスト・高性能なモデルの登場を受け、今後も迅速なモデル改良と新機能の追加(例:ウェブ検索連携、コード呼び出し機能など)を推進すると表明。これにより、ユーザーにはより高性能かつ多機能なサービス提供を目指しています

(中略)

DeepSeekの進化

  • 低コストで高性能なモデル

 中国発のDeepSeekは、2024年12月にDeepSeek V3をリリースし、続いて2025年初頭に推論能力に特化したR1モデルを公開しました。R1は、数学やプログラミング、論理的推論タスクにおいてOpenAIのo1モデルと同等、あるいはそれ以上の性能を示す一方で、訓練コストは約600万ドルと非常に低コストで実現されています

  • オープンソース志向と技術的特徴

 DeepSeekは、モデルのアーキテクチャにおいて、Mixture of Experts(MoE)やMulti-head Latent Attention(MLA)といった先進的な手法を採用。これにより、効率的な推論と計算資源の最適化を実現しています。さらに、オープンウェイトモデルとして開発され、研究者や開発者がモデルを自由に利用・改良できる点も大きな特徴です

総括

 2024年12月以降、生成AI分野では各社とも性能の大幅向上と効率化、低コスト化が進展しています。

  • OpenAIは新世代のo3シリーズやo3 Miniで「考える」能力を強化し、ユーザー向け機能も拡充。

(後略)

 いずれの用途も、OpneAI o3-miniと遜色ない出力結果がDeepSeek-R1でも得られた。性能面においては十分に使えるレベルといえる。

 ただし現時点では、プロンプト送信時にサーバーが「ビジー状態」との表示が出てしまい、出力が行えないケースも多い。日本時間の早朝や深夜、週末などは比較的利用しやすい印象だが、もう少し安定して使えるようになるとありがたい。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る