DeepSeek-R1とOpneAI「o3-mini」を徹底比較 性能面から見た賢い使い方は?:その悩み、生成AIが解決(3/4 ページ)
DeepSeekをユーザー視点で性能面などに注目した場合、どの程度使えるサービスなのだろうか? 同社の推論モデルDeepSeek-R1と、OpneAIの最新の推論モデルo3-miniを比較し、使いどころを探ってみた。
Web検索して情報をまとめる能力を比較
Web検索を必要とするタスクについても試してみた。DeepSeek-R1、o3-miniともに、推論モデルとWeb検索を併用することが可能だ。DeepSeekの場合は、入力ボックスの「DeepThink(R1)」と「Search」のボタンを共にオンにした状態で指示を行えばよい。
【プロンプト】
2024年12月以降のOpenAI、Google、DeepSeekの生成AIモデルの進化についてまとめてください。
最近数カ月のニュースをまとめる指示では、取り上げるトピックに若干の差はあるものの、いずれも指示から大きく外れることのない回答が出力された。
DeepSeek-R1の回答
1. OpenAIの進化:推論能力とコストの両軸での拡張
■o1とo3モデルのリリース
- o1:数学やプログラミングなどの推論タスクで専門家を超える性能を達成。例えば、数学試験AIME2024で93%の正解率を記録し、思考プロセスを可視化する「思考時間」機能を導入。
- o3:2024年12月に発表された後継モデル。汎用人工知能(AGI)のベンチマーク「ARC-AGI」で人間の平均スコア(85%)を超える87.5%を達成。ただし、高コンピューティングモードでは1タスクあたり約53万円のコストが発生し、ビジネス用途での適用には課題が残る。
- o3 mini:コスト効率を改善したモデル。タスクの難易度に応じて推論時間を3段階で調整可能。
■マルチモーダル機能の強化
- Advanced Voice Mode:ChatGPTとのビデオ通話機能を実装。音声と映像を組み合わせた対話が可能に。
- Realtime API:音声処理に特化したモデルを提供。ただし、音声入出力のコストはテキストの約20倍と高額。
(中略)
3. DeepSeekの台頭:オープンソースと圧倒的なコスト効率
■DeepSeek-V3とR1シリーズ
- V3:6710億パラメータの大規模モデル。Mixture-of-Experts(MoE)アーキテクチャにより、活性化パラメータを370億に抑えつつ、GPT-4oを上回る性能を実現。数学タスク(GSM8K)で89.3%、プログラミング(HumanEval)で65.2%のスコアを記録。
- R1:OpenAIのo1と同等の推論能力を3.6%のコストで実現。MITライセンスで公開され、商用利用や改変が可能。
- R1-Zero:強化学習のみで開発された軽量モデル。推論プロセスを完全に可視化するが、出力の可読性に課題あり。
■技術革新と業界への影響
- トレーニングコストの劇的削減:H800 GPUを2ヶ月間使用し、約560万ドルでGPT-4o級のモデルを開発。従来の大規模モデルの学習コスト(数億ドル)を大幅に下回る。
- 日本語対応:多言語処理能力が高く、ローカル環境での利用によりプライバシー保護を実現。ただし、中国発のモデルであることからデータセキュリティへの懸念も指摘される。
4. 業界全体のトレンド
- 推論能力の競争:OpenAIのo3、DeepSeek-R1、GoogleのGemini 2.0が、複雑な問題解決や論理的思考でしのぎを削る。
(後略)
OpneAI o3-miniの回答
■OpenAIの進化
- 新世代モデルの登場:
2024年末から2025年初頭にかけ、OpenAIは従来のo1シリーズに続く新たなモデル群(「o3」シリーズや、よりコンパクトな「o3 Mini」)を発表しました。これらのモデルは、従来モデルよりも「考える」時間(test time compute)を拡充することで、複雑な推論や数学的問題、プログラミング課題への対応能力を向上させています。特にo3 Miniは、小型でありながら高い推論性能を発揮し、従来の大規模モデルと同等の結果をより効率的に実現しています
- 製品・サービスの拡充と競争への対応:
Sam Altman CEOは、DeepSeekなど外部の低コスト・高性能なモデルの登場を受け、今後も迅速なモデル改良と新機能の追加(例:ウェブ検索連携、コード呼び出し機能など)を推進すると表明。これにより、ユーザーにはより高性能かつ多機能なサービス提供を目指しています
(中略)
■DeepSeekの進化
- 低コストで高性能なモデル:
中国発のDeepSeekは、2024年12月にDeepSeek V3をリリースし、続いて2025年初頭に推論能力に特化したR1モデルを公開しました。R1は、数学やプログラミング、論理的推論タスクにおいてOpenAIのo1モデルと同等、あるいはそれ以上の性能を示す一方で、訓練コストは約600万ドルと非常に低コストで実現されています
- オープンソース志向と技術的特徴:
DeepSeekは、モデルのアーキテクチャにおいて、Mixture of Experts(MoE)やMulti-head Latent Attention(MLA)といった先進的な手法を採用。これにより、効率的な推論と計算資源の最適化を実現しています。さらに、オープンウェイトモデルとして開発され、研究者や開発者がモデルを自由に利用・改良できる点も大きな特徴です
■総括
2024年12月以降、生成AI分野では各社とも性能の大幅向上と効率化、低コスト化が進展しています。
- OpenAIは新世代のo3シリーズやo3 Miniで「考える」能力を強化し、ユーザー向け機能も拡充。
(後略)
いずれの用途も、OpneAI o3-miniと遜色ない出力結果がDeepSeek-R1でも得られた。性能面においては十分に使えるレベルといえる。
ただし現時点では、プロンプト送信時にサーバーが「ビジー状態」との表示が出てしまい、出力が行えないケースも多い。日本時間の早朝や深夜、週末などは比較的利用しやすい印象だが、もう少し安定して使えるようになるとありがたい。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「AIに聞くのが面倒」と思う人ほど、ChatGPTデスクトップアプリを活用すべき理由
Mac版のChatGPTデスクトップアプリでは、連携機能を使って他のアプリの画面内容を取得できる。また、ChatGPTアプリ側からの操作だけで起動中の他のアプリのスクリーンショットを取得することも可能だ。これらを活用すると、作業中の画面についてChatGPTに質問するプロセスが格段に楽になる。
ただのフォルダじゃない! ChatGPT「プロジェクト」機能の使いこなし術
2024年末にリリースされたChatGPTの「プロジェクト」は、複数のチャットをまとめて管理できる機能。単なるフォルダではなく、回答をプロジェクト単位でカスタマイズできる機能も備えている点が特徴だ。業務効率の向上に役立つ使い方を紹介する。
AI検索「SearchGPT」リニューアル Google検索いよいよ不要に……?
OpenAIが実施したイベント「12 Days of OpenAI」のなかで、検索機能「ChatGPT search」のアップデートが発表された。10月末に新しい検索機能がリリースされてからわずか1か月半でのスピーディーな改善だが、どこが変わったのだろうか。いよいよGoogle検索は不要になるのだろうか――。
フリー画像がどれもピンとこない……カンタンに使える画像生成AI「Adobe Firefly」活用法
無料素材の使い回しでマンネリ化しているなら、画像生成AIを活用してみよう。ビジネスの場でも利用しやすい画像生成AIツール「Adobe Firefly」を使った画像生成の流れを解説する。
生成AIで文章校正 精度を高めるプロンプトのコツは?
自分の文章をAIに手直ししてもらいたいとき、単に「この文章をチェックしてください」と指示するだけでは、思うような結果が出ないことも多い。今回は、基本的な使い方ながら意外と一筋縄ではいかない文章の校正やチェックについて、プロンプトのコツを紹介する。