結局のところ、どれを使えばいいのか。答えは簡単で、全部使えばいい。幸い、どれも無料で試せる。
ビジネスパーソンにとって大事なのは、各社の得意領域を理解することだ。ベンチマークの総合点では僅差に見えても、実際の使い勝手は驚くほど違う。無料版と有料版でも能力差は大きい。「どれが最強か」ではなく「何に使うか」で選ぶ時代になった。
実は、各サービスの得意分野はかなり違う。会話の自然さならChatGPT、長文の資料作成ならClaude、画像や動画を読み込ませるならGeminiのマルチモーダルが強い。しかもGeminiは、図版の作成や画像編集を大幅に強化している。リアルタイム情報ならGrok、コストを抑えるならDeepSeek。さらに無課金と課金では性能差も大きい。
Gemini3 Proのベンチマークスコア。ほぼすべてでトップを獲得した。特に注目なのが、「ScreeenShot-Pro」ベンチで他にダブルスコア以上を付けていること。これはWeb画面などをうまく認識できるかのテストで、要するにAIがWebをしっかり操作できる時代が近づいた(出典:Google、Gemini3.0のリリース)
各社とも、発表直後は自社のLLMが最強だと主張する。ちなみに筆者は、調べ物はGeminiのDeepResearch、Web検索の代わりにはChatGPT、ライトな会話にはGrokを使う。ただ一番好きなのはClaudeだ。ベンチマークには現れない地頭の良さを感じる(出典:xAI Grok4.1のリリース)そういえば、米国にもオープンウェイトのLLMがあった。MetaのLlamaである。一時は「オープンソースで最高性能」と評価され、累計12億回もダウンロードされた。
しかし、最近はあまり話題にならない。AIのゴッドファーザーの一人、ヤン・ルカン博士も2025年に、Metaを去った。Llamaはどこに行ったのだろう。ひょっとしたら、中国勢に食われたのかもしれない。
金融・Fintechジャーナリスト。2000年よりWebメディア運営に従事し、アイティメディア社にて複数媒体の創刊編集長を務めたほか、ビジネスメディアやねとらぼなどの創刊に携わる。2023年に独立し、ネット証券やネット銀行、仮想通貨業界などのネット金融のほか、Fintech業界の取材を続けている。
住信SBI、ランク制度大改定 勝者と敗者がくっきり分かれるワケ
3万円払っても欲しい? ATMでは使えないのに人気沸騰のメタルカード
なぜMetaだけ株価が急落? AIブームの裏で起きた“静かな分岐点”
三井住友カードのクレカ投信積立で“大改悪” 5大ポイント経済圏の最新動向Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング