月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた(1/2 ページ)
米OpenAIが12月5日(現地時間)に発表した、ChatGPTの新プラン「ChatGPT Pro」。目玉は、最高性能のAIモデル「OpenAI o1」でより高度な思考を行って難問に対して優れた回答を提供するという「o1 Pro mode」だ。一方、月額200ドル(1ドル150円換算で約3万円)という価格体系も話題に。果たしてその値段に見合う価値はあるのか──試しに、過去のGPTシリーズや他の大規模言語モデルが引っ掛かりがちだった問題を出して、確かめてみた。
解けるか、“おっぱお問題”
GPT-4でもたまに間違えていた「いっぱいの“い”を“お”に変えて」という問題。o1 Pro modeは引っ掛からず回答できた。
「9.11」と「9.9」、大きいのは?
「9.11」と「9.9」どちらが大きいか、というのも、過去のモデルがよく間違えた問題だ。Pro modeでない「o1」も、以下のように正しく答えられない。
しかしo1 Pro modeは正答。「意外にも9.9の方が大きい」という回答がやや不安げだが、最後には自信を持って答えてくれている。
いま、あなたは何位でしょう?
「徒競走をしています。あなたは3位の人を抜かしました。いま、あなたは何位でしょう?」──Claude 3 Haikuなどだといまだに間違える問題だが、o1 Pro modeは正答できた。しかも間違えがちな部分までしっかり指摘してくれた。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
ChatGPT vs. Google検索──どっちで調べるのが学習効果が高い? 8日間の実験で検証した研究
-
2
「Claude Fable 5」「Mythos 5」全面停止 米政府の指令により Anthropicは早期復旧を宣言
-
3
Amazon、Anthropicの最新AIについて懸念を伝えていた 米政権による停止命令に先立ち 関係筋
-
4
Sakana AI、初の商用プロダクト「Marlin」リリース その実力は?【出力レポート全文掲載】
-
5
最新AI「Fable 5」でYouTube動画作ってみた 想像以上の出来に驚愕、ただし大きな弱点も
-
6
「日本がいないと成り立たない」世界へ、フィジカルAIが導く独自の交渉力
-
7
トヨタが抜かれる日――キオクシア首位奪取、2005年「時価総額トップ10」を振り返る
-
8
“AIが電力使いすぎ問題” 「電力不足」懸念で、発電能力より深いボトルネックとは
-
9
「猫も杓子もAI」な現状は今後も続くのか?【後編】AI時代に必要な3つの検討事項
-
10
AI・ロボット人材は約340万人不足 労働市場のスキル需給、AIでどう可視化する?
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR