月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた(1/2 ページ)
米OpenAIが12月5日(現地時間)に発表した、ChatGPTの新プラン「ChatGPT Pro」。目玉は、最高性能のAIモデル「OpenAI o1」でより高度な思考を行って難問に対して優れた回答を提供するという「o1 Pro mode」だ。一方、月額200ドル(1ドル150円換算で約3万円)という価格体系も話題に。果たしてその値段に見合う価値はあるのか──試しに、過去のGPTシリーズや他の大規模言語モデルが引っ掛かりがちだった問題を出して、確かめてみた。
解けるか、“おっぱお問題”
GPT-4でもたまに間違えていた「いっぱいの“い”を“お”に変えて」という問題。o1 Pro modeは引っ掛からず回答できた。
「9.11」と「9.9」、大きいのは?
「9.11」と「9.9」どちらが大きいか、というのも、過去のモデルがよく間違えた問題だ。Pro modeでない「o1」も、以下のように正しく答えられない。
しかしo1 Pro modeは正答。「意外にも9.9の方が大きい」という回答がやや不安げだが、最後には自信を持って答えてくれている。
いま、あなたは何位でしょう?
「徒競走をしています。あなたは3位の人を抜かしました。いま、あなたは何位でしょう?」──Claude 3 Haikuなどだといまだに間違える問題だが、o1 Pro modeは正答できた。しかも間違えがちな部分までしっかり指摘してくれた。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「ChatGPTのコネクタでつながるし、M365 Copilotいらなくない?」→有識者3人に聞いてみた 知らないと損するコンテキスト管理「Work IQ」の仕組み
-
2
データセンター建設に足りないのは「発電」ではなく「送電」 AI需要で電力消費26%増、Gartner予想
-
3
Amazon、Anthropicの最新AIについて懸念を伝えていた 米政権による停止命令に先立ち 関係筋
-
4
「Claude Fable 5」「Mythos 5」全面停止 米政府の指令により Anthropicは早期復旧を宣言
-
5
中国が人型ロボット開発競争をリードする「納得の理由」 日本に残された逆転シナリオは?
-
6
AIに丸投げ……で失敗 漫画「1週間後に生成AIで恥をかく新入社員」【残り1日】
-
7
個人向け「Gemini」値下げ 「Google AI Plus」が月額1200円→725円に ストレージも倍増
-
8
トヨタが抜かれる日――キオクシア首位奪取、2005年「時価総額トップ10」を振り返る
-
9
「今、Codexのレート制限を解除したい」を解決? “付与したリセット権の貯蓄”可能に 有料ユーザー向け
-
10
“ChatGPTアダルトモード”実現なるか──適切なエロ&グロコンテンツの生成方法を模索中とOpenAI
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR