月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた(1/2 ページ)

 米OpenAIが12月5日(現地時間)に発表した、ChatGPTの新プラン「ChatGPT Pro」。目玉は、最高性能のAIモデル「OpenAI o1」でより高度な思考を行って難問に対して優れた回答を提供するという「o1 Pro mode」だ。一方、月額200ドル(1ドル150円換算で約3万円)という価格体系も話題に。果たしてその値段に見合う価値はあるのか──試しに、過去のGPTシリーズや他の大規模言語モデルが引っ掛かりがちだった問題を出して、確かめてみた。

解けるか、“おっぱお問題”

 GPT-4でもたまに間違えていた「いっぱいの“い”を“お”に変えて」という問題。o1 Pro modeは引っ掛からず回答できた。

「9.11」と「9.9」、大きいのは?

 「9.11」と「9.9」どちらが大きいか、というのも、過去のモデルがよく間違えた問題だ。Pro modeでない「o1」も、以下のように正しく答えられない。

 しかしo1 Pro modeは正答。「意外にも9.9の方が大きい」という回答がやや不安げだが、最後には自信を持って答えてくれている。

いま、あなたは何位でしょう?

 「徒競走をしています。あなたは3位の人を抜かしました。いま、あなたは何位でしょう?」──Claude 3 Haikuなどだといまだに間違える問題だが、o1 Pro modeは正答できた。しかも間違えがちな部分までしっかり指摘してくれた。

印刷する
SNSでシェア

この記事の著者

吉川大貴

吉川大貴

関連記事

こんなメディアも見られています

ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。

メールマガジンを配信中
メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

よく見られているカテゴリー

アクセスランキング

  1. 1
  2. 2
  3. 3
  4. 4
  5. 5
  6. 6
  7. 7
  8. 8
  9. 9
  10. 10

SpecialPR

ITmedia AI+ SNS

X @itm_aiplusをフォロー

インフォメーション

ITmedia AI+をフォロー

あなたにおすすめの記事PR