月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた(2/2 ページ)
月額200ドルの「o1 Pro mode」。値段に見合う価値はあるのか──試しに、過去のGPTシリーズや他の大規模言語モデルが引っ掛かりがちだった問題を出して、確かめてみた。
ChatGPTは答えられない? 「David Mayer」について聞いた
11月末、海外のネット掲示板「Reddit」で「ChatGPTにDavid Mayerという人物のことについて聞くと、回答できないと返される」という投稿が話題になった。ついでなのでo1 Pro modeにも聞いてみたが、特に問題なく返してくれた。
ただし、同じく「回答できない名前」として挙がっていた「Jonathan Zittrain」「Jonathan Turley」「David Faber」「Guido Scorza」などについては、いずれも回答できなかった。
数学オリンピックの問題は解けるか
最後に、兄弟媒体であるITmedia NEWSの読者から「数学オリンピックの問題が解けるか試してほしい」とのリクエストがあったため、挑戦してみる。
お題は、2024年日本数学オリンピック予選の第6問。「AB=AC=5なる二等辺三角形 ABCの辺AB上にAD=3をみたす点Dが、辺BC上(端点を除く)に点Eがある。点Eを通り直線ABに点Bで接する円をωとすると、ωは三角形 ADEの外接円に接した。ωと直線AEの交点のうちEでない方をFとすると、CF=10が成り立った。このとき、辺BCの長さを求めよ。ただし、XYで線分XYの長さを表すものとする」という問いだ。根っから文系の記者は解けないどころか問題の意味を理解することすら怪しい。
ITmedia NEWS読者によればo1では解けなかったという。それでもo1 Pro modeなら……と思ったが、さすがに難しかったらしい。正しい答えは14√65/13だが、o1 Pro modeは「6」と答えた。
もちろん、引っ掛け問題に引っ掛からないことや、数学の難問を解けるかだけがコストに見合う価値ではないだろうが、ひとまずは「GPT-4やo1-miniなどに比べれば、ある程度物事を理解しているような回答ができているのでは?」と思える結果だった。記者はこの他、記事の執筆能力や資料の要約、それを基にした事業・企画の計画能力を確認しているので、追って記事化する。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「GPT-4超え」とうわさのAI「Claude 3」を試す 仕事は任せられる? 若手記者の所感
「ようやく本物の“GPT-4超え”が出てきた」と話題の「Claude 3」。その文章力を見てみる。
ChatGPTに“月額3万円”の新有料プラン登場 最高性能の「o1 pro mode」などAIモデル&ツール使い放題
米OpenAIは、新たな有料サービス「ChatGPT Pro」を発表した。現時点での同社の最高性能のAIモデル「OpenAI o1」を含む全AIモデルやツールを無制限で利用できる。
ChatGPTのo1は「ノーベル賞ものだと思う」──孫正義氏による“成年の主張”
「これ(o1)はノーベル賞ものだと思う」──ソフトバンクグループの孫正義代表取締役社長兼社長による“成年の主張”。
OpenAI、クリスマスまで毎日1つ何かを発表へ 「Sora」も?
OpenAIは、12月5日から12営業日、毎日1件何かを発表するとXにポストした。日本時間の午前3時にライブ配信で発表するとしている。動画生成AI「Sora」の公開も含まれるとみる向きもある。



