11月末、海外のネット掲示板「Reddit」で「ChatGPTにDavid Mayerという人物のことについて聞くと、回答できないと返される」という投稿が話題になった。ついでなのでo1 Pro modeにも聞いてみたが、特に問題なく返してくれた。
ただし、同じく「回答できない名前」として挙がっていた「Jonathan Zittrain」「Jonathan Turley」「David Faber」「Guido Scorza」などについては、いずれも回答できなかった。
最後に、兄弟媒体であるITmedia NEWSの読者から「数学オリンピックの問題が解けるか試してほしい」とのリクエストがあったため、挑戦してみる。
お題は、2024年日本数学オリンピック予選の第6問。「AB=AC=5なる二等辺三角形 ABCの辺AB上にAD=3をみたす点Dが、辺BC上(端点を除く)に点Eがある。点Eを通り直線ABに点Bで接する円をωとすると、ωは三角形 ADEの外接円に接した。ωと直線AEの交点のうちEでない方をFとすると、CF=10が成り立った。このとき、辺BCの長さを求めよ。ただし、XYで線分XYの長さを表すものとする」という問いだ。根っから文系の記者は解けないどころか問題の意味を理解することすら怪しい。
ITmedia NEWS読者によればo1では解けなかったという。それでもo1 Pro modeなら……と思ったが、さすがに難しかったらしい。正しい答えは14√65/13だが、o1 Pro modeは「6」と答えた。
もちろん、引っ掛け問題に引っ掛からないことや、数学の難問を解けるかだけがコストに見合う価値ではないだろうが、ひとまずは「GPT-4やo1-miniなどに比べれば、ある程度物事を理解しているような回答ができているのでは?」と思える結果だった。記者はこの他、記事の執筆能力や資料の要約、それを基にした事業・企画の計画能力を確認しているので、追って記事化する。
「GPT-4超え」とうわさのAI「Claude 3」を試す 仕事は任せられる? 若手記者の所感
ChatGPTに“月額3万円”の新有料プラン登場 最高性能の「o1 pro mode」などAIモデル&ツール使い放題
ChatGPTのo1は「ノーベル賞ものだと思う」──孫正義氏による“成年の主張”
OpenAI、クリスマスまで毎日1つ何かを発表へ 「Sora」も?Copyright © ITmedia, Inc. All Rights Reserved.