マイページ

注目記事を集めた総合ページ

ITの今と未来を見通す

スマホと通信の最新トレンド

進化するPCとデバイスの未来

好きが集まる　比べて選べる

ビジネスと働き方のヒント

AI活用のいまが分かる

企業ITのトレンドを詳説

経営リーダーのコミュニティ

マーケ×ITの今がよく分かる

ITエンジニア向け専門サイト

企業向けIT製品の総合サイト

IT製品の技術・比較・事例

製造業のIT導入・活用を支援

モノづくり技術者専門サイト

エレクトロニクス専門サイト

電子設計の基本と応用

エネルギーの専門メディア

建設×テクノロジーの最前線

ちょっと気になるネットの話題

月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた（1/2 ページ）

公開 2024年12月06日 16時19分

著者

[ITmedia]

印刷する

1
2

　米OpenAIが12月5日（現地時間）に発表した、ChatGPTの新プラン「ChatGPT Pro」。目玉は、最高性能のAIモデル「OpenAI o1」でより高度な思考を行って難問に対して優れた回答を提供するという「o1 Pro mode」だ。一方、月額200ドル（1ドル150円換算で約3万円）という価格体系も話題に。果たしてその値段に見合う価値はあるのか──試しに、過去のGPTシリーズや他の大規模言語モデルが引っ掛かりがちだった問題を出して、確かめてみた。

解けるか、“おっぱお問題”

　GPT-4でもたまに間違えていた「いっぱいの“い”を“お”に変えて」という問題。o1 Pro modeは引っ掛からず回答できた。

「9.11」と「9.9」、大きいのは？

　「9.11」と「9.9」どちらが大きいか、というのも、過去のモデルがよく間違えた問題だ。Pro modeでない「o1」も、以下のように正しく答えられない。

　しかしo1 Pro modeは正答。「意外にも9.9の方が大きい」という回答がやや不安げだが、最後には自信を持って答えてくれている。

いま、あなたは何位でしょう？

　「徒競走をしています。あなたは3位の人を抜かしました。いま、あなたは何位でしょう？」──Claude 3 Haikuなどだといまだに間違える問題だが、o1 Pro modeは正答できた。しかも間違えがちな部分までしっかり指摘してくれた。

次ページへ ChatGPTは答えられない？　「David Mayer」について聞いた

1
2

Copyright © ITmedia, Inc. All Rights Reserved.

印刷する

この記事の著者

吉川大貴

関連記事

SpecialPR

メールマガジンを配信中

メールマガジンを配信中

国内外の業界動向、AIやクラウドなどの最新技術、キャリア情報など今知りたい情報をまとめてお届けします。

いますぐご登録

メールマガジン最新号

Anthropic、最上位「ミュトス」級モデルを一般提供　悪用防ぐ保護機能を備えた「Claude Fable 5」 SBIグループ、米Anthropicと提携　Claudeを全役職員に展開　セキュリティツール「Claude Security」共同検証も

SpecialPR

よく見られているカテゴリー

アクセスランキング

もっと見る

SpecialPR

ITmedia AI＋ SNS

@itm_aiplusをフォロー

インフォメーション

注目情報をチェック

お問い合わせ

広告に関するお問い合わせ

ITmedia AI＋をフォロー

あなたにおすすめの記事PR