OpenAIは次世代モデル「GPT-5」を発表した。高速応答用モデルと深い推論に特化したモデル、最適なモデルを自動選択するリアルタイムルーターで構成される。短時間ではあるが、IT記者が使用した所感をお届けする。
この記事は会員限定です。会員登録すると全てご覧いただけます。
OpenAIは8月7日(現地時間)、同社史上「最も賢く、最速で、最も役立つ」と位置付ける次世代モデル「GPT-5」を発表した。高速応答用モデルと深い推論に特化したモデル(GPT-5 thinking)、最適なモデルを自動選択するリアルタイムルーターで構成する“統合型”アーキテクチャが特徴だ。
「ChatGPT」のデフォルトモデルとして発表同日から順次提供を開始し、Plus/Pro/Team/無料プランユーザーに提供、Enterprise/Eduプランユーザーには1週間後に展開する。利用上限到達時はコンパクトな「GPT-5 mini」に自動で切り替わる。
筆者の環境(Proプラン)でGPT-5を使ってみた所感をお届けする。結論から言えば、長期的に使ってみないと評価しにくいモデルだ。数時間しか使用していないので、あくまで参考程度に受け取ってほしい。
まず、筆者がこれまでにChatGPTでよく実施していた情報収集をお願いしてみる。その際に使っていたプロンプトは以下の通りだ。
昨日発表されたAI関連の重要ニュースをピックアップして、出典のURLと共に挙げてください。日本企業におけるAI活用に役立つニュースを優先してください。
従来の推論モデル「o3」はこのプロンプトで5件程度のニュースを、ある程度信頼できるソース(大手ニュースメディアやITベンダーのプレスリリースなど)から引用してくれた。
しかし、GPT-5に同じプロンプトを投げてみると、ものすごい速さで2件のみ挙げたのだ。あまりの速さに驚いたが、今回は時間をかけてでも5件以上は挙げてほしかったので、「5件以上」という制約をかけた上で再度実施してみると、ブログ系のメディアから5件のニュースを引用してきた。恐らく、「5件以上」というプロンプトでは深い推論には至らず、情報量の多いソースからニュースを引っ張ってきたのだと思われる(そもそも「GPT-5発表」のニュースを挙げていないので、リアルタイムWeb検索をしていないと思われる)。
「最適なモデルを自動選択」するのが同モデルの強みだが、高速応答モードがデフォルトで、明示的な指示があった場合のみ深い推論を実行するようだ。そこで、モデルを「GPT-5 Thinking」(強制的に推論させるモード)に切り替えて、同じプロンプトを投げてみると、GPT-5の発表を含め、8件のニュースを信頼できるソースから引用してくれた。
その他、一般的な知識を問う質問や計算問題を投げてみたが、こちらは高速応答モードのままで特に間違えることもなく回答してくれた。ただ、ハルシネーションの度合いに関しては、今後長期的に利用してマニアックかつ最新の情報を問う質問をしてから評価したい。
GPT-5のベンチマークスコアを見ると、o3や「4o」などの従来モデルを上回る性能を示している。特に法律や物流、営業、エンジニアリングなど「経済的価値の高いナレッジワーク」における性能が向上しており、あくまでOpenAI社内のベンチマークテストとはいえ、産業界への影響が期待できそうだ。ただ筆者個人としては、上記のような短期的な利用で目に見えるような進化を感じられるわけではなかった。
一方で、注目すべきはハルシネーションの低減だ。OpenAIによると4oと比べて約20%、thinkingモードではo3と比べて約70%事実誤認が少ないという。
また、実行不可能だったり前提条件が不足していたりするタスクでは、その旨を正直にユーザーに伝えるようになったという。さらに4oにおいて問題となっていた過度な迎合表現が抑えられている。ユーザーの指示に対して冷静に対応するようになった印象だ。
GPT-5はChatGPTでの提供と合わせてAPIや各種AIコードエディタでも提供されている。APIは安価な「mini」「nano」モデルも用意されているが、GPT-5 miniは「GPT-4o mini」よりも高額になっているため、企業向けのサービスで利用が進むかどうかは未知数だ。
筆者環境の「Cursor」でもGPT-5が使用できることが確認でき、「リリース週は無料で使用できる」と注釈があった。有料化後、どの程度クレジットを使用するかが開発者における利用促進のカギとなるだろう。
今回の発表で特筆すべきなのは「ChatGPTの性能が上がった」ことではなく「複雑化していたOpenAIのモデル群が整理され、比較的安全かつ高性能なモデルが無料プランでも使えるようになった」ことだ。
利用者数が7億人を突破する見込みのChatGPT。既存産業への影響は未知数だが、生成AIの利用拡大や信頼性向上には寄与しそうだ。
OpenAI「gpt-oss」発表 “o4-mini級”の性能をオープンに
“デキる”会社員はオフィスでこう過ごす イトーキと松尾研、AIによる生産性評価モデル構築を目指す
「セキュリティ後回しで生成AI導入」の末路 アクセンチュアが警告Copyright © ITmedia, Inc. All Rights Reserved.