次世代AI「GPT-5」の実力は? ChatGPTで使ってみた 旧モデル「GPT-4o」「o3」と使用感を比較(2/3 ページ)
米OpenAIの次世代AIモデル「GPT-5」。実際の使用感を確かめてみた。
「ゲーム作って」と入力すると……
GPT-5の特長の一つがコーディング性能だ。OpenAIは「これまでで最も高性能なコーディングモデル」として、「たった1つのプロンプトで、美しいレスポンシブなWebサイトやアプリ、ゲームなどを直感的でデザイン性に富んだ形でアイデアを現実にできる」とアピールしている。
試しに「ゲーム作って」と入力してみると、約7秒の思考時間で、画面上部から落ちてくる障害物を避ける「スター・ドッジ」というタイトルのゲームのコードを出力した。「矢印キー/WASDやドラッグで移動、スペースで一時停止できます」などと操作方法も同時に出力。コードをChatGPT上で実行できる「キャンバス」で動かしてみたところ、夜空を背景に、画面上部から落ちてくる星を避けるゲームが表示され、プレイもスムーズにできた。
さらに「弾を撃てるようにして」と機能追加を依頼してみると、約50秒ほどで実装してくれた。アップデート後もUIに乱れはなく、プレイでも不自然な挙動はなかった。
GPT-4oにも同様に「ゲーム作って」と入力すると「どんなゲームを作りたいですか? ざっくりでもいいので、以下の中から教えていただけるとスムーズです」とまず概要の設定を求められた。「シューティングゲーム」と答えると、数秒で、色の異なるブロックを表示するだけのシューティングゲームを出力。問題なくプレイできた。
o3にもゲーム制作を依頼したところ、1度の指示で約35秒かけてシューティングゲームを出力した。プレイに不具合はなかった一方、デザイン面のレベルは4oの出力したゲームとあまり変わらず、スター・ドッジに比べると簡素な印象を受けた。
米OpenAIによると、GPT-5はコーディング性能を測るベンチマーク「SWE-bench」で、74.9%を記録し、過去モデルであるGPT-4oの30.8%や、o3の69.1%を超えた。また、UIの構築にも優れており、社内テストでは、フロントエンドの開発でo3を70%上回ったという。
特にUI周りの進歩については、実際に出力できたものと一致するように思われる。一言のプロンプトで、ある程度見栄え良くアイデアが具現化できるため、何かしらのプロトタイプを作成する際などには便利そうだ。
Copyright © ITmedia, Inc. All Rights Reserved.



