ITmedia NEWS > 製品動向 >
ITmedia AI+ AI活用のいまが分かる

「GPT-4.5」正式発表 “深い思考”をしなくても世界理解と直感力で性能向上【追記完了】

» 2025年02月28日 05時01分 公開
[井上輝一ITmedia]

 米OpenAIは2月28日(日本時間)、生成AIチャットの「ChatGPT」に搭載するAIモデルとして「GPT-4.5」を発表した。同社の「o1」や「o3-mini」などの長く考えて性能を向上する方式は取っておらず、教師なし学習により「GPT-4o」よりも高性能になったという。月額200ドルのProユーザーは同日から利用可能。PlusやTeam、Enterpriseなどの有料プランユーザーには1週間ほどで提供する。

(関連記事:【詳報】GPT-4.5の特徴は? 教師なし学習で性能向上、OpenAI史上最大サイズ、API利用は超高価

 GPT-4.5では、学習時の計算リソースとデータ拡張、アーキテクチャと最適化の革新により、長く考えず方式でなくても性能を向上させることができたという。その結果、幅広い知識と深い世界理解を備えたモデルとなり、ハルシネーション(幻覚、それらしいうそ)の低減や幅広いトピックにおける信頼性も向上したとしている。

 GPT-4.5を発表したライブ配信では、o1との比較もライブで実施。o1が返答するのに時間をかけるのに対し、GPT-4.5はすぐに返事を返した。登壇した同社の研究者は回答の内容について「o1も役立つ。多くの情報を出力していて、(質問の)話題を初めて学ぶなら知りたいことがたくさんある」としつつ、「GPT-4.5の答えは流れがずっと自然。アイデアを通じて私の思考をガイドしてくれる」と評した。

GPT-4.5とo1の回答の違い 出典:OpenAIのライブ配信(以下同様)

 各種ベンチマークテストでは、全てのスコアでGPT-4oを超えた一方で、o3-miniには一歩及ばないという結果に。これについて同社の研究者は「o3-miniは答える前に考えることができる。GPT-4.5は答える前に考えることができなくても、このような高いスコアを獲得できるのは非常に印象的」と話した。そんな中でもコーディング性能を測るベンチマーク2種のうちの片方(SWE-Lancer Diamond)では、o3-miniの10.8%を超える32.6%の性能を見せている。

 また、OpenAIは今回のGPT-4.5を「研究プレビュー」と位置付けている。OpenAIもこのモデルを実験している段階であり「教師なし学習で出現する能力をユーザーと一緒に探索したい」とした。

LLM(大規模言語モデル)の事実性を単純ながら難易度の高い知識問題で測定。このテストではo1やo3-miniも抑えてGPT-4.5がトップに
人間のテスターがGPT-4.5とGPT-4oを比較し評価したところ、3種全てでGPT-4.5が上回った
歴代AIモデルに「なぜ海はしょっぱいのか」と聞いた結果。2018年のGPT-1の回答は「ワードサラダ」だった
2019年のGPT-2になり、間違ってはいるが改善
2023年のGPT-3.5 Turboで初めて正解に。しかし説明はなく不要な詳細がある
GPT-4 Turboは良い答えに。ただし事実をリストアップしているようでもある
GPT-4.5は明確で簡潔でまとまりのある答えに
GPT-4.5とGPT-4o、o3-miniのベンチマーク比較

(追記完了)

Copyright © ITmedia, Inc. All Rights Reserved.
本記事は制作段階でChatGPT等の生成系AIサービスを利用していますが、文責は編集部に帰属します。

アイティメディアからのお知らせ

あなたにおすすめの記事PR