OpenAIはGPT-5.2を「最も強力なビジョンモデル」と話している。公称だが、グラフやスクリーンショットの理解精度が約2倍に向上したという。これまでも「写真を撮影してアップロードした上で、質問を行う」といったリクエストは受け付けていたが、その細かさや理解の深さが大幅に進んだということだ。

　例えばPCのマザーボード写真をアップロードすると、配置されているチップを特定し、どのような配線になっているかまでを類推できる。比較的低解像度な画像であったとしても主要部品を網羅し、それを“言語”で説明してくれるのだ。

　実際に手元でもネット上のマザーボード写真を使って同様の認識を行ってみたが、驚くほど画像を文章に翻訳する能力の高さを感じる。

あるメーカーのマザーボードの画像を取り込んで説明を求めたところ、思った以上に正確に説明してくれた（クリックで拡大）

　しかし、一方でGPT-5.2では画像生成に関して全く手が付けられていない。GoogleがNanobanana Proで世間を驚かせたのとは対照的だ。

　ただ、OpenAIは新しい画像生成モデルを近いうちに提供することを示唆している。アプリケーション部門CEOのフィジー・シモ氏は「画像生成に関する発表はない」と話し、将来の刷新を示唆したものの、現時点では画像の“理解”に重きを置いている格好だ。

今回のGPT-5.2では、画像生成に関するアップデートはない。今後のアップデートが示唆されているので、続報を待ちたい

本当に使えるAIエージェントに向けた一歩

　ところで「AIエージェント時代」と言われながらも、その実務がなかなか前へと進まないのは、生成される文書の質も問題ではあったが、それ以上にエージェントが進める“手順”が正しく連結されない場合があることにある。

　そんなエージェントのテストを行うベンチマークが「Tau2-bench」だが、このベンチマークが設定している「コミュニケーション能力」を評価するテストでにおいて、GPT-5.2 Thinkingが98.7％という完璧に近い成績を収めたという。

　このテストでは、複数のツールを使い分けながら、問い合わせを段階的に解決する能力を測定する。例えば航空会社の地上係員なら経験しうる「フライト遅延→乗り継ぎミス→荷物紛失→ホテル手配→特別座席要求」という混沌（こんとん）としたトラブルについて、GPT-5.2では最後まで整合性を保ってプロセスをやり切ることができるようになった。

　このシチュエーション検証は、初期テスターとして参加している企業が、実際の現場導入において実践していたものだ。GPT-5.2のテストに参加していたTriple Whale（※1）のAJ・オーバックCEOは「（従来は）多くのエージェントを数珠つなぎに連結して問題解決を行っていたが、想定外のことで破綻することが多かった。しかしGPT-5.2は20以上のツールを自律的に使いこなすメガエージェントで、異なるツール間の破綻がない」と絶賛している。

（※1）電子商取引における自動データ分析ツールを提供する米国スタートアップ

　複数のエージェントを連携させるよりも、整合性の取れた単一のエージェントが単独実行する方がうまくいくのは、「1人のすご腕さん」に任せた方が破綻せずに問題解決できる現実社会の例にも通じる。

　リアルな人間はストレスや疲労を抱えるが、AIエージェントにはそうした問題はない。

GPT-5.2ではエージェントとして処理を破綻させないことに重きを置いている

GPT-5.2は「実用性」「安全性」を重視

AppleがGoogleの「Gemini」とクラウド技術を採用／Googleの動画生成AIモデルが「Veo 3.1」に　縦型動画にも対応
うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、1月11日週を中心に公開された主なニュースを一気にチェックしましょう！
Googleから「Gemini 3」登場／xAIが新型AIモデル「Grok 4.1」を公開
うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、11月16日週を中心に公開された主なニュースを一気にチェックしましょう！
MicrosoftとOpenAIが「拘束力のない覚書」を締結　“次のパートナーシップ”の最終合意に向けた取り組みを推進
MicrosoftとOpenAIが、次のパートナーシップの最終合意に向けて「拘束力のない覚書」を締結した。これに併せて、OpenAIが「非営利組織」と「営利企業」に関する声明を発表。
日本での展開に注力するOpenAI――「AIエージェントの1年が始まる」とライトキャップCOOが語る理由
OpenAIの商業部門において製品戦略などを担当するブラッド・ライトキャップCOO（最高執行責任者）が、日本法人設立1周年に当たってインタビューに応じた。同社が提唱する「エージェントの1年」たる2025年がどのような年になるのか、聞いてみよう。
“暖かみのある会話”を実現――OpenAIの新言語モデル「GPT-4.5」は何が変わったのか？
OpenAIの新言語モデル「GPT-4.5」のリサーチプレビュー版をリリースした。従来の「GPT-4」と何が変わったのか、実際に試しつつ解説する。【更新】

前のページへ 1|2|3|4|5|6 次のページへ

SpecialPR

アクセストップ10

2026年07月06日更新

マウス機能も一台に集約できる「Ewin ミニキーボード」がセールで20％オフの2544円に（2026年07月01日）
Mini-ITXよりmicroATXが旬？　人気集まるLian-Li「B4-mATX」と、デュアル10GbEと128GBメモリ搭載で69万円超えミニPCに注目（2026年07月04日）
約79万円の「RTX 5090」即完売の裏で精密工具の意外な需要も　アキバで進む二極化の最新事情（2026年07月06日）
米商務省の輸出規制解除を受け、Anthropicの「Claude Fable 5」が復活／Googleが画像生成AI「Nano Banana 2 Lite」を発表（2026年07月05日）
欲しい新型PCがまさかの70万円超!?　買い換えを断念した筆者が「ThinkPadの保証再延長」で65万円くらい浮かせた話（2026年07月03日）
視界に情報が浮かぶ「Rokid AIスマートグラス」を試す　スマホを超えるトキメキあり？（2026年06月30日）
レノボ、スピーカー9基を備えた12.1型Androidタブレット「Lenovo Tab Plus Gen 2」（2026年06月30日）
Macで外付けGPUが使える「TinyGPU」をRTX 5060 Tiで検証　実用性と浮き彫りになった課題（2026年06月29日）
エプソンが提案する“自作推し活”の最前線――プロジェクションマッピングから「エモい」レシートプリントまで（2026年07月03日）
完全ワイヤレスなのに有線クラスの低遅延を実現！　Razerのワイヤレスイヤフォン「Hammerhead V3 HyperSpeed」を試す（2026年07月06日）

ランキングトップ30

最新トピックスPR

過去記事カレンダー

2026年

2025年

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

Feed Back

利用規約

ITmediaはアイティメディア株式会社の登録商標です。

危機の演出？ それとも本当の“焦り”？ OpenAI「コード・レッド」の内実：本田雅一のクロスオーバーデジタル（5/6 ページ）

GPT-5.2とGemini 3は「得意分野」が異なる