推論特化の最新モデル「o3」と「o4-mini」登場 ChatGPT有料版で利用可能 AIの“視覚”も大幅進化
米OpenAIは4月16日(現地時間)、新たなAIモデル「o3」と「o4-mini」を公開した。推論性能に優れたAIモデル「o」シリーズの最新バージョンで、ChatGPTの有料会員向けに同日から提供を開始した。
o3は同社がこれまで一般公開している中で最高性能を持つ「o1」の次世代モデル。優れた推論能力を持ち、特にコーディングや数学、科学、視覚認識などの分野を得意としており、複数のベンチマークで最高記録(SOTA)を達成。外部専門家からは「難しいタスクにおいてo1よりも重大なエラーが20%少なく、特にプログラミングやビジネス、コンサルティング、創造的なアイデア創出などの分野で優れている」と評価を受けた。
o4-miniはo3よりも推論能力は劣るものの、応答速度やコスト効率に優れた小型のAIモデル。コーディングや数学、視覚タスクを得意分野としており、前モデルの「o3-mini」よりも利用上限が大幅に増加。大量の問い合わせやリアルタイム応答により適したAIモデルとなった。
他にもo3とo4-miniの両モデルで、コンテキストウィンドウ(AIモデルが応答を生成できるテキストの量)が20万まで増加している。
またo3とo4-miniでは、ChatGPT内の全ツールを組み合わせて、AIエージェントのように使うことが可能になった。主にWeb検索やアップロード済みファイルの利用、Pythonでのデータ分析、画像生成などが対応。これによりChatGPTは、ユーザーのリクエストに応えるために適切な出力形式を推論するようになったという。
ChatGPTの有料プランである「Plus」「Pro」「Team」ユーザーは、同日からこれらのAIモデルを利用可能。o1とo3-mini、o3-mini-highに代わって、o3とo4-mini、o4-mini-highがモデル選択の画面で選べるようになる。「Enterprise」と「Edu」ユーザーは24日からアクセス可能になり、無料ユーザーはo4-miniのみ試用できる。
また有料ユーザー向けに提供しているハイエンドモデル「o1-pro」についても、次世代モデル「o3-pro」を今後数週間以内に提供するという。
o3とo4-miniは“視覚”も進化 推論に画像を取り入れる
o3とo4-miniの大きな特徴には、視覚認識機能の進化がある。OpenAIによると「初めて、画像を見るだけでなく、思考の連鎖の中に画像を取り入れて考えることができるようになった」という。
o3とo4-miniは回答を出力するまでに長い思考時間を持つが、その思考の中に画像を取り入れるようになった。これはユーザーがアップロードした画像をツールを使って変換することで実現しており、画像のトリミングや拡大、回転などの画像処理の他、画像から画像の抽出もできる。
「高度な推論機能とWeb検索、画像操作などのツールをシームレスに組み合わせることで、不完全な写真からでも洞察を導き出せる。例えば、経済学の問題集の写真をアップロードすれば、段階的な説明を受けたり、開発エラーのスクリーンショットを共有すれば、迅速に根本原因分析を入手できる」(OpenAI)
また、画像で考えるようになったことで、ChatGPTのインタラクションも改善。テキストが逆さまの場合や、画像がぼけやている場合、画質が低い場合でも、AIは視覚的な推論によってその物体を認識し、質問に答えることなどが可能という。
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
2
え、21日で37テラも? 高性能SSDを食いつぶす「あのAIツール」にご用心:886th Lap
-
3
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
4
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
5
Anthropicの営業はAIエージェントをこう使う! 日本法人メンバーが明かす手の内
-
6
復活した「Fable 5」 米政府からのオーダーに対して、Anthropicはどう対策したのか
-
7
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
8
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
9
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
10
光接続の標準規格「OCI」対応シリコン、GFが27年に投入
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR