米OpenAIは7月18日(現地時間)、軽量で安価なマルチモーダルAIモデル「GPT-4o mini」を発表した。アプリ開発者向けのAPIは従来のハイエンドモデルより1桁安く、GPT-3.5 Turboよりも高性能としている。
価格は入力トークン100万当たり15セント、出力トークン100万当たり60セント。100万トークンは標準的な英語の書籍の約2500ページに相当する。
ChatGPTのFree、Plus、Teamプランのユーザーは同日からGPT-3.5 Turboの代わりにGPT-4o miniを使えるようになっている。Enterpriseプランでも“来週から”アクセスできるようになる見込み。
名称通り、5月に発表した「GPT-4o」の小型モデルだ。「o」はomni(全方位)を意味し、マルチモーダルを表している。APIでテキストと画像をサポートしており、将来的には動画と音声の入出力もサポートする計画だ。
コンテキストウィンドウは12万8000トークンで、リクエストごとの出力トークンは最大1万6000まで。2023年10月までの知識を持つ。
GPT-4o miniの開発テストに参加した財務オートメーションサービスの米Rampは、経費を手入力する代わりにレシートの画像をアップロードすることで経費データを抽出し、入力する機能を開発した。
OpenAIが示すベンチマーク結果によると、推論でも数学とコーディング能力でもマルチモーダル推論でも、競合する米Googleと米Ahthropicの小型モデル(Gemini FlashとClaude Haiku)を上回っている。
GPT-4o、Azureの生成AIサービスでも体験可能に
「GPT-4o」はなんて読む? 女性の声はスカーレット・ヨハンソン(her)似?
「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
OpenAI、GPT-4 APIの一般提供開始Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR