米OpenAIは7月18日(現地時間)、軽量で安価なマルチモーダルAIモデル「GPT-4o mini」を発表した。アプリ開発者向けのAPIは従来のハイエンドモデルより1桁安く、GPT-3.5 Turboよりも高性能としている。
価格は入力トークン100万当たり15セント、出力トークン100万当たり60セント。100万トークンは標準的な英語の書籍の約2500ページに相当する。
ChatGPTのFree、Plus、Teamプランのユーザーは同日からGPT-3.5 Turboの代わりにGPT-4o miniを使えるようになっている。Enterpriseプランでも“来週から”アクセスできるようになる見込み。
名称通り、5月に発表した「GPT-4o」の小型モデルだ。「o」はomni(全方位)を意味し、マルチモーダルを表している。APIでテキストと画像をサポートしており、将来的には動画と音声の入出力もサポートする計画だ。
コンテキストウィンドウは12万8000トークンで、リクエストごとの出力トークンは最大1万6000まで。2023年10月までの知識を持つ。
GPT-4o miniの開発テストに参加した財務オートメーションサービスの米Rampは、経費を手入力する代わりにレシートの画像をアップロードすることで経費データを抽出し、入力する機能を開発した。
OpenAIが示すベンチマーク結果によると、推論でも数学とコーディング能力でもマルチモーダル推論でも、競合する米Googleと米Ahthropicの小型モデル(Gemini FlashとClaude Haiku)を上回っている。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR