OpenAI、軽量で安価なマルチモーダルAI「GPT-4o mini」リリース
OpenAIは、軽量で安価なマルチモーダルAIR「GPT-4o mini」をリリースした。アプリ開発者向けのAPIは従来のハイエンドモデルより1桁安く、GPT-3.5 Turboよりも高性能としている。
米OpenAIは7月18日(現地時間)、軽量で安価なマルチモーダルAIモデル「GPT-4o mini」を発表した。アプリ開発者向けのAPIは従来のハイエンドモデルより1桁安く、GPT-3.5 Turboよりも高性能としている。
価格は入力トークン100万当たり15セント、出力トークン100万当たり60セント。100万トークンは標準的な英語の書籍の約2500ページに相当する。
ChatGPTのFree、Plus、Teamプランのユーザーは同日からGPT-3.5 Turboの代わりにGPT-4o miniを使えるようになっている。Enterpriseプランでも“来週から”アクセスできるようになる見込み。
名称通り、5月に発表した「GPT-4o」の小型モデルだ。「o」はomni(全方位)を意味し、マルチモーダルを表している。APIでテキストと画像をサポートしており、将来的には動画と音声の入出力もサポートする計画だ。
コンテキストウィンドウは12万8000トークンで、リクエストごとの出力トークンは最大1万6000まで。2023年10月までの知識を持つ。
GPT-4o miniの開発テストに参加した財務オートメーションサービスの米Rampは、経費を手入力する代わりにレシートの画像をアップロードすることで経費データを抽出し、入力する機能を開発した。
OpenAIが示すベンチマーク結果によると、推論でも数学とコーディング能力でもマルチモーダル推論でも、競合する米Googleと米Ahthropicの小型モデル(Gemini FlashとClaude Haiku)を上回っている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
- GPT-4o、Azureの生成AIサービスでも体験可能に
5月13日(米国時間)に米OpenAIが発表した、生成AI「GPT」シリーズの新たなモデル「GPT-4o」。クラウドサービス「Microsoft Azure」を使い、API経由でGPTシリーズにアクセスできる「Azure OpenAI Service」でも、すでに試用可能となっている。 - 「GPT-4o」はなんて読む? 女性の声はスカーレット・ヨハンソン(her)似?
OpenAIが発表した新たなマルチモーダル生成AIモデル「GPT-4o」。モデル名の読み方やその由来を紹介する。また、このモデルの音声とアルトマンCEOが好きだという映画「her」の声を聴き比べてみよう。 - 「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
米OpenAIが、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 - OpenAI、GPT-4 APIの一般提供開始
OpenAIは、「GPT-4 API」の一般提供を開始すると発表した。また、「Completions API」を使う古いモデルの一部を半年以内に廃止する計画も発表した。