米OpenAIは9月12日(現地時間)、新たなAIモデル「o1」を発表した。ユーザーの入力に対し時間をかけて考え返答することで、従来よりも複雑なタスクを正しく解けるようになるという。同日から有料のChatGPT Plus、Teamユーザーはプレビュー版が利用可能になる。
o1では従来のモデルのようにユーザーの入力に対して即答せず、考える時間を設けるようになったことで思考プロセスを洗練している。国際数学オリンピックの予備試験で比較したところ、GPT-4oは13%しか正しく解けなかったがo1は83%正答したという。同社によるベンチマークテストでは、o1は物理学、数学、生物学で博士課程の学生と同等のパフォーマンスを発揮したとしている。
安全性においても、ユーザーが意図的にセーフティーを破ろうとする「ジェイルブレイク」のテストに対し、GPT-4oは100点満点中22点であったのに対し、o1-previewは84点を獲得したという。
複雑なタスクで大きな進歩があり、AIが可能とすることの新たなレベルを表しているとして、これまでの「GPT-○」からナンバリングをリセットしてOpenAI o1とした。
ただし、初期のモデルとなるためWeb検索やファイル・画像アップロードには未対応だ。
o1-previewと同時に、より高速で80%安価なo1-miniも提供する。推論は必要だが広範な世界の知識は必要ない分野で性能を発揮するとしている。
ChatGPT PlusとTeamユーザーは12日から順次利用可能となり、EnterpriseとEduユーザーは来週から利用可能となる。ChatGPTのUIから利用する場合、o1-previewは1週間に30メッセージまで、o1-miniは1週間に50メッセージまでの制限がある。将来的には無料のChatGPTユーザーにもo1-miniを提供する。
開発者向けのAPIでも提供を始める。すでにAPIで1000ドル以上利用している「ティア5」分類の開発者へまずは提供。レートリミットは20RPM(1分当たり20リクエスト)。価格はo1-previewが100万入力トークン当たり15ドル、100万出力トークン当たり60ドル。o1-miniが100万入力トークン当たり3ドル、100万出力トークン当たり12ドル。
なお、APIの説明では、o1モデルの学習した知識自体はGPT-4oと同じく2023年10月までのものである他、一度に処理可能なトークン(コンテキストウィンドウ)は12万8000トークン、最大の出力トークンは3万2768トークンと記載されている。コンテキストウィンドウはGPT-4oと同等で、最大出力トークンはGPT-4oの2倍となる。
Copyright © ITmedia, Inc. All Rights Reserved.