OpenAIが2月27日(米国太平洋時間)、新たなAIモデル「GPT-4.5」をリリースした。同社のサム・アルトマンCEOが最近存在をほのめかしていた新しいLLM(大規模言語モデル)である。
これまで提供されていた「GPT-4」世代のLLMと比較すると、より深い知識と正確さを備え、複雑な情報を直感的に理解するようになったという。その上で、感情的知性(専門用語で「EQ」と呼ばれる能力値)が高まり、対話する相手の微妙な意図や感情をくみ取り、共感性の高い暖かみのある対応が可能となったともしている。加えて、LLMにおける課題の1つと指摘されている「ハルシネーション」(事実と異なる情報を、あたかも事実のように語る現象)の発生率も大幅に低減できたとのことだ。
彼らは、これらをどのように実現したのだろうか?
【更新:15時】GPT-4oに関する説明を変更しました
この話題に踏み込む前に、GPT-4.5の位置付けやネーミングについて整理しておきたい。
OpenAIはGPT(Generative Pre-trained Transformer)シリーズとは別に「OpenAI o1」なるLLMをリリースしている。o1は推論能力を高めたことが特徴で、登場時は「これがGPT-4の後継モデルだ」との誤解も広まっていた。この誤解は無理もないことだが、実はo1とGPTは進化の方向性が異なる。
GPTの番号は、基本的にAIモデルの世代を表している。番号が大きくなるほど、モデルの規模と性能が向上し、情報処理能力や知識の量も増えている
一方で、o1や「OpenAI o3-mini」といったOpen AI oシリーズは、GPTシリーズとは異なる“軸”を重視して開発された。推論モデルの規模や基本性能はGPT-4世代の技術を流用しているが、oシリーズは推論能力(Reasoning)の向上に特化されており、例えると問題を解く際に、思考の過程を明確に示しながらステップを踏んで解答(回答)を行うようになっている。
これは難しい数学や科学など、特に論理的な考え方が必要な分野で特に力を発揮する。実際に使っているユーザー、特に「ChatGPT Pro」ユーザーはo1 Proモードで、実にきめ細かにステップを踏みながら、多方面に思索を巡らせて結論を出している過程を目撃しているだろう。
GPTは「広範で直感的な知識と自然なコミュニケーション」を目指して、モデルの規模や基本性能を高める進化を志向している。一方で、oシリーズは「論理的で明確な推論能力」を中心に発展している。「o1はGPT-5だ」と誤解するのも、推論の結果がより賢い感じる場面が多いからだが、単に進化の方向性が異なるからこうなっているだけだ。
なお、現時点においてGPT-4.5には推論能力は組み込まれていないとのことだが、GPT-4.5をベースに推論能力を備える派生LLMが登場する可能性はありそうだ。
ホテル予約、買い物──AIがWebサイトを人間のように操作する「Operator」は、AGI(汎用人工知能)への大きなステップだ 実際に試してみた
OpenAIのサム・アルトマンCEOが日本で語った「ChatGPT」の未来像 「あと10年で世界は激変する」の真意
“後出し”の生成AI「Apple Intelligence」がAppleの製品力を高める理由
AIシフトが一層進む2024年 その中で静かに進むデータの“空間化”
「ChatGPT」とは一味違ってさらに便利! Googleとの違いは? Microsoft Bingの「AI検索」を試して分かったことCopyright © ITmedia, Inc. All Rights Reserved.