「AIは、AGI(汎用人工知能)と呼ぶにふさわしいほど、十分に賢くなったのではないか」「いや、まだAGIではない」――。
双方の意見は対立したままだ。果たしてAIはAGIに達したのだろうか。現状と、今後の方向性を占ってみたい。
まず、現在の基盤モデルがどこまで来ているのかを確認しよう。
人間向けIQテストをLLM(大規模言語モデル)向けに翻訳・再構成し、正答率を人間のIQ尺度で表現した「AI IQ Test 2025」では、GPT-5.2 Proが「IQ142」という、いわゆる天才レベルのスコアを記録した。
メンサ基準(IQ130以上)を明確に超えており「知的能力そのもの」は、すでに人間の上位層に並んだ。あるいは超えたと言ってよい。ここで重要なのは、AIが賢くなったかどうかという問いに対しては、データ上「YES」と答えざるを得ない段階に来ている点だ。
もう一つ、より実務に近い評価指標がある。米OpenAIによる新たな評価手法「GDPval」だ。
これは米国のGDP(国内総生産)に大きく寄与する9産業・44職種を対象に、営業資料、会計スプレッドシート、救急診療スケジュール、製造図面、短編動画など、実際の成果物を作らせて評価するベンチマークである。
GPT-5.2 Proは、このGDPvalにおいて約74%の知識労働タスクで「専門家と同等、あるいは専門家より好まれる」という評価を得た。
ただし、対象となっているのは、業務範囲が明確に定義されたタスクのみ。新規プロダクトの構想や、複雑でオープンエンドなチーム協働型の仕事は含まれていない。だから全てのホワイトカラーの仕事をAIが代替できるわけではない。だが「業務委託やリモートワーカーの1時間分程度の仕事はAIに任せることができるようになった」と、OpenAIのサム・アルトマン(Sam Altman)氏は指摘している。
では、なぜ「AGIに到達したかどうか」で議論が終わらないのか。理由は大きく2つある。
AI研究の黎明期から、知能の定義には2つの系譜がある。
OpenAIのAGIの定義は「経済的価値のある仕事のほとんどができる」というもの。明らかに前者(ミンスキー)的だ。なのでOpenAIは、すでにAGIフェーズに入ったと主張しているわけだ。一方「未知の状況でも壊れずに学び続けられるか」という後者の定義に立てば、話は全く変わってくる。
AGI論争には、純粋な学術議論を超えた現実的な事情も絡んでいる。
OpenAIは、設立当初から米Microsoftの支援を受けており、その見返りにAGI到達、もしくは2032年まで、売上高の15%をMicrosoftに支払う契約を結んでいる。
そのため「いつ、どの時点でAGIと見なすのか」は、両社にとって極めて重要な問題になっている。アルトマン氏が「もうAGIのフェーズに入っている」と語る一方で、Microsoftのサティア・ナデラ(Satya Nadella)氏は「今のAIは尖って凸凹の知性であり、AGIには到達していない」と繰り返し強調する。
AGI論争が終わらない背景には、こうした契約と経済的利害も確実に存在している。
では現場ではどうか。ホワイトカラーの多くは、AGIを実感できているのだろうか。
アルトマン氏は「いろいろな分野の専門家たちが『これは驚くようなことができる』『実際に貢献している』『仕事をより効果的にしている』と言っている」と指摘した。「もうAGIに到達したということでいいのではないか」とも語っている。
一方でアルトマン氏は、多くのビジネスマンがAGIを実感できていない現状も認識しているようだ。同氏によると、AIの能力が向上しているにもかかわらず、企業や組織の活用レベルがそれに追いついていないというのだ。
同氏はこの状況を「オーバーハング」(能力の未活用)と呼ぶ。これは数年前に想定したものと全く異なる展開だという。
同氏によると、プログラマーなど生産性が飛躍的に向上した職種がある一方で、1年前のAIの使い方と、同じ使い方しかできていない人が多く存在するという。急速な生産性の向上によって大きく伸びる企業や業種と、ほとんど変化しない企業や業種。この二極化が「世界に奇妙な結果をいくつももたらすことになる」と同氏は語っている。
奇妙な結果とは、どういうことを指しているのだろうか。国家間、地域間、企業間の格差や、人々の所得の格差拡大を指しているのだろうか。
では1年前のAIの使い方とは違う、今日のあるべきAIの使い方とはどういうものになるのだろうか。
OpenAIのプラットフォーム部門のエンジニアリング担当のシャーウィン・ウー(Sherwin Wu)氏は「1年前はプロンプト(命令文)をどう工夫するのかが重要だった」と話す。その工夫の仕方は「プロンプトエンジニアリング」と呼ばれた。
「今はRAG(社内データの検索)や、マルチツールコール、データフェッチ、コード実行、画像や動画、複数モデル切替、メモリ管理を、どの順序で、どの制約で、どの論理で使わせるかが最重要になっている」(ウー氏)
そうした工夫はプロンプトエンジニアリングではなく、コンテキストエンジニアリングと呼ばれるようになっているのだという。
こうしたコンテキストエンジニアリングができる企業と、そうでない企業との間で生産性の差が、大きく開く傾向にあるという。
またAI業界の伝説的エンジニアの一人、アンドレイ・カルパシー(Andrej Karpathy)氏は、AIをベースにしたアプリやツール、サービスを開発する場合は、コンテキストエンジニアリングに加えて、次のようなことに気を付けたり、機能を実装したりすべきだと言っている。
つまり、いま求められているのは、基盤モデルがさらに賢くなることではなく、使う側の工夫だというわけだ。
地上の電力ではもう足りない マスクとベゾスが激突する「宇宙AIデータセンター」覇権争い
AI競争は「Googleの圧勝」で終わるのか? Gemini 2.5 Proの衝撃
Googleが拒否した軍事AIを成功へ 異端企業「Palantir」が示す、次なるAIの戦場
「KPIは睡眠時間」──オードリー・タンに聞く、日本企業の生産性が上がらない根本原因
NTT「IOWN構想」に世界が動き出した 成否を握る“ブレークスルー技術”とは?
OpenAIアルトマンCEOが考える AI時代の「覇権を取る3つの要素」
OpenAIは4年後、何で稼いでいるのか? ChatGPT以外の収益源は?
AIは「4カ月で2倍」賢くなる OpenAI「o3」は知能爆発の入り口か?
OpenAIが目指す「進化版ChatGPT」とは? 「AI時代のOS」になり得るか© エクサウィザーズ AI新聞
Special
PR注目記事ランキング