IQ142の「天才AI」で飛躍する企業・沈む企業 「勝者と敗者」を分ける決定的な要素とは?(1/2 ページ)
「AIは、AGI(汎用人工知能)と呼ぶにふさわしいほど、十分に賢くなったのではないか」「いや、まだAGIではない」――双方の意見は対立したままだ。果たしてAIはAGIに達したのだろうか。現状と、今後の方向性を占ってみたい。
「AIは、AGI(汎用人工知能)と呼ぶにふさわしいほど、十分に賢くなったのではないか」「いや、まだAGIではない」――。
双方の意見は対立したままだ。果たしてAIはAGIに達したのだろうか。現状と、今後の方向性を占ってみたい。
「IQ142」の衝撃 AIはすでに人間の上位層を凌駕した
まず、現在の基盤モデルがどこまで来ているのかを確認しよう。
人間向けIQテストをLLM(大規模言語モデル)向けに翻訳・再構成し、正答率を人間のIQ尺度で表現した「AI IQ Test 2025」では、GPT-5.2 Proが「IQ142」という、いわゆる天才レベルのスコアを記録した。
メンサ基準(IQ130以上)を明確に超えており「知的能力そのもの」は、すでに人間の上位層に並んだ。あるいは超えたと言ってよい。ここで重要なのは、AIが賢くなったかどうかという問いに対しては、データ上「YES」と答えざるを得ない段階に来ている点だ。
知識労働の74%を代替可能に? 実務ベンチマーク「GDPval」が示す現実
もう一つ、より実務に近い評価指標がある。米OpenAIによる新たな評価手法「GDPval」だ。
これは米国のGDP(国内総生産)に大きく寄与する9産業・44職種を対象に、営業資料、会計スプレッドシート、救急診療スケジュール、製造図面、短編動画など、実際の成果物を作らせて評価するベンチマークである。
GPT-5.2 Proは、このGDPvalにおいて約74%の知識労働タスクで「専門家と同等、あるいは専門家より好まれる」という評価を得た。
ただし、対象となっているのは、業務範囲が明確に定義されたタスクのみ。新規プロダクトの構想や、複雑でオープンエンドなチーム協働型の仕事は含まれていない。だから全てのホワイトカラーの仕事をAIが代替できるわけではない。だが「業務委託やリモートワーカーの1時間分程度の仕事はAIに任せることができるようになった」と、OpenAIのサム・アルトマン(Sam Altman)氏は指摘している。
なぜ「AGI到達」の結論が出ないのか? 論争を長引かせる2つのワケ
では、なぜ「AGIに到達したかどうか」で議論が終わらないのか。理由は大きく2つある。
理由(1) 知能の定義が2つある
AI研究の黎明期から、知能の定義には2つの系譜がある。
- マーヴィン・ミンスキー:「人間が行うタスクを機械で実行できるようにする」→ タスク達成能力重視
- ジョン・マッカーシー:「あらかじめ用意されていない新しい問題を解決できるようにする」→ 汎化・学習能力重視
OpenAIのAGIの定義は「経済的価値のある仕事のほとんどができる」というもの。明らかに前者(ミンスキー)的だ。なのでOpenAIは、すでにAGIフェーズに入ったと主張しているわけだ。一方「未知の状況でも壊れずに学び続けられるか」という後者の定義に立てば、話は全く変わってくる。
理由(2) OpenAIとMicrosoftの契約構造
AGI論争には、純粋な学術議論を超えた現実的な事情も絡んでいる。
OpenAIは、設立当初から米Microsoftの支援を受けており、その見返りにAGI到達、もしくは2032年まで、売上高の15%をMicrosoftに支払う契約を結んでいる。
そのため「いつ、どの時点でAGIと見なすのか」は、両社にとって極めて重要な問題になっている。アルトマン氏が「もうAGIのフェーズに入っている」と語る一方で、Microsoftのサティア・ナデラ(Satya Nadella)氏は「今のAIは尖って凸凹の知性であり、AGIには到達していない」と繰り返し強調する。
AGI論争が終わらない背景には、こうした契約と経済的利害も確実に存在している。
天才AIを使いこなせない現場 致命的な格差を生むワケ
では現場ではどうか。ホワイトカラーの多くは、AGIを実感できているのだろうか。
アルトマン氏は「いろいろな分野の専門家たちが『これは驚くようなことができる』『実際に貢献している』『仕事をより効果的にしている』と言っている」と指摘した。「もうAGIに到達したということでいいのではないか」とも語っている。
一方でアルトマン氏は、多くのビジネスマンがAGIを実感できていない現状も認識しているようだ。同氏によると、AIの能力が向上しているにもかかわらず、企業や組織の活用レベルがそれに追いついていないというのだ。
同氏はこの状況を「オーバーハング」(能力の未活用)と呼ぶ。これは数年前に想定したものと全く異なる展開だという。
同氏によると、プログラマーなど生産性が飛躍的に向上した職種がある一方で、1年前のAIの使い方と、同じ使い方しかできていない人が多く存在するという。急速な生産性の向上によって大きく伸びる企業や業種と、ほとんど変化しない企業や業種。この二極化が「世界に奇妙な結果をいくつももたらすことになる」と同氏は語っている。
奇妙な結果とは、どういうことを指しているのだろうか。国家間、地域間、企業間の格差や、人々の所得の格差拡大を指しているのだろうか。
脱・プロンプト依存 勝敗を分ける要点は?
では1年前のAIの使い方とは違う、今日のあるべきAIの使い方とはどういうものになるのだろうか。
OpenAIのプラットフォーム部門のエンジニアリング担当のシャーウィン・ウー(Sherwin Wu)氏は「1年前はプロンプト(命令文)をどう工夫するのかが重要だった」と話す。その工夫の仕方は「プロンプトエンジニアリング」と呼ばれた。
「今はRAG(社内データの検索)や、マルチツールコール、データフェッチ、コード実行、画像や動画、複数モデル切替、メモリ管理を、どの順序で、どの制約で、どの論理で使わせるかが最重要になっている」(ウー氏)
そうした工夫はプロンプトエンジニアリングではなく、コンテキストエンジニアリングと呼ばれるようになっているのだという。
こうしたコンテキストエンジニアリングができる企業と、そうでない企業との間で生産性の差が、大きく開く傾向にあるという。
またAI業界の伝説的エンジニアの一人、アンドレイ・カルパシー(Andrej Karpathy)氏は、AIをベースにしたアプリやツール、サービスを開発する場合は、コンテキストエンジニアリングに加えて、次のようなことに気を付けたり、機能を実装したりすべきだと言っている。
- 複数のLLMの呼び出しを、ますます複雑化するDAG(有向非巡回グラフ)として裏側で組み合わせ、性能とコストのトレードオフを慎重に調整する
- 人間が介在することを前提にした、アプリケーション特化型のGUIを提供する
- 「自律性スライダー」(autonomy slider)を提供する
つまり、いま求められているのは、基盤モデルがさらに賢くなることではなく、使う側の工夫だというわけだ。
© エクサウィザーズ AI新聞
関連記事
地上の電力ではもう足りない マスクとベゾスが激突する「宇宙AIデータセンター」覇権争い
米シリコンバレーと宇宙業界の深層で、ある壮大な構想が現実味を帯びて語られ始めている。イーロン・マスク氏が率いる米SpaceXが描く「宇宙100GW(ギガワット)計画」だ。
AI競争は「Googleの圧勝」で終わるのか? Gemini 2.5 Proの衝撃
米国のテック系人気ユーチューバーの何人かが、こぞって「AI開発競争はGoogleが勝利した」という見出しの動画をアップしている。これでGoogleの勝利が決定したのかどうか分からないが、少なくともOpenAIの首位独走の時代は終わったのかもしれない。
Googleが拒否した軍事AIを成功へ 異端企業「Palantir」が示す、次なるAIの戦場
AIの戦場で圧倒的な存在感を放つのが、米コロラド州デンバーに本社を置くPalantir Technologies(パランティアテクノロジーズ)だ。 AI業界がモデル性能の覇権争いに明け暮れる中、Palantirは全く異なる価値観でAIの時代を切り拓き、業績を急拡大させている。
「KPIは睡眠時間」──オードリー・タンに聞く、日本企業の生産性が上がらない根本原因
生産性の低さが指摘されている日本。人口減少が追い打ちをかける中で、現状を打開するためには、どうしたらいいのか。企業はAIをどのように使いこなしていくべきなのか。オードリー・タンさんに聞いた。
NTT「IOWN構想」に世界が動き出した 成否を握る“ブレークスルー技術”とは?
NTTが提唱する「IOWN構想」では2030年をメドに伝送容量を現在の125倍、遅延を200分の1、電力消費を100分の1に抑える計画だ。飛躍期を迎えたIOWNの歩みと、米南部ダラスで開かれた推進組織のメンバー会議の現地取材から今後の課題を展望する。
OpenAIアルトマンCEOが考える AI時代の「覇権を取る3つの要素」
AI時代の覇権をめぐる戦い方が目まぐるしく変化している。OpenAIのCEOのSam Altman(サム・アルトマン)氏が最新のインタビューで、AI時代に覇権を取るのに必要なのは最先端のモデルではなく、数十億人のユーザーを抱えるサービスだという考えを明らかにした。
OpenAIは4年後、何で稼いでいるのか? ChatGPT以外の収益源は?
米OpenAIは2029年にはChatGPT以外の売り上げがChatGPTのそれを超え、10年後にはChatGPTの売り上げの10倍になると予測しているという。ChatGPT以外の収益源とは、どのような製品になるのか?
AIは「4カ月で2倍」賢くなる OpenAI「o3」は知能爆発の入り口か?
米国OpenAIのPresidentのグレッグ・ブロックマン(Greg Brockman)氏は、「o3はトップ科学者たちが、『本当に新しくて有用なアイデアを出してくる』と言っている最初のモデルだ」と語った。実際筆者も使っていて、o3が新たな知見を見つけ出したのではないかと感動したことがある。詳しく説明してみよう。
OpenAIが目指す「進化版ChatGPT」とは? 「AI時代のOS」になり得るか
米OpenAIのSam Altman(サム・アルトマン)氏は、今後のAIモデルを「オペレーティングシステム(OS、基本ソフト)のようなものにしたい」と語った。OSのようなAIモデルとはどんなものなのだろうか。同氏によると、若い世代は既にChatGPTをOSのように使っているという。


