2015年7月27日以前の記事
検索
ニュース

IQ142の「天才AI」で飛躍する企業・沈む企業 「勝者と敗者」を分ける決定的な要素とは?(1/2 ページ)

「AIは、AGI(汎用人工知能)と呼ぶにふさわしいほど、十分に賢くなったのではないか」「いや、まだAGIではない」――双方の意見は対立したままだ。果たしてAIはAGIに達したのだろうか。現状と、今後の方向性を占ってみたい。

PC用表示 関連情報
Share
Tweet
LINE
Hatena
ExaWizards

 「AIは、AGI(汎用人工知能)と呼ぶにふさわしいほど、十分に賢くなったのではないか」「いや、まだAGIではない」――。

 双方の意見は対立したままだ。果たしてAIはAGIに達したのだろうか。現状と、今後の方向性を占ってみたい。


米OpenAIのサム・アルトマン(Sam Altman)氏(撮影:河嶌太郎)

「IQ142」の衝撃 AIはすでに人間の上位層を凌駕した

 まず、現在の基盤モデルがどこまで来ているのかを確認しよう。

 人間向けIQテストをLLM(大規模言語モデル)向けに翻訳・再構成し、正答率を人間のIQ尺度で表現した「AI IQ Test 2025」では、GPT-5.2 Proが「IQ142」という、いわゆる天才レベルのスコアを記録した。

 メンサ基準(IQ130以上)を明確に超えており「知的能力そのもの」は、すでに人間の上位層に並んだ。あるいは超えたと言ってよい。ここで重要なのは、AIが賢くなったかどうかという問いに対しては、データ上「YES」と答えざるを得ない段階に来ている点だ。


AI新聞「AGIは実現したということで、次に行こう」(2026年1月6日掲載)より

知識労働の74%を代替可能に? 実務ベンチマーク「GDPval」が示す現実

 もう一つ、より実務に近い評価指標がある。米OpenAIによる新たな評価手法「GDPval」だ。

 これは米国のGDP(国内総生産)に大きく寄与する9産業・44職種を対象に、営業資料、会計スプレッドシート、救急診療スケジュール、製造図面、短編動画など、実際の成果物を作らせて評価するベンチマークである。

 GPT-5.2 Proは、このGDPvalにおいて約74%の知識労働タスクで「専門家と同等、あるいは専門家より好まれる」という評価を得た。

 ただし、対象となっているのは、業務範囲が明確に定義されたタスクのみ。新規プロダクトの構想や、複雑でオープンエンドなチーム協働型の仕事は含まれていない。だから全てのホワイトカラーの仕事をAIが代替できるわけではない。だが「業務委託やリモートワーカーの1時間分程度の仕事はAIに任せることができるようになった」と、OpenAIのサム・アルトマン(Sam Altman)氏は指摘している。


AI新聞「AGIは実現したということで、次に行こう」(2026年1月6日掲載)より

なぜ「AGI到達」の結論が出ないのか? 論争を長引かせる2つのワケ

 では、なぜ「AGIに到達したかどうか」で議論が終わらないのか。理由は大きく2つある。

理由(1) 知能の定義が2つある

 AI研究の黎明期から、知能の定義には2つの系譜がある。

  1. マーヴィン・ミンスキー:「人間が行うタスクを機械で実行できるようにする」→ タスク達成能力重視
  2. ジョン・マッカーシー:「あらかじめ用意されていない新しい問題を解決できるようにする」→ 汎化・学習能力重視

 OpenAIのAGIの定義は「経済的価値のある仕事のほとんどができる」というもの。明らかに前者(ミンスキー)的だ。なのでOpenAIは、すでにAGIフェーズに入ったと主張しているわけだ。一方「未知の状況でも壊れずに学び続けられるか」という後者の定義に立てば、話は全く変わってくる。

理由(2) OpenAIとMicrosoftの契約構造

 AGI論争には、純粋な学術議論を超えた現実的な事情も絡んでいる。

 OpenAIは、設立当初から米Microsoftの支援を受けており、その見返りにAGI到達、もしくは2032年まで、売上高の15%をMicrosoftに支払う契約を結んでいる。

 そのため「いつ、どの時点でAGIと見なすのか」は、両社にとって極めて重要な問題になっている。アルトマン氏が「もうAGIのフェーズに入っている」と語る一方で、Microsoftのサティア・ナデラ(Satya Nadella)氏は「今のAIは尖って凸凹の知性であり、AGIには到達していない」と繰り返し強調する。

 AGI論争が終わらない背景には、こうした契約と経済的利害も確実に存在している。

天才AIを使いこなせない現場 致命的な格差を生むワケ

 では現場ではどうか。ホワイトカラーの多くは、AGIを実感できているのだろうか。

 アルトマン氏は「いろいろな分野の専門家たちが『これは驚くようなことができる』『実際に貢献している』『仕事をより効果的にしている』と言っている」と指摘した。「もうAGIに到達したということでいいのではないか」とも語っている。

 一方でアルトマン氏は、多くのビジネスマンがAGIを実感できていない現状も認識しているようだ。同氏によると、AIの能力が向上しているにもかかわらず、企業や組織の活用レベルがそれに追いついていないというのだ。

 同氏はこの状況を「オーバーハング」(能力の未活用)と呼ぶ。これは数年前に想定したものと全く異なる展開だという。

 同氏によると、プログラマーなど生産性が飛躍的に向上した職種がある一方で、1年前のAIの使い方と、同じ使い方しかできていない人が多く存在するという。急速な生産性の向上によって大きく伸びる企業や業種と、ほとんど変化しない企業や業種。この二極化が「世界に奇妙な結果をいくつももたらすことになる」と同氏は語っている。

 奇妙な結果とは、どういうことを指しているのだろうか。国家間、地域間、企業間の格差や、人々の所得の格差拡大を指しているのだろうか。

脱・プロンプト依存 勝敗を分ける要点は?

 では1年前のAIの使い方とは違う、今日のあるべきAIの使い方とはどういうものになるのだろうか。

 OpenAIのプラットフォーム部門のエンジニアリング担当のシャーウィン・ウー(Sherwin Wu)氏は「1年前はプロンプト(命令文)をどう工夫するのかが重要だった」と話す。その工夫の仕方は「プロンプトエンジニアリング」と呼ばれた。

 「今はRAG(社内データの検索)や、マルチツールコール、データフェッチ、コード実行、画像や動画、複数モデル切替、メモリ管理を、どの順序で、どの制約で、どの論理で使わせるかが最重要になっている」(ウー氏)

 そうした工夫はプロンプトエンジニアリングではなく、コンテキストエンジニアリングと呼ばれるようになっているのだという。

 こうしたコンテキストエンジニアリングができる企業と、そうでない企業との間で生産性の差が、大きく開く傾向にあるという。

 またAI業界の伝説的エンジニアの一人、アンドレイ・カルパシー(Andrej Karpathy)氏は、AIをベースにしたアプリやツール、サービスを開発する場合は、コンテキストエンジニアリングに加えて、次のようなことに気を付けたり、機能を実装したりすべきだと言っている。

  1. 複数のLLMの呼び出しを、ますます複雑化するDAG(有向非巡回グラフ)として裏側で組み合わせ、性能とコストのトレードオフを慎重に調整する
  2. 人間が介在することを前提にした、アプリケーション特化型のGUIを提供する
  3. 「自律性スライダー」(autonomy slider)を提供する

 つまり、いま求められているのは、基盤モデルがさらに賢くなることではなく、使う側の工夫だというわけだ。

© エクサウィザーズ AI新聞

       | 次のページへ
ページトップに戻る