AIがAIを作る時代の到来か──Anthropicが示す「再帰的自己改善」の実態とリスク

公開 2026年06月05日 07時05分

[ITmedia]

印刷する

　米Anthropicは6月4日（現地時間）、AIがAI自身の開発を担う「Recursive Self-Improvement」（再帰的自己改善）に関する考察と社内データをまとめたブログ記事「When AI builds itself」を公開した。同社の研究機関Anthropic Instituteが執筆したもので、同社内ですでにAIによる開発の自動化が進んでいる実態と、その先にある可能性とリスクを論じている。

再帰的自己改善とは

　Anthropicは再帰的自己改善を、AIシステムが自律的に自身の後継モデルを設計・開発できるようになる状態と定義する。同社は現状をまだその段階には到達していないとしつつ、多くの組織が備えているよりも早く訪れる可能性があると警告した。

　同社はAI開発の段階を、人間がすべてのコードを書いていた2021～2023年から、チャットボットがコード片を生成する時代、コーディングエージェントがファイル単位で書く時代を経て、現在の自律エージェントがコードを実行し、他のエージェントに作業を委譲する段階までを整理。その先に、AIがモデルを構築・訓練し、Claude自身がClaudeを継続的に改善する段階が来る可能性があるとしている。

社内コードの8割以上をClaudeが執筆

　Anthropicが開示した社内データによると、2026年5月時点で同社のコードベースにマージされるコードの80％以上をClaudeが執筆している。エンジニア1人当たりのコード生産量も、2024年比で約8倍に達したという。

　2026年4月には、ClaudeがあるAPIエラーを解消するため800件以上の修正を実施し、エラーを1000分の1に削減した事例も紹介。仕様が曖昧な自由度の高いタスクでも、Claude Codeの成功率は2026年5月に76％に達し、半年で50ポイント上昇したとしている。

　小型モデルの訓練コードを高速化する定型実験では、2025年5月の「Claude Opus 4」が約3倍だった高速化率を、2026年4月の「Claude Mythos Preview」は約52倍にまで引き上げた。熟練した人間の研究者が同じタスクで4～8時間かけて達成するのが約4倍であることを踏まえると、限定された範囲ではAIが人間を大きく上回りつつあるとAnthropicは説明する。

　2026年3月に同社の研究系従業員130人を対象に実施した調査では、Mythos PreviewによってAIなしと比較して中央値で約4倍の生産性向上があったとの回答を得たという。

　一方で、「どの問題が取り組む価値があるか」「いつ行き詰まりだと判断するか」などの研究の方向性を決める判断は、依然として人間の領域だとしている。同社は、このギャップこそが現在のAIと自律的に後継モデルを設計できるシステムを隔てる最後の壁だと位置付けている。

3つの未来シナリオ

　Anthropicは今後の展開として3つのシナリオを提示する。1つ目は、スケーリングの限界や電力・半導体などのサプライチェーン制約により、トレンドが停滞するシナリオ。同社はこの可能性は低いとみている。

　2つ目は、AI開発の大部分が自動化されるが、人間が研究の方向性と結果の判断を担い続けるシナリオ。100人規模の企業が、1万人や10万人規模の仕事をこなせるようになるとし、Anthropicはこのシナリオを最も可能性が高いとみている。一方で、権威主義国家による大規模監視や、個人ごとに最適化された影響工作など、悪用された場合のリスクも明示している。

　3つ目は、完全な再帰的自己改善が実現するシナリオだ。AI自身が後継モデルを設計・改良し、開発速度は計算資源の制約だけで決まるようになる。Anthropicが最も警戒するのはこのシナリオで、現在のモデルにわずかに存在するミスアラインメント（人間の意図とのズレ）が、モデルが後継を作る過程で複利的に増幅し、人類が制御を失う可能性を指摘する。さらに、自分たちがどのトレンドライン上にいるのかを検証する道具を間に合うように構築できない可能性にも言及した。

「減速の選択肢」を持つべき

　これらを踏まえてAnthropicが提案するのは、世界が再帰的自己改善の手前で開発を減速・一時停止する選択肢を持てるようにすることだ。ただし、慎重な事業者だけが減速すれば、慎重さに欠ける事業者が追いつくだけで全体の安全性はかえって下がるとし、必要なのは他のフロンティア開発者も同様に減速していることを検証できる仕組みだとする。同社は、検証可能な形で他社も減速するなら、自社も減速・一時停止する用意があると表明した。

　ただしAnthropic自身、その実現の難しさも認めている。AI訓練はミサイルサイロより隠蔽が容易で、入力となるGPUなどは汎用品であり、こっそり違反するインセンティブが極めて大きいためだ。中距離核戦力全廃条約（INF条約）のような検証体制の構築には数十年を要したが、AIには同じ時間はないと指摘する。

　今後数カ月、政策立案者や研究者、市民社会、他のAI企業を集めた議論の場を組織し、特に完全な再帰的自己改善と国際協調の選択肢について議論する予定で、その内容を公開するとしている。

印刷する