生成AIがコードを書くこと自体は、もはや驚きではなくなった。
だが米OpenAIが示しているのは、その次の段階だ。勝負どころは、AIにコードを書かせることではない。
AIが安定して働ける開発環境そのものを設計し、AI自身が学習し、改善し続けることにある。OpenAIのテクニカルスタッフであるライアン・ロポポロ氏はこの考え方を「ハーネスエンジニアリング」と呼ぶ。
よく似た言葉に、プロンプトエンジニアリング、コンテキストエンジニアリングという表現がある。
AIモデルへの指示文をいかに巧みに書くかという技術であるプロンプトエンジニアリングは、2024年ごろに広く普及した。これに対し、単一の指示では不十分だという認識から2025年に台頭したのが、コンテキストエンジニアリングという概念だ。
AIモデルが一度に処理できるデータ量を「コンテキストウィンドウ」といい、その量には上限がある。そこで、AIが参照する関連文書や会話履歴、ツールの定義、検索結果などを最適化する営みがコンテキストエンジニアリングだ。
ハーネスエンジニアリングは、この両者をさらに上位から包含する。プロンプトエンジニアリングがメールの文面を磨く作業だとすれば、コンテキストエンジニアリングはメールに必要な添付ファイルを選ぶ作業だ。
ハーネスエンジニアリングはその先を目指す、いわばオフィスそのものを設計する営みといっていい。端的に言えば、コンテキストエンジニアリングまではAIに何を入力するかの設計だった。
ハーネスエンジニアリングはその先を行く。AIが間違えたときどう止めるか、品質をどう測るか、問題が起きたらどう自動修復するかまで、AIが働く職場のルールと仕組みごと設計するのだ。
ロポポロ氏が2月に公開したOpenAIの公式ブログによると、同社のチームは5カ月間にわたり、手書きコードを1行も使わずに社内向けベータ製品を構築し、運用してきた。アプリの基本動作だけでなく、テストや自動ビルドの設定、ドキュメント、システム監視、内部ツールまで、同社のコード生成AIである「Codex」が全てを書いた。
少人数チームで100万行規模のコードを生み出し、実際に社内ユーザーが日常的に使う製品として稼働させた実績を持つ。
ここで本当に重要なのは、AIが優秀になったという話ではない。エンジニアの仕事の重心が変わったことだ。
ロポポロ氏は、チームの主な仕事がコードを書くことから、環境を設計し、意図を明確にし、改善の仕組みを作ることへ移ったとつづる。初期に開発が遅かった理由も、モデルの能力不足というより、自律的に動くAIであるエージェントが働くための道具や仕組みの整理、内部構造が足りなかったからだという。
つまりAI時代の生産性は、モデルの性能だけではなく、AIが迷わず働ける足場をどれだけ整えられるかで決まる。ロポポロ氏自身、その感覚を500人規模の組織をまとめる技術責任者のようなものだと表現した。個々のコードの細部に人間が口を出す立場ではなくなった、という意味だ。
その足場作りの中核にあるのが、AIが読み解きやすい構造だ。
OpenAIは、知識の置き場を米Googleの文書共有サービス「Google Docs」やチャットツール「Slack」、あるいは人の頭の中に残さず、コード保管庫内の文書や設計資料に寄せる方針を取った。
長大な指示書を一枚置くのではなく、短い目次ファイルである「AGENTS.md」を入り口として使い、体系化された資料フォルダを唯一の情報源とした。設計思想、実行計画、技術的な課題の積み残し、品質評価までをAIが参照できる形で保存する。人間にとっての新人が理解しやすいコード全体という概念を、AI向けに徹底した形だ。
OpenAIはさらに、稼働記録や数値データ、処理の追跡情報をシステム監視の仕組みを通じてCodexに参照させることで、不具合の再現から修正、性能確認までを一貫した流れで処理できるようにした。
米国の人気AIポッドキャスト「Latent Space」に登壇したロポポロ氏は、インタビューの中で、プログラムの動作確認は1分以内に収めることを鉄則にしていると語った。時間がかかり過ぎる場合はその場で作業を細かく分解し直す。AI中心の開発では、コードを書く速さ以上に、試して直すサイクルの速さが勝負を決める。
この考え方はレビューの哲学まで変える。承認の手続きを最小限に絞り、修正は次の作業の中で素早く反映する。コードを本番環境へ反映する前の厳しい人間レビューではなく、反映後に代表サンプルを確認し、そこで見えたミスのパターンをドキュメントやテスト、レビュー担当のAIエージェントに書き戻すという改善サイクルが回る。
人が消えるのではない。役割が変わるのだ。ロポポロ氏はこの実験の本質を「エージェントは難しくない、難しいのはハーネスだ」という一文に凝縮している。
この話が単なる開発現場の工夫で終わらないのは、OpenAIが2月に発表した企業向けのエージェント運用基盤「Frontier」とつながっているからだ。
ロポポロ氏自身、Frontierを企業向けのAIエージェント運用基盤と位置付け、そのチームで新製品開発を担うと説明している。つまり、先の内部実験は企業がエージェントを組織に組み込む際の先行事例でもあったわけだ。Frontierの公式発表でも、企業導入の最大の障壁はモデルの知能ではなく、エージェントを組織内でどう構築し運用するかだと明言されている。
日本企業にとってこの示唆は重い。日本企業の多くは会議でのみ共有される判断基準、ベテランしか知らない運用の勘所、属人的なレビュー観点を抱えたままだ。ドキュメント文化が根付いていない組織では、AIはその知識に触れることができず、賢くなりようがない。
逆に言えば、評価軸、監視、権限、運用ルールまでをAI前提で再設計できる企業は、一気に加速する可能性がある。これからの強い企業は、AIを使う企業ではない。AIが働ける職場を作れる企業だ。
本記事は、エクサウィザーズが法人向けChatGPT「exaBase 生成AI」の利用者向けに提供しているAI新聞「プロンプト、コンテキストの次 『ハーネス』がAI開発の主戦場に」(2026年4月11日掲載)を、ITmedia ビジネスオンライン編集部で一部編集の上、転載したものです。
Googleが拒否した軍事AIを成功へ 異端企業「Palantir」が示す、次なるAIの戦場
「学歴は無価値に」 米トップエンジニアが明かす、AI時代に“大化けする人材”の共通点
人間は「取締役」、AIが「CEO」 サム・アルトマンがAGI論争を終了させてまで語りたかった「ASI」の未来図
「人間がコードを書く時代は終わった」 “Claude Code”が引き起こす「知能の価格崩壊」
AIによる“社会崩壊”まで残り3年 トップ識者が警告する「地獄のシナリオ」
AI競争は「Googleの圧勝」で終わるのか? Gemini 2.5 Proの衝撃
「KPIは睡眠時間」──オードリー・タンに聞く、日本企業の生産性が上がらない根本原因
NTT「IOWN構想」に世界が動き出した 成否を握る“ブレークスルー技術”とは?© エクサウィザーズ AI新聞
Special
PR注目記事ランキング