検索
連載

「Claude Cowork」とRPAの根本的な違い AIが“ソフトウェアを殺す”メカニズムエンタープライズAI 導入実務の勘所

Anthropicの自律型AI「Claude Cowork」がSaaS業界に激震を走らせている。なぜ「Anthropicショック」は起きたのか。そして、従来のRPAやGUI操作AIとは何が異なるのか。その仕組みを詳解する。

Share
Tweet
LINE
Hatena

 2026年1月12日(現地時間、以下同)、Anthropic社は「Claude Cowork」(以下、Cowork)をリサーチプレビューとして発表しました (注1)。これは、デスクトップアプリで動作する自律AIエージェントで、エンジニア向けツール「Claude Code」のエージェント機能を、非技術者を含む全てのナレッジワーカーに開放したものです。

筆者プロフィール

内田 匠(Takumi Uchida)

インキュデータ株式会社 R&D室、筑波大学 非常勤講師

京都大学総合人間学部(学士)、筑波大学社会人大学院(博士、システムズ・マネジメント)。情報処理学会、人工知能学会などに論文採録実績。Web広告代理店にて広告設計と効果改善業務。リクルートにてデータサイエンティスト、エンジニアとしてAIアルゴリズムを開発。2021年よりインキュデータに参加し、新規事業開発を担当。

大手メディアにおける広告効果の可視化BIツール開発、結婚情報誌に掲載されている画像の解析アルゴリズム、アルバイトのシフトを自動配置するアルゴリズム開発を担った他、深層学習を使った競馬の着順・回収率予測やChatGPT3.5を使った競馬の予測コメント自動生成で実績。インキュデータではデータクリーンルームを使った分析手法の開発や生成AIを使った新規事業/業務効率化の検討に従事する。

 Coworkは以下のような機能を備えています。

  • ローカルファイルの直接操作: ユーザーが指定したフォルダ内のファイルを、アップロードやダウンロードなしに直接読み書き、編集
  • プロフェッショナルな成果物生成: Excel(数式付き)、PowerPoint、Word文書などをネイティブに作成
  • プラグインによる外部サービス連携: MCP(Model Context Protocol)を通じて「Google Drive」や「Gmail」「DocuSign」「Slack」などと接続
  • サブエージェント協調: 複雑なタスクを分解し、複数の並列ワークストリームを協調して完了

株価の「Anthropicショック」はなぜ起きたか?

 重要なのは、Coworkが「PC画面をスクリーンショットで認識してマウスやキーボードを操作するAI」ではないという点です(注2)。

 このツールは軽量な仮想マシン(Micro-VM)のバックグラウンドで稼働し、ファイルシステムや外部APIを直接操作して業務を自律的に完了させます。「人間の代わりに画面(GUI)を操作するAI」ではなく、「ファイルシステムやAPIを直接操作するAI」なのです。

 Coworkの発表後、業務用ソフトウェア企業の株価が歴史的な暴落を記録しました (注3、4)。2月上旬以降、AIエージェントの進展を材料にソフトウェア株が急落し、“SaaSpocalypse”と呼ばれる局面になりました。報道によって集計範囲は異なるものの、単日で2000億ドル超の時価総額減が報じられています。

 市場がパニックに陥った最大の引き金は、2026年1月30日にAnthropicがCowork向けに公開した11種類のオープンソース・プラグインです (注5)。特に、契約書レビューやNDAトリアージを自律処理する「法務(Legal)プラグイン」の存在は、Thomson Reutersの株価を記録的に下落させ、LegalZoomは約20%下落しました (注6)。

 さらに、AIエージェントは「特定のアプリへの忠誠心」を持たず、常に最適なサービスを動的に選択するため、既存のSaaSビジネスが享受してきた更新メリットが消滅する「摩擦ゼロ経済」の到来が懸念されたのです (注7)。

AIエージェントのメカニズム

 OpenAIが提示したAGI(汎用人工知能)ロードマップでは、AIが会話型AI(レベル1)から推論者(レベル2)をへてエージェント(レベル3)に進化するとされています。2026年は、まさにレベル2からレベル3への転換点にあたります。Claude Coworkや、2025年1月に発表された「OpenAI Operator」(注8)は、それぞれ異なるアプローチで「レベル3」の実現を目指しています。本稿では、Coworkに代表されるAIエージェントが、どのようなメカニズムで動作しているのかを技術的に解説します。

 Coworkの動作を理解するためには、まずAIエージェントの基本的なメカニズムを押さえる必要があります(注9)。


AIエージェントのメカニズム(出典:インキュデータ作成)

 AIエージェントは、一般的に以下の4つの機能で構成されます。

構成要素 役割 人間での例え
知覚・観察 環境からの情報を取得する機能。テキスト、画像、センサーデータなどを入力として受け取る 五感(視覚、聴覚など)
計画・意思決定 受け取った情報を処理し、次にとるべき行動を決定する機能。LLMが担当 脳(思考・判断)
ツール実行 決定された行動を実際に環境に対して実行する機能。API呼び出し、ファイル操作など 手足(実際の行動)
記憶・知識管理 過去の経験や知識を保持・活用する機能。会話履歴やコンテキストを管理 記憶(短期・長期)

 AIエージェントはこれらの機能を使って、「人間」と「環境」の間で以下のような循環的に動作します。

  1. 人間からのタスクを受け取る: ユーザーが自然言語でタスクを指示し、エージェントが受け取る
  2. 観察: 環境の現在の状態を知覚
  3. 計画: タスクを達成するための行動を計画(人間と対話的に思考することも可能:Human in the Loop)
  4. 実行: 計画に基づいてツールを実行し、環境に影響を与える
  5. フィードバック: 実行結果を観察し、次の行動計画に活用
  6. 繰り返し: タスクが完了するまで3〜5を繰り返す

 では、この基本メカニズムをClaude Coworkはどのように実装しているのでしょうか。

Claude Coworkのメカニズム

 Claude Coworkは、前述のAIエージェントの基本メカニズムを、「バックグラウンドでのファイル・ API操作」に特化させた実装になっています。それぞれの要素がどのように対応しているかを見ていきましょう。

Coworkの「知覚・観察」 ファイルシステムとAPIレスポンス

 CoworkはPC画面のスクリーンショットを「見る」のではなく、ファイルシステムの内容や外部APIのレスポンスを知覚の入力とします (注2、10)。ユーザーが共有したフォルダのファイル一覧、ファイルの内容、そしてMCPプラグイン経由で取得した外部データが「知覚」の対象です。

 これは、従来のRPA(Robotic Process Automation)が特定のUI要素を座標やIDで指定するのとも、後述する「PC操作AIエージェント」が画面をスクリーンショットで取得するのとも異なる、第3のアプローチです (注11)。

Coworkの「計画・意思決定」 適応型推論

 Coworkの「頭脳」には、2026年2月に発表されたClaude 4.6シリーズのモデルが使用されています (注12)。このモデル群の最大の特徴はタスクの複雑さに応じて思考量を調整する「adaptive thinking」(適応的思考)が推奨され、必要に応じて思考の深さをパラメーターで制御できることです。単純なファイル操作から複雑なマルチステップタスクまで、最適な推論深度で処理します。

Coworkの「ツール実行」 プラグインとMCP

 Coworkの「手足」にあたるのが、プラグインです (注13)。Claudeのプラグインは、以下の要素を1つにバンドルしたものです。

  • スキル: 特定のドメイン知識をAIに教え込むプロンプト集(例:契約書レビューのチェックリスト)
  • コネクター: 外部サービス(Google Drive、Slack、DocuSignなど)や独自MCPとの接続インタフェース
  • コマンド: 「/review-contract」のようなショートカットコマンド

 Anthropicはローンチ時に「法務」「マーケティング」「営業」「カスタマーサポート」など11種類のプラグインをApache 2.0ライセンスでオープンソース化しました。2026年2月には、金融サービス向けプラグインも追加されています。また、Teamプランなど組織で利用する場合はプラグイン配布の管理機能も提供されました。

 特筆すべきは「Plugin Create」機能です。これによって、非エンジニアでも自然言語で「毎朝Slackから営業報告をまとめ、Notionに書き込むプラグインを作って」などと指示するだけで、独自の自動化ワークフローを構築できます(注14)。企業はプライベートマーケットプレイスを通じて、組織全体にプラグインを配布することも可能です。

Coworkの「環境」 セキュアな仮想マシン

 Coworkが動作する環境は、ユーザーのPCに構築された軽量なLinux仮想マシン(Micro-VM)です。「Apple Virtualization Framework」を使用したネイティブなARM64仮想化により、高速かつセキュアに動作します。

 この仮想マシンは以下のセキュリティ層を備えています。

  • ファイルシステム分離: ユーザーが明示的に共有したフォルダのみアクセス可能
  • ネットワーク制限: パッケージレジストリとAnthropic APIのみの接続にユーザー設定可能
  • その他: システムコール制限やセッション分離機能など

 これによって、AIエージェントが誤操作をしても、ホストPCのシステムや重要なデータを破壊するリスクを軽減できます。

Agent Teams マルチエージェントの協調

 Coworkの元となったClaude CodeはAgent Teamsという機能も備えており(注15)、Coworkもこれに則ってマルチエージェントで動作します(本稿執筆時点で、Coworkの利用者が自由にマルチエージェントを設定することはできません)。これは、完全に独立した複数のClaudeインスタンスが協調して動作する仕組みです。1つのセッションがチームリーダーとして作業を分配・統合し、他のチームメンバーはそれぞれ独立したコンテキストウィンドウで並列に作業し、互いにメッセージを送受信できます。

Coworkの進化と課題

 Coworkの開発自体も基本機能は2週間で開発されたとあり、これからもアップデートが期待されます(注16)。1月のリリース後も、Coworkにはスケジュール機能や組織によるプラグイン管理機能など様々な機能アップデートがありました。

 一方、CoworkやAgent Teamsは大量の文字をLLMでやりとりするため、契約しているプランによってはすぐに使用上限に達してしまうのが現状の課題です。タスクを実行する度にPythonコードを生成させるのではなく、定型作業はプラグイン化して都度コード生成させないような実行方法が求められます。

「PC操作AIエージェント」との違い

 Coworkと比較されることが多いのが、「PC操作AIエージェント」というカテゴリです。代表例として、Anthropicの「Computer Use」機能や、OpenAIの「Operator」があります (注17)。これらは、画面のスクリーンショットを解析し、人間の代わりにマウスカーソルを動かしキーボード入力をするGUI操作型の技術です。

比較軸 Claude Cowork PC操作AIエージェント
知覚の対象 ファイルシステム、APIレスポンス PC画面のスクリーンショット
操作方法 ファイル読み書き、API呼び出し、シェルコマンド マウスクリック、キーボード入力、スクロール
実行環境 バックグラウンドの軽量VM(Micro-VM) フロントエンドの仮想デスクトップ
強み 高速・正確なデータ処理、API経由の直接連携 既存GUIをそのまま操作可能、汎用性が高い
代表例 Anthropic Claude Cowork Anthropic Computer Use、OpenAI Operator

 重要なのは、この2つは相互補完的な技術である点です。実際、Claude Sonnet 4.6はComputer Use機能も大幅に向上させており、Coworkがブラウザを操作することも可能です。ただし、Coworkの中心的なメカニズムはあくまで「バックグラウンドでのファイル・API操作」であり、「画面を見てGUIを操作する」のは補助的な位置づけです。

AIはソフトウェアを殺すのか?

 AIはソフトウェアを殺すのか。この問いへの回答は、ダーウィンの進化論のように、「AI化という環境変化に適応できるソフトウェアは生き残り、適応できないソフトウェアは淘汰(とうた)される」ということになるでしょう (注18)。

 今後のエンタープライズ環境では、以下の2つのプロトコルが補完し合う形でソフトウェアのエコシステムを形成します。

  • MCP(Model Context Protocol): Anthropicが提唱した、AIモデルと社内外のデータソース(SaaSやデータベースなど)を繋ぐための標準規格。AIが情報にアクセスし、環境を操作するための「手足」として機能
  • A2A(Agent-to-Agent)プロトコル: Google主導で開発された、異なるベンダーやフレームワークの独立したAIエージェント同士が互いを発見し、タスクを委譲・協調するためのメッセージング標準(共通言語)

 人間向けのUIは、視覚的で直感的に操作できることが重視されます。一方、AIエージェント向けのUIは、機械可読性やプログラマビリティ、エラーハンドリングのしやすさが重視されます。

 業務によっては、「人間がマウスとキーボードを操作するよりも、AI向けのUIを整備してAIに業務を任せた方が効率的」というケースは確実に存在します。この可能性がある業務に関わるソフトウェアは、AI向けUIを提供し、新しいユーザーであるAIへ機能提供する必要があります。

 ソフトウェアの利用者である事業者も、従業員にAIエージェントアプリケーションを提供し、業務ソフトウェアのMCPと連携して、既存業務をAI化することで生産性を向上できます。

 この環境変化に適応できないソフトウェアは、適応した他のソフトウェアに「殺される」可能性があります。しかし、これはAIがソフトウェアを殺すのではなく、進化したソフトウェアが旧来のソフトウェアを置き換えるという、市場の競争原理です。今までと本質的には変わりません 。

 AIエージェントの時代は、ソフトウェアの終焉(しゅうえん)ではなく、新しい形態への進化の始まりなのかもしれません。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る