AIの“Web操作”成功率、人間超えに成功 NECが世界初
NECが開発したAIエージェント技術「cotomi Act」が、Web操作の国際ベンチマーク「WebArena」で、人間のタスク成功率を世界で初めて上回った。
NECは8月27日、Web上での業務を自動実行するエージェント技術「cotomi Act」(コトミ アクト)を開発したと発表した。
ベテラン社員の行動を操作履歴やログから把握した暗黙知をAIエージェントに組み込むことで、一般社員もベテラン品質で業務を遂行できるという。
同技術を組み込んだAIエージェントが、Web操作の国際ベンチマーク「WebArena」で、人間のタスク成功率を世界で初めて上回った。
cotomi Act開発に当たっては、ブラウザ上の操作履歴やログから、個人や組織の専門業務の暗黙知を抽出。集めたデータはNEC開発の生成AI「cotomi」を含む技術で分析する。
ログからデータを取ることで、人手によるヒアリングなどでは難しかった複雑で専門性の高い業務を、高精度かつ自律的に実行できる。また、ユーザーからのあいまいな指示にも、AIエージェントが必要な知識を見分け、情報や手続きを自動で検索・選べるという。
ベンチマークに活用した「WebArena」は、カーネギーメロン大学を中心とする研究チームが提案したもの。実際のインターネット利用に近い環境で、ECサイトや掲示板、コラボレーション開発、地図検索などを使ってページ遷移やフォーム入力を行い、AIが自然言語の指示通りにWeb操作できるかを評価する。
WebArenaが公式に人間での評価を実施した179のタスクで測定したところ、人間の成功率が78.2%に対して、cotomi Actを活用したAIエージェントは80.4%。従来のAIエージェントは40%〜70%前後にとどまっており、世界で初めて人間を超えたとしている。
同技術はNECグループ内で実証を進め、2026年度中のサービス提供を目指す。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
NEC、AIエージェント提供へ 「専門知識がなくても、依頼したい業務を入力するだけで成果を得られる」
NECは、AIにテキストを仕事を頼むと、自律的にタスクを分解して業務を実行する「AIエージェント」を提供すると発表した。
AIがサイト閲覧、自動クリック・入力も Chrome拡張「Claude for Chrome」のテスター募集 攻撃受けるリスクあり
Webブラウザ上で、Claude AIが自動的にボタンクリックやフォーム入力を行うChrome拡張「Claude for Chrome」のテスターを募集。
Microsoft、Edgeを“AIブラウザ”に 「Copilotモード」テスト開始
MicrosoftはWebブラウザ「Edge」で、AIが閲覧を支援する「Copilotモード」のテストを開始した。開いている全タブの要約や、ページからの情報抽出などが可能。将来は予約なども自動化する。期間限定無料機能として、日本でも利用可能だ。



