UiPathはNVIDIA、OpenAI、Google Cloudと協業し、エージェンティックAIやRPAを組み合わせた業務全体の自動化を支援する新サービスと新機能を開始する。中には会話型AIエージェントを実現する機能も盛り込まれており、AIエージェントと音声で対話する時代が到来しそうだ。
この記事は会員限定です。会員登録すると全てご覧いただけます。
UiPathは2025年10月16日(現地時間)、同社が打ち出すAIエージェントとRPA、人間の組み合わせによる業務全体の自動化「エージェンティックオートメーション」に関する新しいサービスと機能を発表した。
UiPathがNVIDIAやOpenAI、Google Cloudとの協業で実現を図る機能とサービスは次の通りだ。中には会話型AIエージェントを実現する機能も盛り込まれており、テキストベースでのやり取りではくみ取るのが難しいニュアンスを踏まえた問題解決能力が提供されるという。
UiPathはNVIDIAとの協業では、機密性の高いワークフロー向けにエージェンティックオートメーションを提供する。UiPathのエージェンティックオートメーションの専門知識と、NVIDIAのオープンな「Nemotronモデル」をAIエージェントマイクロサービス「NVIDIA NIM」と組み合わせることで自然言語処理や画像認識、予測分析などのエンタープライズ対応AIモデルをマイクロサービスとして迅速かつ容易に展開できるようにする。これにより、企業が不正検知や医療分野におけるケアマネジメントといった信頼性が求められる場面で、既存の自動化ワークフローをAI機能で強化できるように支援する。
また、UiPathとNVIDIA NIMおよびNVIDIA Nemotronを接続する「Integration Service Connector」の提供も開始する。同コネクターにより、ユーザーはNVIDIA NIMを活用して生成AI機能をアプリケーションやサービスに統合し、自動化におけるパフォーマンスと機能の向上を図る。機密性の高いユースケースを扱う場面でもエージェントやロボット、人間の専門家を活用したエンド・ツー・エンドの業務プロセスを自動化できる。
また、AI搭載のエージェントをより効果的に連携させるエージェンティックオーケストレーションの高度化、UiPathの自動化技術とカスタマイズ可能なオープンソースのNVIDIA Nemotronモデルおよび高速計算機能を組み合わせたエージェントの開発、これらの機能をオンプレミス環境やエアギャップ環境にも拡張し、規制の厳しい業界でもAIを安全かつ大規模に導入できるように支援するサービスも展開する計画だ。
OpenAIとの協業では、OpenAIのモデルを企業のワークフローと統合する「ChatGPTコネクタ」を開発する。UiPathのエージェンティックオートメーション機能と、OpenAIのモデルおよびAPIを活用することでAIエージェントの開発・展開が簡素化され、ユーザーは基盤の複雑さに煩わされることなくビジネス目標に集中できる。このOpenAIのモデルには、UiPathのAIエージェント構築ツール「Agent Builder」で利用できるGPT-5対応のアップデートも含まれている。
また、UiPathとOpenAIは共同で、エージェンティックオートメーションにおけるコンピュータユースモデルの活用に関するベンチマークを作成している。この新たなベンチマークにより、さまざまなAIモデルがコンピュータシステムとどのように連携するかを簡単に評価・比較できるようになるという。エージェントの能力を詳細にテストできる他、柔軟かつ拡張可能なフレームワークも提供する。このフレームワークは、実際の企業シナリオに特化して設計され、エージェントの進化に応じて新たなシナリオを追加することも可能だという。
さらに、オーケストレーションプラットフォーム「UiPath Maestro」の機能拡張として、UiPath、OpenAI、その他のサードパーティのAIエージェントを業務プロセス上でオーケストレーションできるようになり、エンタープライズ向けのLAM(大規模アクションモデル)の可能性を引き出せる。プロセス担当者は、UiPath Maestroの単一の操作画面から業務プロセスを構築して管理、最適化し、タスクに応じて適切なエージェントを選択できる。
その他、MCP統合を通じて、「ChatGPT」ユーザーに対して自動化機能を提供する。「ChatGPT Enterprise」で利用可能な無人オートメーションやAPIワークフロー、自律型エージェント、Maestroワークフローを直接確認できるようになる。
Google Cloudとの協業では、生成AIツール「Google Gemini」のモデルを活用して音声対話を可能にする会話型エージェント「UiPath Conversational Agent」をリリースした。これにより、複雑なコーディングなしでエージェンティックオートメーションをビジネスプロセスに組み込めるようになる。
AIエージェントとのテキストベースでの対話は、複雑なデータセットの分析やドキュメントの洗練、正式なコミュニケーションでのドキュメント作成など、精度が求められるタスクに効果的だ。一方でUiPathは「即興的な会話や現実世界での動的なやりとりに適用するには難しい場合もある」としている。
音声対話では、テキストベースのやりとりでは難しい文脈の手掛かりや、コミュニケーションにおけるニュアンスを踏まえて協調的な問題解決能力を提供する。AIエージェントが音声コミュニケーションを実施することで、予測不能で自由度の高いタスクを処理できる。UiPathは、「AIエージェントの普及に伴い、音声対話は自然なコミュニケーション手段として定着する」と予測している。
Google CloudのAI開発プラットフォーム「Vertex AIプラットフォーム」を利用することで、UiPathで自然言語の音声を通じて自動化を起動して構築し、管理できるようになる。UiPathはこの機能について、「コードを書く開発者や自動化ワークフローを構築するプロセス所有者と同等の文脈認識能力とエンタープライズ向けの実行力を備えている」としている。
会話型エージェントには、高いASR(自動音声認識)精度が備わっている他、多言語サポート、適切なツールの選択を可能にするファンクションコーリング、リアルタイム処理における低遅延を図る。感情認識型の対話や、特定の入力に対して応答するかどうかをモデルが判断するプロアクティブオーディオ機能を搭載し、AIエージェントが自然な音声で人とやりとりする能力の向上を図っている。
AIエージェントの「価格破壊」は起きるか?
AIエージェントとRPAは何が違うの? UiPathに聞いてみた
SMBCグループが経理業務を9割以上自動化へ 業務の大半が自動化される時代の「人間の役割」
富士通とNVIDIAが「AIインフラ」を共同開発 Armベースの「MONAKA」とGPUを連携Copyright © ITmedia, Inc. All Rights Reserved.