AIエージェントはなぜ「本番で動かない」のか? AI時代における次世代データ基盤の条件「AI-Ready」に必要なこと

AIエージェントを導入しようとする企業が増えているが、PoC止まりで本導入に苦戦するケースもある。回答精度やセキュリティーの壁を突破し、RAGの成果を最大化させるデータ基盤の条件とは何か。専門家に聞いた。

PR/ITmedia
» 2026年03月23日 10時00分 公開
PR

AIエージェントの実運用がつまずきやすい理由

 「AIエージェント元年」ともてはやされた2025年は、AIエージェントの導入を見据えてPoC(概念実証)を始める企業が多かった。しかし、実際に取り組むと「期待したほどの精度が出ない」「本番環境への移行が難しい」といった課題が浮き彫りになった。

photo 日本IBMの川上智史氏(製品統括 テクノロジー事業本部 データ・プラットフォーム事業部 製品統括営業部 製品統括営業)

 AIエージェントが本番環境でうまく動かないのはなぜか。原因の一つに、「AIに最適化したデータを用意するのが難しい」という事情があると日本IBMは見ている。同社の川上智史氏は次のように話す。

 「AI利用におけるデータの重要性は広く認識されています。データを蓄積する基盤としてデータレイクを構築した企業もありました。データレイクは『データの格納』『移動』『活用』の仕組みを組み合わせた基盤です。しかし、ここに格納するのはデータの形式が決まった『構造化データ』が中心になりがちで、非構造化データの前処理や管理が不足することが多々あります。AIエージェントに参照させるデータは、文書や画像といった『非構造化データ』が多く、それらに対応した基盤がないことが課題です」

photo 日本IBMの岡口純子氏(製品統括 テクノロジー事業本部 データ・プラットフォーム事業部 製品統括営業部 データ・プラットフォーム・テクニカル・スペシャリスト)

 AIエージェントは、これまでのシステムでは効率化できていなかった「人が操作する領域」を自動化するツールとして期待されている。この領域には人が見るための作業マニュアルや報告書といったドキュメントがあり、それをAIに参照させる必要がある。日本IBMの岡口純子氏は「AIエージェントの活用には、企業が蓄えた非構造化データを『AI-Ready』(AIが利用できる形式)にしておくことが不可欠なのです」と語る。

 AIエージェントにデータを参照させる方法の一つにRAG(検索拡張生成)がある。RAGの精度を高めるには、データを蓄積するだけでは不十分だ。AIが非構造化データを理解して、適切に検索して、参照できる形にデータを整える仕組みが欠かせない。

 AIエージェントが参照しやすいデータ基盤が整えば、AIエージェントを効率良く開発・運用できる。「AIエージェントが自動化する業務は領域や作業ごとに細分化されており、一つだけ自動化しても効果はそこまで大きくありません。投資対効果を向上させるには、多数のAIエージェントをさまざまな業務に適用する必要があります」(岡口氏)

企業のAI活用ニーズに合わせたデータ基盤

 こうした課題に応えるソリューションとして、IBMは「watsonx.data Premium」を生み出した。既存のデータレイクハウス製品「watsonx.data」をベースに、非構造化データの取り込みやメタデータの自動管理、RAGの精度を高める検索機能などを強化している。

photo watsonx.data Premiumは生成AIを効果的に活用するためのデータ基盤製品だ(提供:日本IBM)《クリックで拡大》

 watsonx.data Premiumの設計思想は「ハイブリッド」「オープン」「セキュリティー、ガバナンス」「コスト最適化」で構成されている。

 同製品はクラウドサービスとしての柔軟性を持ちながら、機密性の高いデータをオンプレミス環境で管理できるハイブリッドクラウド環境をサポートしている。IBM以外のデータベース製品とも連携できる。オープンなアーキテクチャーとデータ形式を採用することで、既存のIT資産を生かして導入可能だ。

 「watsonx.data Premiumはクラウド、オンプレミス、ハイブリッドクラウドいずれの利用形態でも使えます。データの大部分はクラウドに保存し、秘匿したいデータだけオンプレミスに保存して両方をAIに参照させる運用が可能です。お客さまのニーズに合わせて構築パターンをご提案します」(川上氏)

 クエリエンジンを使い分けることで、パフォーマンスとコストのバランスを維持できる点も特徴だ。「AIが参照する膨大な量のデータを処理するには、強力な計算処理が必要です。watsonx.dataは複数のクエリエンジンに対応しています。『大量のデータをリアルタイムで処理したい』というニーズには高性能なエンジンを、『バッチ処理でいいからコストを抑えたい』というニーズにはそれに見合うエンジンをご提案します」(川上氏)

 PoCから本番運用に移行する上で壁になりがちなのがセキュリティーやガバナンスだ。「閲覧権限がないデータにAIエージェント経由でアクセスできてしまう」といったインシデントが起きる可能性がある。watsonx.data Premiumは、データの出どころや品質を管理する機能によってこの課題に対応する。

 「非構造化データが保存されている『Box』『Microsoft SharePoint』などのサービスのアクセス制御情報(ACL)を、watsonx.data Premiumに反映させられます。AIエージェント利用者の権限に合わせて検索結果を制御し、機密情報の漏えいを防ぎます」(岡口氏)

文書を自動読み取り+ノーコードで処理

 watsonx.data Premiumの機能の中でも特に注目すべきなのが「watsonx.data integration」による高度なデータ取り込みプロセスだ。

 非構造化データからテキストや画像を抽出してRAGに使う際、これまではデータの形式に応じた開発が必要だった。watsonx.data integrationはAIによる自動処理機能を備えており、請求書や運転免許証といった定型フォーマットの書式をAIが認識し、レイアウトや表の構造、文章の構造を理解して必要な項目を抽出するためのジョブフローをノーコードで生成する。日本固有の文書にも対応可能であることが確認されている。

 photo 従来のRAGにおける課題(提供:日本IBM)《クリックで拡大》

 watsonx.data integrationは、テキストを拾うだけでなく「ページのレイアウト」「表の構造」「値とその意味」などを理解してデータを抽出できる。「請求書から抽出した単価や合計金額を数値データとして扱い、SQL文による集計処理をAIに実行させるといった高度な業務自動化が可能です」(岡口氏)

 抽出したデータにAIで意味付けする「watsonx.data intelligence」も用意されている。IBMのデータカタログ製品を非構造化データに対応させたもので、抽出したデータをLLM(大規模言語モデル)が読み取り、メタデータを自動生成する。抽出したデータとメタデータをAIに参照させることで、RAGの精度を向上させられる。

 watsonx.data Premiumを用いてRAGを実装する際は、ベクトル化したデータの類似性に基づいた「ベクトル検索」に加え、製品名や部品番号などのキーワード検索を組み合わせたハイブリッド検索も利用できる。

 ドキュメント間の関連性を考慮して検索する「グラフRAG」にも対応している。製品仕様書と検査報告書をセットで参照しなければ答えられないような複雑な問いに対しても、的確に回答できる。

 2025年に買収したDataStaxの「Cassandra」ベースの技術を活用して、「人手による複雑な定義やインデックス作成の手間をかけなくても高い精度を実現します」と岡口氏はアピールする。

 さらに、今後リリース予定の「OpenRAG」は、検索だけでなく必要に応じてLLMがツールや情報源を状況によって使い分け、複数ステップで問題を解決する“エージェンティック RAG”である。

 OpenRAGは、Docling、Langflow、OpenSearchといったOSSの統合スタックとして公開されており、watsonx.dataの一機能として提供が予定されている。つまり、OSSとして柔軟に使いながら、エンタープライズ品質でも利用が可能になる。「“複雑な質問にも高精度で答えられるRAG”という意味で、AIエージェントの導入において重要な要素になっていくでしょう」と岡口氏は語る。

photo watsonx.dataでOpenRAGを提供する予定(提供:日本IBM)《クリックで拡大》

ビジネスの未来を託せるデータ基盤かどうかが問われる

 AI-Readyのデータ基盤を整えることでAIエージェントを安全かつ効果的に導入できるようになり、業務効率化を加速させられる。「AIエージェントの導入は『単なるツールの導入』ではなく、『働き方の変革』そのものです。AIエージェントを入れた業務一つ一つの効果が小さかったとしても、積み重ねることで組織全体の生産性を大きく向上させられます」と岡口氏は言う。

 そのためには、AIエージェントをいかに効率良く構築し、精度の高いデータをAIに提供し続けられるかが鍵となる。

 「日本IBMは、製品を発売する前に自社で使い、お客さまの役に立つかどうかを検証する『クライアント・ゼロ』の考え方を徹底しています。すでに多数のAIエージェントを導入済みです。watsonx.data Premiumも自社で徹底的に使い込んでおり、当社のユースケースではAIの回答精度が40%向上しました。この実績をベースに、お客さまの事情に応じたカスタマイズに対応できるのが当社の強みです」(川上氏)

 AIエージェントを業務プロセスに組み込めるかどうかが、ビジネスの競争力を左右する時代が迫っている。AIの性能を最大限に引き出し、独自の価値を生み出す源泉が「データ」であることは明らかだ。

 膨大な量のデータの品質を保ち、ガバナンスを効かせた状態で扱える基盤が求められる。ユースケースによっては、「オンプレミスとクラウドをまたいで利用できること」「技術の進化に柔軟に対応できるオープンな技術をベースにした基盤を採用すること」が重要な製品選定ポイントになる。

 watsonx.data Premiumは、AI時代のニーズに応えるためにIBMの既存技術をアップデートした製品だ。データガバナンスとオープンな技術を兼ね備えた同製品は、AIエージェントの本格的な導入を検討する企業にとって、信頼性の高いデータ活用を実現する基盤の選択肢の一つとなるだろう。

photo

Copyright © ITmedia, Inc. All Rights Reserved.


提供:日本アイ・ビー・エム株式会社
アイティメディア営業企画/制作:ITmedia エンタープライズ編集部/掲載内容有効期限:2026年4月22日