検索
Special

RAG導入に、高額なPoCはもう要らない AI inside が「構造化」で解き明かす、AI活用の“本当の”第一歩

PC用表示
Share
Tweet
LINE
Hatena
PR

 生成AIは、自然言語による対話で手軽に利用でき、精緻な文章作成や高度なアイデア出しも可能なことからビジネス活用への期待が急速に高まっている。しかしChatGPTに代表される汎用(はんよう)LLM(大規模言語モデル)の知識は、インターネット上の情報を主とした、あらかじめ学習させた膨大な公開データを知識の源泉としている。そのため、企業の内部情報や業界に特化したドメイン知識といった非公開情報に基づいた回答は原理的に生成できない。

RAGのPoCで思うような精度を出せないのはなぜか?

 解決策として注目されているのが「RAG」(検索拡張生成)だ。LLMが学習していない企業内部の情報などを外部データベースから参照し、回答に反映させる仕組みを指す。RAGを用いれば汎用LLMを自社業務に特化させられることから、多くの企業が実用化に向けたPoC(概念実証)に取り組んでいる。

 中にはPoCで高い成果を挙げてRAGの本格導入に進む企業もあるが、実際には期待していたレベルの精度をなかなか達成できず本格導入に至っていないケースが大半を占める。このRAG活用の壁について、AI inside の代表取締役社長CEO 渡久地択氏は、多くの企業が「表面的な課題」にとらわれていると指摘する。同氏が語る、顧客からよく聞くという課題はこうだ。

photo
渡久地択氏(AI inside 代表取締役社長CEO)

 「RAGのPoCがうまくいかない理由を聞くと、大抵3つの答えが返ってきます。『そもそも社内に利用できるデータがない』『データはあるが、RAGに使える形に整備されていない』『整備できても、メンテナンスが難しい』というものです」

 こうした課題を前に、多くの企業はデータの準備に追われている。RAGで利用するデータを収集・管理する基盤を整え、手作業でデータをクレンジングするといった多大な工数と時間をかけた取り組みも珍しくない。しかし渡久地氏は、「データ不足やデータ品質の問題は、本質的な課題ではありません。本当は“構造化”さえ適切に行っていれば、データの整備やクレンジングに時間やコストをかける必要はないのです」と言い切る。

“データの構造化”でRAGの精度・運用性は飛躍的に向上

 同氏が言う構造化とは、RAGに用いるデータの中に含まれている情報をAIが解釈しやすいように「意味」を正しく与えた状態に整理することを指す。この構造化を正しく行わないままで、やみくもに雑多なデータをRAGに投入しても精度の高いアウトプットは期待できない。

 データの「構造化」は、RAG活用の成否を分ける重要なプロセスだと渡久地氏は強調する。もちろん、CSVファイルのように項目や形式が決まっている定型データであれば、その処理は比較的容易だ。しかし企業が生成AIで活用したいのは、形式がバラバラな報告書や図面、マニュアルといった非定型、つまり「非構造化データ」のはずだ。AIがこれらを正しく理解するためには、単に文字を読み取るだけでなく、どこに何が書かれているかという「構造」を正確に読み解くための高度な技術が求められる。

RAGの生成、運用、利用を一気通貫でサポートする「Leapnet」

 渡久地氏率いるAI inside は、まさにこの「非構造化データの構造化」の技術を創業以来ひたすら磨いてきた。同社の祖業であり、AI-OCRを搭載した書類管理サービス「DX Suite」で培った膨大な資産がその証しだ。

 「当社はもともと、非構造化データを読み取るAI-OCRサービス『DX Suite』を主力プロダクトとしてきました。このサービスの提供を通じて、100億にも及ぶデータ化実績を蓄積してきました。これらのノウハウを用いて開発した独自LLM『PolySphere』は、結果的に日本企業に特有の帳票類をはじめとする非構造化データの構造を読み取ることに極めて長(た)けたものになっています」

 AI inside が蓄積してきたナレッジとノウハウを結集させた、集大成とも言える新サービスが「Leapnet」だ。Leapnet は、ノーコードでRAGを活用したAIエージェントを作れるサービスで、社内向けFAQチャットbotなどを簡単に作成できる。

 Leapnet が持つ優位性は大きく分けて3つある。

 1つ目は「超高精度な頭脳」だ。PolySphere の最新バージョン「PolySphere-4」は雑多な非構造化データの内容を99.6%の精度で読み取れるという。企業の帳票などのデータはインターネット上に公開されていないため、汎用LLMを用いたAI-OCRでは高い精度は期待できない。これに対してAI inside は、長年の知見でこの課題を克服した。

 2つ目に「品質管理の自動化」がある。同社は独自開発した「Critic Intelligence」をLeapnet にも適用する。これは、RAGが常に最新かつ正確な情報を参照できるように知識をメンテナンスするAIだ。この仕組みにより、実務で安心できる品質を維持するという。

 AI inside は、PolySphere による高精度な読み取り技術とCritic Intelligence による知識メンテナンスを組み合わせ、RAGが参照するデータの品質を最適化している。このため、Leapnet に投入するデータの選別やクレンジングといった作業は「ほぼ不要になる」と渡久地氏は語る。

 「多くの人が、かつて機械学習モデルを構築した際の『学習データの品質がRAGの精度にも直結する』というイメージを持っているように思います。しかしRAGのデータはモデルに直接学習させるわけではなく、LLMが回答を生成する際の参考データとして使われるものです。データの構造化さえ済んでいれば、その内容に多少の誤りが含まれていても必要以上に引きずられることはなく、LLMが適切に判断して正しい回答を生成してくれます」

photo
DX Suite とLeapnet によるデータ活用イメージ(提供:AI inside)《クリックで拡大》

 3つ目は「使いやすさ」だ。Leapnet は、DX Suite が多種多様な非構造化データを自動で構造化してデータベースに格納する。この処理のためにユーザーがプログラムを記述したり、複雑な設定をしたりする必要はない。GUIツールでフォルダを作成し、その中にRAGに使いたいファイルをドラッグ&ドロップするだけで準備完了だ。

 ドラッグ&ドロップでRAGを作成した後、プロンプトを記述するだけでAIエージェントと外部から呼び出すためのAPIが自動生成される。後は、外部アプリケーションからこのAPIを呼び出すことで、RAGを活用した生成AIアプリケーションを素早く簡単に作成できる。

 渡久地氏がLeapnet のユースケースの一つとして挙げたのは、製造現場の例だ。過去に起きた不具合情報やその対応内容をまとめたドキュメントをLeapnet にアップロードし、不具合の対応方法を教えてくれるAIエージェントを作る。こうすれば、新たな不具合が発生してもAIが対応方法を教えてくれる環境を構築できる。

 Leapnet は、PDFなどのドキュメントだけでなく画像や動画を扱うことも可能だ。そのため、建物の外壁の写真をアップロードして補修の要否を判断させるなど、マルチモーダルなAIエージェントも作成できる。

 「Leapnet を先行利用している企業は、建物の外壁補修費を算出するSaaSにLeapnet で生成したAIエージェントを組み込んでいます。データソースとしてヒビやサビなどの不具合事例をAIに参照させて『不具合を検知するAIエージェント』を作っていました。これを活用して、現場で撮った動画をアップロードするだけでAIが補修の要否を判断してくれる仕組みを構築しています」

人手もコストもかけずにRAGの構築・運用に乗り出せる

 Leapnet の利用料金は、APIを外部アプリケーションから呼び出した際の処理時間によって決まる。処理時間30秒当たり50円を予定しているが、これ以外には一切料金が発生しない。どれだけ大規模なRAGデータベースを構築しても、あるいは大量のAIエージェントを作成しても、追加料金はかからない。

 ここまでの話から分かるように、これまで多くの工数を要していたRAGの構築や運用作業のほとんどが不要になるため、時間やコストをかけずに素早くRAGを立ち上げて運用できるようになる。

 「従来のRAGのPoCには『データ準備とクレンジング』『RAGデータベースの構築』『テストデータの用意と評価』などの多段階のプロセスが必要であり、膨大な手間が掛かっていました。しかしLeapnet ならその大半が不要です。言ってしまえば、PoCという概念自体が過去のものになる――と当社は考えています」

 依頼があれば、AI inside の技術者がPoCプロジェクトの支援に入ることも可能だ。しかしLeapnet を使えば、わざわざPoCをプロジェクト化して予算や期間を確保するまでもなく、ほんのわずかな人手と時間でRAGを試すことができる。コストも最小限に抑えられるため「とにかく手軽に試してみてほしい」と渡久地氏はその利用価値の高さを強調する。

 「日本企業は膨大なデータや知見という“宝”を持っていますが、それを価値に変える手段がありませんでした。Leapnet はその『知』を解放し、企業の成長、ひいては日本の産業競争力の強化に貢献できると信じています。それは当社のパーパスである『AIで人類の進化と人々の幸せに貢献する』ことにもつながります。まずはLeapnet で日本の企業を強くし、その先で人類全体の進化にもAI技術で貢献したいと考えています」

 これまでRAG活用の成否を分けてきた、非構造化データの構造化という課題。AI inside が新たに提示するLeapnet は、その高いハードルを乗り越えるための具体的で新しい選択肢だ。

 PoCでつまずいていた企業も、データ準備の工数に頭を悩ませていた担当者も、まずはその手軽さからAI活用の次の一歩を検討してみてはいかがだろうか。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:AI inside株式会社
アイティメディア営業企画/制作:ITmedia AI+編集部/掲載内容有効期限:2026年1月9日

ページトップに戻る