CxO Insights

「生成AI×RAG」の効果と課題は? 実装しないと「競争力を保てない」これだけの理由(1/2 ページ)

» 2024年10月11日 09時38分 公開
[武田信晃ITmedia]

 生成AIの普及によって、外部情報の検索を組み合わせて回答精度を向上させる「RAG」(検索拡張生成)は、IT業界のトレンドになっている。ただ、実際にRAGをどのように活用すればいいのか理解している企業は、多いとはいえない。

 Linuxに代表されるオープンソースソフトウェアを活用したシステムインテグレーションを原点とし、SaaSの販売などを手掛けるサイオステクノロジー(東京都港区)は、オランダに本社を置き、分析エンジンなどを手掛けるElastic社の子会社であるElasticsearch社と提携した。Elasticが世界で提供している「サーチ」「セキュリティ」「オブザーバビリティ」の3つのソリューションについて、日本での展開を始めている。特に「サーチ」については、生成AIと組み合わせたRAGへの適用が注目されているところだ。

 サイオステクノロジーは、ワンストップでRAGの活用を支援する「RAG構築支援コンサルティングサービス」を提供している。今後の「生成AI×RAG」の展望や効果、課題は何か。同社の喜多伸夫社長、青木稔執行役員、村田龍洋DX Product & Integrationエグゼクティブマネージャーの3人に聞いた。

サイオステクノロジーの喜多伸夫社長

なぜRAGを活用しないと競争力を保てないのか?

 生成AI活用での大きな問題は、生成AIが間違った情報を出力してしまうハルシネーション(幻覚)にある。これが発生する背景には、現在普及している生成AIが公開情報しか学習していないため、データに偏りがあったり、古かったり、そもそも学習させたデータが少なかったりするなどの原因があり、この課題の改善策の一つとしてRAGがあるのだ。

 検索拡張生成と訳されるRAGは、LLM(大規模言語モデル)のテキスト生成に、例えば、非公開としている社内情報など信頼性の高い外部情報の検索を組み合わせることによって、ハルシネーションの発生する確率を下げられる。そのような生成AI×RAGの環境を構築するサービスを提供するのが、サイオステクノロジーがElastic Search AI Platformを用いて生成AIの精度を向上させる「RAG構築支援コンサルティングサービス」だ。

 プロセスは3段階に分かれている。

フェーズ1:「導入プラン作成支援」=ユーザーの生成AI導入目的などをヒアリングし、利用すべきデータソースの課題や制限などを把握。全体設計からスケジュールを策定する

フェーズ2:「PoC支援」=全体設計からRAGに必要なPoC環境を構築。検索手法などの評価、最終的な目的に沿った回答を得られているか評価検証を実施

フェーズ3:「導入支援」=PoCで得られた結果を基にElastic Search AI Platformを利用する本番環境の設計から本番環境構築を支援し、運用のためのトレーニングを実施

「RAG構築支援コンサルティングサービス」の概要図

 同サービスを提供した狙いを喜多社長に聞くと「全体として強いニーズがあります」と話す。確固とした市場があり、ビジネスチャンスを見いだせたということだろう。喜多社長は、まずRAGへの理解を深めてもらう施策を実施しているという。

 「まずはRAG導入に関するブログを公開して理解促進に努めています」

 新技術ということもあり、まだまだ生成AIの導入に慎重な企業も少なくないようだ。

 「データの質が課題となっていますね。最新データが学習されていないなど情報が古めなのです。仮にChatGPTと有料契約をしても、社内の機密情報などの学習は含まれません。一方で、会社に必要な多様なニーズに対応する上で、社内にある膨大な情報や機密情報まで学習範囲を広げることによって、生成AIの力を最大化させたい会社もあります。大企業で、その傾向は強いと感じます」

 青木執行役員は「大規模データを持つ会社が、サービスを導入する事例が多くなると思います。一つのことについて何千、何万というデータの中から、必要な情報を検索して調べるのは手間がかかりますし、時間的にもったいないですから」と説明する。

 では中小企業や、実は高い技術を持つ町工場のような会社はどうなのか。青木執行役員は「導入する町工場もあるとは思いますが『紙のマニュアルで十分』という企業も依然として数多くあると思います。そういう企業は、現時点ではまだ難しいでしょう」と話し、町工場レベルでは、もう少し導入が先になるという見方を示した。

 青木執行役員は、RAGを使うことによってハルシネーション対策に効果があることも強調する。

 「生成AIは、過去1、2年前までのデータを基本にしていますので、一般的に使うだけならよいと思います。しかし、RAGを活用して社内にある最新データも連携させれば、情報の質が上がります。ハルシネーションを減らせるようになります」

システム構築にはノウハウがいる

 自社で社内情報を生成AIに学習させることはできる。ただそれだけで簡単に運用できるわけではない。喜多社長は「例えば、社内のデータを学習させるとしても、実際に社員が利用する際には、膨大なデータの中から必要な情報を抽出して、回答するための設計をする必要があり、それには多くの時間がかかるのです。チューニングするのも簡単ではありません。ノウハウが必要で、構築には少なくとも3〜4カ月はかかります」

 同社では1つの事例を提示している。厚生労働省の「モデル就業規則」についてRAGを利用して「タバコに関する注意事項はありますか?」という質問を3種類の検索手法で実行した。すると“キーワード検索”では「すみません、分かりません」という回答がなされ、“ベクトル検索”では、法律的な角度からの注意事項が表示された。“ハイブリッド検索”では「見つからない」と回答した上で、安全に関する答えも表示された。タバコの話ひとつをとっても検索方法によって回答が異なるわけで、生成AIの活用体制を企業向けに構築する難しさは、これで想像できる。

サイオステクノロジーの資料より

 つまるところ「生成AIx RAG」の体制は、企業ごとにオーダーメイドで構築する必要があるということだ。青木執行役員は「いかにしてその企業に最適化するのかが大きなカギです」と話す。

サイオステクノロジーの村田龍洋DX Product & Integrationエグゼクティブマネージャー(左)と青木稔執行役員
       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

SaaS最新情報 by ITセレクトPR
あなたにおすすめの記事PR