ITmedia NEWS > 社会とIT >
ITmedia AI+ AI活用のいまが分かる

生成AIはデータ活用の“救世主”──その前に立ちはだかる課題とは? 日本テラデータが講演

» 2023年11月16日 12時00分 公開
[松浦立樹ITmedia]

 生成AIはデータ活用の救世主になる──データ分析サービスを提供する日本テラデータ(東京都港区)が開催したイベント「Data Analytics Forum 2023」にて、そんな発言が飛び出した。発言したのは、同社の高橋倫二代表取締役社長(高ははしごだか)。生成AIは大きなビジネスチャンスを秘めているが、その前には解決せねばならない課題が立ちふさがる。

高橋倫二代表取締役社長

 高橋社長は「データは、AIを活用してイノベーションを起こすための原動力となる」と指摘する。その根拠の一つが「RAG」(Retrieval Augmented Generation:検索拡張生成)と呼ばれる技術だ。これは検索ベースと生成ベースのAIモデルの長所を組み合わせた技術で、大規模言語モデルと外部データベースをひも付ける場合などに使われる。

RAGの仕組み

 RAGを使った生成AIは、外部データベースから必要な情報を検索し、それに基づき適切な回答を生成できるようになる。なぜこのような技術が必要になるかというと、生成AIに使われる大規模言語モデルはモデル作成時の情報しか学習していないため、最新の情報が分からない。また、パブリックなデータしか学習していないため、自社の売り上げなどの機密情報は与えられていない。これらの問題を解決できるのがRAGというわけだ。

 RAGを使い、自社の情報を学習させた“自社GPT”を開発できれば「前年度の売上を出して」「企画書を作成して」などとAIに指示するだけで、瞬時にそれらのタスクを遂行してくれる環境を実現できる。このため、生成AI×データ活用が与えるビジネスインパクトは大きく、米マッキンゼー・アンド・カンパニーは「AIによる潜在的経済効果は約25.6兆ドル(約3800兆円)に及ぶ」と予測しているという。

AIによる潜在的経済効果は約25.6兆ドル(約3800兆円)に及ぶという指摘も

 しかし、高橋社長は「その前には解決しなければならない、さまざまな課題がある」と指摘している。

増え続ける世界中のデータ、2025年には“1兆GB”に

 1つ目の課題として挙げたのは、データを取り巻く環境の変化だ。アクセンチュアの調査では、2025年には世界中で年間180ZB(ゼタバイト、1ZB=10億TB=1兆GB)のデータが生み出されるようになると指摘している。 高橋社長は「この値をハイビジョン映像に置き換えると、65億年分というとてつもない大容量になる」と説明する。

25年には世界中で年間180ZBのデータが生み出されるようにという試算も

 また企業内のデータのうち、実際のデータの代替として、生成AIなどによって生み出されたデータが30%を占めるようになるとの予測も。このことから、高橋社長は「生成AIがデータ量の増加を飛躍的に加速させる」とし「データのサイロ化も進み、多くの企業は、今目の前にあるデータがどこで発生したデータなのか、 自信を持って回答できなくなるのでは」と指摘している。

 テラデータと米Forbesでも、データ活用に関する共同調査を実施。回答者の約3分の1が「AIでデータ活用する際、データセキュリティやプライバシー、 コンプライアンスの確保が課題」と答え、約4分の1が「大容量かつ多様になっているデータの管理や、サイロ化しているデータの統合、 データの品質を確保することが課題」と回答した。データの量が今後増えていくと予測されることから、高橋社長は「これらを達成するのは簡単ではなくなる」と予想する。

データを取り巻く主要課題

日本は“データサイエンティスト”が足りない

 データ以外にも、日本固有の課題として「データサイエンティストの不足がある」と高橋社長は指摘する。情報処理推進機構(IPA)の調べでは、回答した企業の72%が「データサイエンティストが不足している」と回答したという。

 「この点について当社は、ひときわ危機感を持ってこの課題を見ている。テラデータは日本以外にも、米国や欧州の顧客のデータ活用も支援してきたが、欧米ではデータサイエンティストが100人規模でいる企業が多く、中には1000人規模の場合もある。一方、日本では多くの企業では数人から数十人、 多くても100人程度が現状」(高橋社長)

データサイエンティスト不足は日本固有の課題

 このことから、同社の海外支部からは「日本は(データ活用において)5年は遅れているのではないか」と指摘されることもあるという。テラデータではこの課題を解決するために、データサイエンティストの業務効率化を実現できる製品を展開し「データ活用の障壁を低くし、データ活用の民主化も実現をしていく」(高橋社長)と意気込みを語った。

テラデータの提供するプロダクトについて

Copyright © ITmedia, Inc. All Rights Reserved.