検索
特集

1億3000万会員のデータ基盤「パンク寸前」の危機を救ったエンジニアの“地道な改革”SNOWFLAKE WORLD TOUR TOKYO 2025

1億3000万会員を擁する「Vポイント」のビッグデータ基盤はいかにして再構築されたのか。CCCMKホールディングスが5年かけて実現したSnowflakeへの統合とAI活用の実践について解説する。

PC用表示 関連情報
Share
Tweet
LINE
Hatena

 1億3000万人の会員数を誇る「Vポイント」サービス。CCCMKホールディングスはその膨大なデータを活用し企業のマーケティングを支援する。

 2025年9月11日に開催された「SNOWFLAKE WORLD TOUR TOKYO 2025」に、同社のテクノロジー戦略本部の松井太郎氏(本部長)、三橋正浩氏(エンジニアリング部 分析基盤グループ グループリーダー)、三浦諒一氏(チーフAIエンジニア)が登壇し、データ基盤の大規模な刷新とAI活用の取り組みについて解説した。

事業の根幹を支えるデータ基盤の危機と再生

 CCCMKホールディングスは年間7000万人が利用するVポイントのデータを基に、顧客インサイトの可視化やターゲティング、販促支援などのマーケティングサービスを提供する。2020年頃、同社のデータ基盤は深刻な課題に直面していたという。


CCCMKホールディングス 松井太郎氏(出典:筆者撮影)

 「ワークロード増加によるデータベースのパンク、アナリストの増加によるクエリ負荷の激増、容量問題によるサイロ化などの課題があり、事業そのものを毀損(きそん)するような状況でした」と松井氏は当時を振り返る。

 ハイブリッドクラウドで構築された基盤はデータ量の増加に対応できず、用途別に5つのデータベースに分散していた。それぞれのデータベースが個別に構築され、多重コスト化も進んでいた。この状況を打開すべく、同社は5年をかけてデータベースの段階的な統合を実現した。その結果、性能は従来の2倍以上に向上し、コストは半分以下に削減することに成功した。

 データベースの統合は周辺アプリケーションへの影響も大きく、検討事項が多い「重い」作業だ。同社エンジニアらはどのようにこの問題に対峙したのだろうか。


データ分析基盤の全体像(出典:CCCMKホールディングスの講演資料。筆者撮影)

 現在の分析基盤は、ポイントデータやアライアンス企業からのデータを「Snowflake」に集約し、メダリオンアーキテクチャ(※)でデータマートを整備したものだ。データアナリストやデータサイエンティストを含む600人を超える従業員が、ダッシュボードやKPI管理、アドホック分析、AI/機械学習などの用途で活用している。

(※)メダリオンアーキテクチャとは「ブロンズ」「シルバー」「ゴールド」の3層に分けてデータを整理する手法。ローデータを構造化したものがブロンズ、ブロンズをクリーニングし重複や欠損をなくしたものがシルバー、シルバーを結合、整理し、ユーザーが利用できる形に仕上げたものがゴールドとされる。

データマネジメントの地道な改革がAI活用の基盤に


CCCMKホールディングス 三橋正浩氏(出典:筆者撮影)

 データベース統合を進めるに当たってはインフラの統合だけでなく、データマネジメントの改革にも注力した。三橋氏は「データドリブンな意思決定を実現するには、信頼できるデータ基盤が不可欠です。そのためには地道な活動の積み重ねが重要でした」と強調する。

 まず取り組んだのはデータマート整備だ。長年引き継がれてきた仕様不明の「秘伝のデータマート」や、属人化した「俺の最強データマート」的なものが乱立していた状況を、共通基盤スキーマとアドホック分析スキーマに明確に分離した。共通基盤スキーマはエンジニア5人で運用し、統一仕様のデータマートを整備。アドホック分析スキーマは約100人のデータアナリストが自由に作成できる環境とし、3カ月間利用がないテーブルは自動で削除する仕組みにした。

 メタデータも充実させた。全てのメタデータをデータカタログシステムからSnowflakeに移行し、開発時に必ず登録させる仕組みを構築した。三橋氏は「AIが理解できる情報をそろえるには、さらにAIに優しいデータマートとセマンティックモデルの構築が必要です」と、“AI-Ready”な基盤への進化の必要性を指摘する。

 データ連携の内製化も大きな成果を生んだ。ベンダーに依存していたデータ連携をETLツールの導入によって内製化した。ファイルフォーマットや連携仕様の調整が不要なSnowflakeの「Data Sharing」(アカウント間でオブジェクトを共有する機能)を積極的に活用して、データ連携まわりの開発工数を大幅に削減した(ちなみにこの取り組みはSnowflake社の中でも注目を集め、2025年の「Snowflake Japan Data Drivers Awards」で「Data Collaboration賞」を獲得している)。

 データプロダクト化の取り組みも進んでいる。同社が開発した家計簿アプリ「レシーカ」のデータをSnowflakeマーケットプレイスに公開。今後はパートナー向けに、「Streamlit」を活用した「ポータブルウェアハウス」や「Native Apps」によるサブスクリプション型データサービスの提供も計画している。

マルチエージェント構成で実現する高度なAIサービス


CCCMKホールディングス 三浦諒一氏(出典:筆者撮影)

 整備したデータ基盤を土台に、同社はAIエージェントの開発を本格化させている。三浦氏は「データ基盤の統合、メタデータの整備、適切なアクセス制限によって、人もAIも安全かつ効率的にデータを利用できる環境が整いつつあります」と説明する。

 実際に同社は既にマルチエージェント構成のAIサービスを開発している。スーパーバイザーエージェントがユーザーからの指示を解析し、サブタスクに分割。それぞれのタスクに最適なエキスパートエージェントを呼び出して処理を実行する。


自然言語でのデータ分析を可能にするマルチエージェントシステムの全体像(出典:CCCMKホールディングスの講演資料。筆者撮影)

 エキスパートエージェントには、Snowflakeのデータから必要な情報を取得するTableエージェント(「Cortex Analyst」使用)、マニュアルや提案書から関連情報を検索するDocumentエージェント(「Cortex Search」使用)、最終的にユーザーの要求に応じたフォーマットで回答を生成するWriterエージェントの3種類がある。

 「機能を追加したい時は新しいエキスパートエージェントを追加すれば良く、特定の機能を改善したい時はそのエージェントだけを修正すれば済みます。拡張性と保守性を両立できる構成です」と三浦氏は利点を強調する。

 講演ではその活用例として、カスタマーサポート向けのメール作成支援や、自然言語によるデータ分析サービスの紹介があった。営業担当者が「ブランドAの品目別購入金額をグラフにして」と入力すれば、SQL文を書かなくてもグラフが生成され、インサイトのレポートまで作成される。「Microsoft Teams」と連携したチャットbotも開発し、過去のやり取りや現在進行中のキャンペーン情報をデータベースから取得し、電子メール形式にフォーマットして提供する機能も実装した。

 AIの回答精度向上を目指す取り組みとして、セマンティックモデルの改善にも注力した。自社固有の用語の説明を明記したり、会員IDを「ユーザー」や「顧客ID」と呼ぶ場合に対応するために別名を設定したり、合計金額の計算式を明記したりするなど、AIがより正確にSQL文を生成できるよう工夫した。

 Snowflakeが2025年8月から提供する「AI PARSE_DOCUMENT」を使い、日本語ドキュメントの処理もSnowflakeで完結できるようになった。「画像やドキュメントなど、非構造化データもSnowflakeに取り込めるようになりました。あらゆるデータをSnowflakeに取り込んで、AIで活用できる世界を目指します」と三浦氏は展望を語った。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る