1億3000万会員のデータ基盤「パンク寸前」の危機を救ったエンジニアの“地道な改革”:SNOWFLAKE WORLD TOUR TOKYO 2025
1億3000万会員を擁する「Vポイント」のビッグデータ基盤はいかにして再構築されたのか。CCCMKホールディングスが5年かけて実現したSnowflakeへの統合とAI活用の実践について解説する。
1億3000万人の会員数を誇る「Vポイント」サービス。CCCMKホールディングスはその膨大なデータを活用し企業のマーケティングを支援する。
2025年9月11日に開催された「SNOWFLAKE WORLD TOUR TOKYO 2025」に、同社のテクノロジー戦略本部の松井太郎氏(本部長)、三橋正浩氏(エンジニアリング部 分析基盤グループ グループリーダー)、三浦諒一氏(チーフAIエンジニア)が登壇し、データ基盤の大規模な刷新とAI活用の取り組みについて解説した。
事業の根幹を支えるデータ基盤の危機と再生
CCCMKホールディングスは年間7000万人が利用するVポイントのデータを基に、顧客インサイトの可視化やターゲティング、販促支援などのマーケティングサービスを提供する。2020年頃、同社のデータ基盤は深刻な課題に直面していたという。
「ワークロード増加によるデータベースのパンク、アナリストの増加によるクエリ負荷の激増、容量問題によるサイロ化などの課題があり、事業そのものを毀損(きそん)するような状況でした」と松井氏は当時を振り返る。
ハイブリッドクラウドで構築された基盤はデータ量の増加に対応できず、用途別に5つのデータベースに分散していた。それぞれのデータベースが個別に構築され、多重コスト化も進んでいた。この状況を打開すべく、同社は5年をかけてデータベースの段階的な統合を実現した。その結果、性能は従来の2倍以上に向上し、コストは半分以下に削減することに成功した。
データベースの統合は周辺アプリケーションへの影響も大きく、検討事項が多い「重い」作業だ。同社エンジニアらはどのようにこの問題に対峙したのだろうか。
現在の分析基盤は、ポイントデータやアライアンス企業からのデータを「Snowflake」に集約し、メダリオンアーキテクチャ(※)でデータマートを整備したものだ。データアナリストやデータサイエンティストを含む600人を超える従業員が、ダッシュボードやKPI管理、アドホック分析、AI/機械学習などの用途で活用している。
(※)メダリオンアーキテクチャとは「ブロンズ」「シルバー」「ゴールド」の3層に分けてデータを整理する手法。ローデータを構造化したものがブロンズ、ブロンズをクリーニングし重複や欠損をなくしたものがシルバー、シルバーを結合、整理し、ユーザーが利用できる形に仕上げたものがゴールドとされる。
データマネジメントの地道な改革がAI活用の基盤に
データベース統合を進めるに当たってはインフラの統合だけでなく、データマネジメントの改革にも注力した。三橋氏は「データドリブンな意思決定を実現するには、信頼できるデータ基盤が不可欠です。そのためには地道な活動の積み重ねが重要でした」と強調する。
まず取り組んだのはデータマート整備だ。長年引き継がれてきた仕様不明の「秘伝のデータマート」や、属人化した「俺の最強データマート」的なものが乱立していた状況を、共通基盤スキーマとアドホック分析スキーマに明確に分離した。共通基盤スキーマはエンジニア5人で運用し、統一仕様のデータマートを整備。アドホック分析スキーマは約100人のデータアナリストが自由に作成できる環境とし、3カ月間利用がないテーブルは自動で削除する仕組みにした。
メタデータも充実させた。全てのメタデータをデータカタログシステムからSnowflakeに移行し、開発時に必ず登録させる仕組みを構築した。三橋氏は「AIが理解できる情報をそろえるには、さらにAIに優しいデータマートとセマンティックモデルの構築が必要です」と、“AI-Ready”な基盤への進化の必要性を指摘する。
データ連携の内製化も大きな成果を生んだ。ベンダーに依存していたデータ連携をETLツールの導入によって内製化した。ファイルフォーマットや連携仕様の調整が不要なSnowflakeの「Data Sharing」(アカウント間でオブジェクトを共有する機能)を積極的に活用して、データ連携まわりの開発工数を大幅に削減した(ちなみにこの取り組みはSnowflake社の中でも注目を集め、2025年の「Snowflake Japan Data Drivers Awards」で「Data Collaboration賞」を獲得している)。
データプロダクト化の取り組みも進んでいる。同社が開発した家計簿アプリ「レシーカ」のデータをSnowflakeマーケットプレイスに公開。今後はパートナー向けに、「Streamlit」を活用した「ポータブルウェアハウス」や「Native Apps」によるサブスクリプション型データサービスの提供も計画している。
マルチエージェント構成で実現する高度なAIサービス
整備したデータ基盤を土台に、同社はAIエージェントの開発を本格化させている。三浦氏は「データ基盤の統合、メタデータの整備、適切なアクセス制限によって、人もAIも安全かつ効率的にデータを利用できる環境が整いつつあります」と説明する。
実際に同社は既にマルチエージェント構成のAIサービスを開発している。スーパーバイザーエージェントがユーザーからの指示を解析し、サブタスクに分割。それぞれのタスクに最適なエキスパートエージェントを呼び出して処理を実行する。
エキスパートエージェントには、Snowflakeのデータから必要な情報を取得するTableエージェント(「Cortex Analyst」使用)、マニュアルや提案書から関連情報を検索するDocumentエージェント(「Cortex Search」使用)、最終的にユーザーの要求に応じたフォーマットで回答を生成するWriterエージェントの3種類がある。
「機能を追加したい時は新しいエキスパートエージェントを追加すれば良く、特定の機能を改善したい時はそのエージェントだけを修正すれば済みます。拡張性と保守性を両立できる構成です」と三浦氏は利点を強調する。
講演ではその活用例として、カスタマーサポート向けのメール作成支援や、自然言語によるデータ分析サービスの紹介があった。営業担当者が「ブランドAの品目別購入金額をグラフにして」と入力すれば、SQL文を書かなくてもグラフが生成され、インサイトのレポートまで作成される。「Microsoft Teams」と連携したチャットbotも開発し、過去のやり取りや現在進行中のキャンペーン情報をデータベースから取得し、電子メール形式にフォーマットして提供する機能も実装した。
AIの回答精度向上を目指す取り組みとして、セマンティックモデルの改善にも注力した。自社固有の用語の説明を明記したり、会員IDを「ユーザー」や「顧客ID」と呼ぶ場合に対応するために別名を設定したり、合計金額の計算式を明記したりするなど、AIがより正確にSQL文を生成できるよう工夫した。
Snowflakeが2025年8月から提供する「AI PARSE_DOCUMENT」を使い、日本語ドキュメントの処理もSnowflakeで完結できるようになった。「画像やドキュメントなど、非構造化データもSnowflakeに取り込めるようになりました。あらゆるデータをSnowflakeに取り込んで、AIで活用できる世界を目指します」と三浦氏は展望を語った。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Microsoft 365 Copilot、ついに“エージェント化” ExcelやWordで複雑なタスクを段階的に処理する新機能
Microsoftは、Microsoft 365 Copilotの新機能「Agent Mode」と「Office Agent」を発表した。ExcelやWordなどのOfficeアプリでAIと対話的に協働し、複雑な業務を段階的に処理・完成できる。
“AIエージェントの次”のトレンドは何か Gartnerが描く未来志向型インフラのハイプ・サイクル
Gartnerは、日本の未来志向型インフラ・テクノロジーに関するハイプ・サイクルを発表した。AIエージェントや完全自動化など9項目を新たに加え、2030年を目標とした産業変革の指針を提示している。
生成AI、進化の鍵を握る「長期思考」 Sakana AIが挑む“人間のように試行錯誤するAI”への道筋
AIの進化は目覚ましく、その活用は日々広がっている。しかし、現在のAIにはまだ苦手な分野がある。それは数週間といった「長期間の思考」を要する複雑なタスクだ。この難題にAI研究の最前線はどう挑んでいるのか。Sakana AIの秋葉拓哉氏に話を聞いた。




