あらゆるベンダーがAIへの対応、AI機能の取り込みを急ぐ中、Snowflake共同創業者の一人であるクルアネス氏は「AIは私たちが直面する最後の(技術)革命ではない」と状況を分析する。Snowflakeの狙いはどこにあるのだろうか。
この記事は会員限定です。会員登録すると全てご覧いただけます。
米Snowflakeの共同創業者のベノワ・デイジビル(Benoit Dageville)氏とティエリー・クルアネス(Thierry Cruanes)氏は2025年3月27日、日本のメディア向けに同社のビジョンやAI戦略について説明した。クラウド型のデータ基盤として北米を中心に支持を集める同社は、AIによる非構造化データの取り込みとオープン性を強みとする。
同社の今後のビジョンを語るに当たり、クルアネス氏は「AIは私達が直面する最後の(技術)革命ではない」と状況を分析する。もっぱらAIへの対応が話題の中心になると思われたが、今後の同社の事業の核はAIではないところに置かれているようだ。
Snowflake社(以降、企業名を指す場合は「社」を付けて表記)は2024年から企業メッセージを「データ クラウド カンパニー」から「AI データ クラウド カンパニー」に変更した。その名の通り、現在はデータプラットフォームと併せて「Cortex AI」として多数のAI機能を提供する。
デイジビル氏は、同社のビジネスにおけるAIの重要性を次のように説明した。
「Snowflakeの当初の目標は構造化データと半構造化データを統合することにありました。創業当時、非構造化データは分析の対象ではありませんでした。しかし、今ではAIによって、テキストや画像、電子メール、PDF、オフィスドキュメントといった企業内のあらゆるデータを構造化できるようになりました。AIをサポートすることでSnowflakeの顧客が組織にとって非常に重要なこの種のデータを活用できるようになるわけです」
デイジビル氏は、Snowflake社のAIソリューションの強みとして「強固なセキュリティ」と「ガバナンス」を挙げた。
Cortex AIは最先端のLLM(大規模言語モデル)をサポートしており、顧客はデータを外部に送ることなく、Snowflake内でこれらの強力なLLMを利用できる。テキストの分析や、翻訳、要約などといった処理が可能な高レベルの関数も提供されている。サードパーティーのAIサービスを利用するのではなく、SnowflakeだけでAIを使ったデータ処理やデータ分析を完結させられることは、企業のガバナンスを維持する上で極めて重要だ。
デイジビル氏はさらに、AIによって「データがあらゆる組織にとってさらに大きな影響を与えるようになる」と強調する。
「従来は、限られたごく少数の従業員だけがSQLクエリのような特殊なスキルを使ってデータにアクセスしていました。それに対してAIは自然言語をデータリンクに翻訳できます。これによって、企業内の全ての従業員がデータプラットフォームを直接活用できるようになります」
近年Snowflakeはオープンソースソフトウェア開発プロジェクトの支援にも力を入れている。その一つが「Apache Iceberg」(Iceberg)だ。Icebergは大規模なデータレイク向けに設計されたテーブル形式だ。もともとはNetflixが開発していたが、現在は「Apache Software Foundation」がオープンソースで開発・管理する。
デイジビル氏は、Icebergのようなオープンなテーブル形式をサポートすることの重要性について説明した。
「オープンテーブル形式はSnowflakeの顧客にとって極めて重要です。オープンテーブル形式を使用すれば、異なるシステムとの相互運用が可能になります。例えば、1つのシステムを使用してデータエンジニアリングを実施し、別のシステムを使用してクエリを処理するといった柔軟な運用が可能になります。特定のベンダーへのロックインを避けられるというメリットもあります」
Snowflakeが相互運用性を重視する姿勢は、外部APIのサポートにも現れている。例えばSnowflakeは「Apache Spark」(Spark)との互換性を実現するためのインタフェースとして「Spark Connector」を提供する。分散処理によるバッチ/ストリーム処理の標準的なエンジンとして広く使われているSparkとの連携は大きなメリットだ。
クルアネス氏は次のように語る。
「オープンなAPIをサポートすることは(データを柔軟に活用しようと考える)顧客にとって非常に重要です。クラウドプラットフォームとして、全てのデータソースと連携するには、APIやデータ形式のオープン性が大きな鍵を握ります」
データプラットフォームとしてのSnowflakeの価値を高める要素の一つに「Snowflakeマーケットプレース」がある。Snowflakeでデータやデータに関連するアプリケーションを取引するための仕組みだ。ユーザーはサードパーティー製のデータやアプリケーションをマーケットプレイスで探して自社の環境で利用できる。また、自前のデータやアプリケーションをマーケットプレイスで配布・販売することも可能だ。
Snowflakeマーケットプレイスには、2025年1月31日現在で3000以上のデータセットやアプリケーションが登録されている。マーケットプレイスが充実すれば、それだけSnowflakeの可能性も拡大することになる。この関係は、Appleが提供する「iPhone」と「App Store」の関係に似ている。その事実を踏まえた上で、デイジビル氏は「Snowflakeの将来は顧客と(マーケットプレースの)プロバイダーに懸かっている」と語った。
「5年後にiPhoneで実行されるアプリケーションは現在のアプリケーションとは大きく異なるものになるでしょう。しかし、iPhone自体はあまり変わらないはずです。iPhoneという製品をこれほど素晴らしいものにしているのは、その上で使用されているアプリケーションの価値に他なりません」(デイジビル氏)
クルアネス氏は、急速に進化する技術の中で、プラットフォームが果たす役割の重要性を次のように語った。
「将来について考えるとき、AIは私たちが直面する最後の革命ではないということを意識します。今後、私たちはまた別の革命に直面することになるでしょう。プラットフォームにとって重要なのは、プラットフォームとそのアーキテクチャーがこれから起こる革命を吸収できるかどうかです。そして、Snowflakeがそのようなアーキテクチャーであると信じています」
クラウドネイティブなデータウェアハウスの構築を目指して2012年に設立されたSnowflake社は、既存のオンプレミス型DWHの課題を解決するためにクラウド環境に特化した独自のデータベースアーキテクチャを構築し、2025年1月31日時点で1万1000社以上の顧客を有している。
デイジビル氏はSnowflake社を創業した当時の状況について「データ分野では2つの大きな革命があった」と振り返った。1つ目の革命はビッグデータだ。当時は「Apache Hadoop」(現在の「Apache Kafka」)が台頭し、多くの企業がビッグデータを分析することによってビジネス価値を生み出そうとしていた。しかしHadoopは機械的に生成された構造化データを扱うためのシステムであるのに対して、ビジネスの現場で扱われるのは、表形式データをはじめとした半構造化データが中心だというギャップがあった。この2種類のデータを1つのシステムで統合的に扱えるようにすることを目指して生み出されたのが「Snowflake」である。
もう1つの革命は「クラウドの普及」だ。「これはデータ分析にとっても極めて重要な出来事だった」とデイジビル氏は語る。分析は、極めて多くのコンピューティングパワーが必要な処理であると同時に、非常にスパイクの多い使用法でもある。ビッグデータの分析に必要となる数十万台のサーバを24時間365日の体制で用意できる企業はほとんどない。その点、使用した分だ料金が発生するクラウドであれば、そのコンピューティングパワーを誰もが手にできる。Snowflakeは「クラウドのパワーを最大限に活用した上で、さらにそのデータ処理システムをフルマネージドで提供することによってユーザーをインフラの複雑な管理から開放することを目指した」という。
このようなシステムの実現を目指した理由についてデイジビル氏は「誰もがデータのGoogleになることを望んでいたから」だと語った。GoogleやFacebookなどの大企業は全て、非常に大規模なデータセンターに投資し、データを活用することでビジネスを拡大させてきた。データを自由に扱えるようになれば、そのような大企業に対抗できる。
「私たちのビジョンは、誰もがGoogleになり、全ての企業、小さな企業でさえGoogleのようにデータの力を得ることでした」(デイジビル氏)。
新技術特有の勇み足広告 AIエージェントを検討する少し前に考えること
データ分析・基盤企業が占う2025年 命運を分ける要素は何なのか Databricks、Snowflake、Qlikに聞いた
Snowflake、2025年後半までに単一要素認証の段階的廃止を発表 MFA義務化へ
日清食品HD、散在データをHULFT SquareでSnowflakeに統合 データ連携の作業時間が60%減Copyright © ITmedia, Inc. All Rights Reserved.