KDDIがデータクリーンルーム整備を本格化 外部連携も視野に(2/2 ページ)

» 2023年10月17日 09時00分 公開
[谷川耕一ITmedia]
前のページへ 1|2       

 KDDIのデータクリーンルーム整備において大きな役割を担ったのが「データクラウド」を標ぼうするクラウド型データウェアハウスベンダーのSnowflakeだ。

脱データウェアハウスを支えるSnowflake

 Snowflakeは、コンピュートとストレージを完全に分離する独自アーキテクチャで高い評価を受けているクラウドデータウェアハウス製品を提供する。直近の2024年度第2四半期(2023年7月1日〜9月30日)の決算は、売上高が5億4450万ドル、営業利益は1億4500万ドルで、売上高は前年同期比45%増となっている。顧客数も前年同期比20%増の1万3700社で、順調に同社のビジネスは成長している。

 同社は2012年に米国で創業、2014年からサービス提供を開始、早くも2020年9月に米国NASDAQ市場で上場している。同社の日本への進出は2019年9月で、日本でのビジネスは丸4年を経過し、同社の製品を扱うパートナー企業も増えている。

 5年目に入った日本のビジネスは米国に次ぐ世界で2番目の規模があり、「日本は重要な市場だ」とSnowflake CEOのフランク・スルートマン氏は語る。日本には既に500社の顧客があり、「これから1年半程の間に、倍にできると考えています。日本企業には、データドリブンな戦略を進める意気込みがあります」とスルートマン氏は強調する。

Snowflake 会長 兼 最高経営責任者(CEO)のフランク・スルートマン(Frank Slootman)氏

 ビジネスを伸ばす上で重要なのは、アナリティクスとクラウドデータウェアハウスで始まったソリューションを拡大し、データクラウドというコンセプトの会社になることだ。これはデータクラウドのための優れた技術要素を提供するだけでなく、Snowflakeのソリューションがコンテンツプロバイダーのエコシステムになることでもある。

Snowparkコンテナサービスの概要(出典:「SNOWFLAKE DATA CLOUD WORLD TOUR」資料)

 Snowflakeにとって、シングルプラットフォームであることは極めて重要だ。これはユーザーとデータを扱うインフラの接点を1つにすることでもある。Snowflakeは毎週継続的に改善を行っており、それをダウンタイムなしに適用している。

 この改善には当然ながら性能も含まれる。Snowflakeはリソースを利用した時間単位の課金モデルなので、「高速化することは顧客のコスト削減になります」とSnowflake プロダクト担当上級副社長のクリスチャン・クレイナマン氏は説明する。

 性能の向上を明確化するために、Snowflakeのパフォーマンス指数を数値で表し、顧客に示している。Snowflakeのコストを適切に管理するために、リソースの利用を可視化しコスト管理のポリシーを設定して、予算を超えそうな場合にアラートを出すような機能もある。

Snowflake プロダクト担当上級副社長のクリスチャン・クレイナマン氏

SnowflakeのAIへの対応はビジネス上の利便性をどこまで高めるか

 同社がここ最近力を入れているのがAIへの対応だ。

 独自の大規模言語モデル(LLM)を活用する機能として、「Document AI」がある。これはテキストインテリジェントの機能で、Snowflakeにあるドキュメントデータに対し、自然言語で問い合わせできる。たとえば請求書の合計金額がいくらで、誰からの請求書かなどを尋ねられる。

Snowflakeの大規模言語モデルプラットフォームの概要(出典:「SNOWFLAKE DATA CLOUD WORLD TOUR」資料)

 SQLを使って機械学習のモデルを活用する昨日も追加している。これを使って「Pythonなどを知らなくても、SQLで予測や異常検知などが実現できます」とクレイナマン氏が説明。Snowflakeのどこにどのようなデータがあるか分かっていれば、データサイエンスの知識がなくても機械学習の技術を活用できる。

 もう1つ、Snowflakeのデータプロダクトの中心となるが、Snowflakeのマーケットプレイスだ。ここには気象データや業界ごとの顧客行動のデータなど、既に2000近いデータセットがある。

 マーケットプレイスにはデータだけでなく、Snowflakeで使えるアプリケーションも必要だ。なぜならアプリケーションが外部にあると、データをSnowflakeから取り出してアプリケーションにコピーして渡さなければならない。そうなればデータのガバナンスとセキュリティの問題が発生する。「データを持ち出すのではなく、Snowflakeを進化させてアプリケーションやビジネスロジックをデータの近くで実行できるようにした」とクレイナマン氏は述べた。これはチーフデータオフィサーやチーフセキュリティオフィサーなどから極めて高い評価を得ているという。

Snowflake マーケットプレイスの概要(出典:「SNOWFLAKE DATA CLOUD WORLD TOUR」資料)

 Snowflakeには、セキュアホスティングの機能として、「Snowpark」もある。これにはPythonやJavaのランタイムが含まれ、ビジネスロジックをPythonやJavaで書ける。ロジックはデータを変換するパイプラインや、機械学習(ML)のモデル、さらには通常のアプリケーションでもいい。これはSnowflakeで最も成長している機能で、ユーザーの30%以上がSnowparkを使っており、Snowpark経由のクエリも1日1000万件以上ある。

 Snowpark上でMLやAIを使うユースケースも増えている。それに対応する機能として、データを機械学習用に整備する「Feature Engineering」と、データを学習する「Training」の機能がある。機械学習のモデルを管理する「Snowpark Model Registry」もあり、これらでMLOpsを実現できる。

 さらに他のレガシーな実行環境も使いたいとのニーズに応えるために「Snowparkコンテナサービス」も提供する。DockerコンテナをSnowflakeの中で利用できるもので、これを使って自由にプログラミングが可能だ。セキュリティやガバナンスの管理はSnowflakeのものが適用される。コンテナのインスタンスには柔軟性があり、GPUが使えるAIやMLに向いたインスタンスも用意している。

Snowparkコンテナサービスの概要(出典:「SNOWFLAKE DATA CLOUD WORLD TOUR」資料)

 これらを使えば独自の生成AIモデルの利用やLLMの学習などを、Snowflakeからデータを持ち出すことなく行える。「これらで包括的な生成AIのプラットフォームが完成しました」とクレイナマン氏は説明した。

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ