Clouderaが「データメッシュ」という新しいデータ基盤の形を提唱しています。
データメッシュは、もともとは2019年に、当時ThoughtWorksのプリンシパルテクノロジーコンサルタントだったZhamak Dehghani氏が「How to Move Beyond Monolithic Data Lake to Distributed Data Mesh」という記事の中で提唱したIT基盤アーキテクチャのようです。その特徴として、Clouderaは非中央集権的であることを挙げます。
データウェアハウス、データレイクに代表されるように、データを活用するには何らかの方法でさまざまなデータを一元的に集約するアプローチが一般的です。一箇所に集約する理由はさまざまありますが、その内の一つは計算処理スピードの向上が挙げられるでしょう。管理対象を把握しやすく、権限管理などのデータガバナンスをきかせやすい点も有利です。
ところがClouderaの主張によれば、今後、企業が管理するデータの量が増加するにつれ、データを一元的に集約する作業を担う人やそのツールがボトルネックになるといいます。
現在、多くの企業がデータドリブンでの意思決定を目指し、企業内のデータを活用する目的でデータ基盤を統合したり、データセットを整備したりしています。しかしClouderaによれば、これらのデータの加工、移動にかかる労力が増加するデータに対応しきれなくなるというのです。
※本稿は2022年9月6日配信のメールマガジンに掲載したコラムの転載です。購読はこちら。
従来のデータ管理とデータメッシュはどこが違うか
ここのところ、「非」中央集権を是とするシステム実装のアプローチに再び注目が集まっています。
関連記事
- 2021年のデータ分析「3大ニーズ」とは?――Google Cloud調査
Google Cloudは2021年のデータ分析ニーズで顕著だった3つの要素を明らかにした。調査や開発、ビジネスモデルの構築など、幅広い用途を支えたそれらの中身とは。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.