データ基盤の扱い方や「データ資産」概念のアップデートが求められるようになるかもしれません。
この記事は会員限定です。会員登録すると全てご覧いただけます。
Clouderaが「データメッシュ」という新しいデータ基盤の形を提唱しています。
データメッシュは、もともとは2019年に、当時ThoughtWorksのプリンシパルテクノロジーコンサルタントだったZhamak Dehghani氏が「How to Move Beyond Monolithic Data Lake to Distributed Data Mesh」という記事の中で提唱したIT基盤アーキテクチャのようです。その特徴として、Clouderaは非中央集権的であることを挙げます。
データウェアハウス、データレイクに代表されるように、データを活用するには何らかの方法でさまざまなデータを一元的に集約するアプローチが一般的です。一箇所に集約する理由はさまざまありますが、その内の一つは計算処理スピードの向上が挙げられるでしょう。管理対象を把握しやすく、権限管理などのデータガバナンスをきかせやすい点も有利です。
ところがClouderaの主張によれば、今後、企業が管理するデータの量が増加するにつれ、データを一元的に集約する作業を担う人やそのツールがボトルネックになるといいます。
現在、多くの企業がデータドリブンでの意思決定を目指し、企業内のデータを活用する目的でデータ基盤を統合したり、データセットを整備したりしています。しかしClouderaによれば、これらのデータの加工、移動にかかる労力が増加するデータに対応しきれなくなるというのです。
※本稿は2022年9月6日配信のメールマガジンに掲載したコラムの転載です。購読はこちら。
ここのところ、「非」中央集権を是とするシステム実装のアプローチに再び注目が集まっています。
Copyright © ITmedia, Inc. All Rights Reserved.