データメッシュとは? データ管理のパラダイムシフトは起こるか編集部コラム

データ基盤の扱い方や「データ資産」概念のアップデートが求められるようになるかもしれません。

» 2022年09月10日 09時00分 公開
[荒 民雄ITmedia]

この記事は会員限定です。会員登録すると全てご覧いただけます。

 Clouderaが「データメッシュ」という新しいデータ基盤の形を提唱しています。

 データメッシュは、もともとは2019年に、当時ThoughtWorksのプリンシパルテクノロジーコンサルタントだったZhamak Dehghani氏が「How to Move Beyond Monolithic Data Lake to Distributed Data Mesh」という記事の中で提唱したIT基盤アーキテクチャのようです。その特徴として、Clouderaは非中央集権的であることを挙げます。

データメッシュ(出典:ThoughtworksのWebサイトに掲載されたZhamak Dehghani氏の論文)

 データウェアハウス、データレイクに代表されるように、データを活用するには何らかの方法でさまざまなデータを一元的に集約するアプローチが一般的です。一箇所に集約する理由はさまざまありますが、その内の一つは計算処理スピードの向上が挙げられるでしょう。管理対象を把握しやすく、権限管理などのデータガバナンスをきかせやすい点も有利です。

 ところがClouderaの主張によれば、今後、企業が管理するデータの量が増加するにつれ、データを一元的に集約する作業を担う人やそのツールがボトルネックになるといいます。

 現在、多くの企業がデータドリブンでの意思決定を目指し、企業内のデータを活用する目的でデータ基盤を統合したり、データセットを整備したりしています。しかしClouderaによれば、これらのデータの加工、移動にかかる労力が増加するデータに対応しきれなくなるというのです。

※本稿は2022年9月6日配信のメールマガジンに掲載したコラムの転載です。購読はこちら


従来のデータ管理とデータメッシュはどこが違うか

 ここのところ、「非」中央集権を是とするシステム実装のアプローチに再び注目が集まっています。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ