第16回 旅行の準備が早い人はデータの管理もうまい? スマートな技とその極意クラウド社会とデータ永久保存時代の歩き方(3/3 ページ)

» 2016年06月08日 08時00分 公開
前のページへ 1|2|3       

ビッグデータ時代のデータ管理法

 従来のようにパターンの決まった構造化データだけで、データ量もそんなに増えることもなかった時代は、「階層管理」のような方法が有効でした。しかしビッグデータ時代になって、あらかじめデータの格納先を決めて整然とデータを保存、管理していく方法では間に合わなくなってきています。読者の皆さんも大量のメールやファイルを探す時に、「検索」したほうが早く見つかることが多くなっていると感じているのではないでしょうか。今後増えていくデータの保存について以下の3点に気を付けておくべきです。

保存方法が簡単で、長期保管ができること

 大量のデータを短時間で保管する仕組みが必要です。そのためにはデータの仕分けと保存のルール(ポリシー)を決め、アプリケーションによる自動化、または一部を手作業する半自動化が重要になります。ビッグデータ時代になり、データの保存期間も長くなりつつあります。長期保存する仕組みも必要でしょう。これはコストとの戦い、つまり、データのライフサイクルと階層管理の考え方が重要です。

見つけやすいこと

 検索に漏れがないようにする、もしくは検索精度が高くなるメタデータを作ることが重要になりますが、これには専用ソフトウェアなどの投資も伴います。すぐに始められる方法は、ファイル名やメールタイトルの工夫です。後から利用したいと思うファイルやメールのファイル名、タイトル名を変更することで、検索精度のアップが比較的容易です。例えば、メールタイトルの最初は「カテゴリー」、その次は重要な情報の「キーワード」、同じタイトルでシリーズ化するとしたら、連番としておくのも良いでしょう。そうすれば検索時に時系列でリストにまとめられるので、必要な情報にたどり着くのが早くなります。

アクセス可能なこと

 必要なデータへ常時アクセスできるようにするなら、パブリッククラウドや外部の共有ドライブなどにデータを保存することはお勧めできません。パブリッククラウドは一般的に99.95%の可用性(データアクセスができる割合)であり、メンテナンスのためのダウンタイムも業者側の都合で決められてしまう場合がほとんどだからです。ただし、全てのデータを高価なストレージに保存するのも現実的ではありません。テータへのアクセスを急がない(数時間または数日待てる)なら、むしろクラウドベースのデータ保管サービスを利用する方がコストメリットを得られるかもしれません。

 上記のような要素を全て兼ね備えているストレージ技術としては、以前に紹介したオブジェクトストレージがあります。これについては以前の記事でも紹介していますので、ぜひ参考にしてください(※関連記事リンクを参照)。

ビッグデータ時代こそスマートな保存や管理を実現してみたいものです

著者:井上陽治(いのうえ・ようじ)

日本ヒューレット・パッカード株式会社 ストレージテクノロジーエバンジェリスト。ストレージ技術の最先端を研究、開発を推進。IT業界でハード設計10年、HPでテープストレージスペシャリストを15年経験したのち、現在SDS(Software Defined Storage)スペシャリスト。次世代ストレージ基盤、特にSDSや大容量アーカイブの提案を行う。テープストレージ、LTFS 関連技術に精通し、JEITAのテープストレージ専門委員会副会長を務める。大容量データの長期保管が必要な放送 映像業界、学術研究分野の知識も豊富に有する。

井上氏の最新記事が読めるブログはこちら


前のページへ 1|2|3       

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ