第4回:見える化の極意、IT運用におけるマシンデータ活用実践 Splunk道場(1/3 ページ)

これまでSplunkの使い方やセキュリティ用途での特徴に触れてきましたが、今回はマシンデータのいわば“本流”ともいえるIT運用での活用を解説します。

» 2016年01月06日 11時15分 公開
[矢崎誠二ITmedia]

 第1回目の記事で紹介したコールセンターへの顧客からのクレームめいたメッセージのシナリオは、サービス提供側を意気消沈させる。顧客は利用するシステムにアクセスしても何かが問題で遅延が発生し、アクセスエラーが起きている。最悪の場合は業務停止になり、結果として企業の業績に影響が及ぶ。問題はこの“何か”だ。

大規模かつ複雑なITシステムと安定性

 ITというインフラではシステムが安定稼働するための冗長化、事業継続性、ロードバランスが一般化されている。

 しかしながらITシステムの革新は日進月歩である。Webやモバイルに代表されるアップデートの速さ、廃れる技術との交代劇をみても分かるように、インフラストラクチャという基盤における変化のスピードは過去に例がないものだ。M&Aにみられる会社統合、事業統合の頻度が増し、システムの安定稼働も簡単ではないという企業側の声が聞かれる。

 ITシステムは統合や先進性の追求、安定性という、異なる(あるいは矛盾する)要件にバランスよく応えなければならない。システムの安定化に100%はないが、遅延や停止することを前提にした回避策としてのプランB、プランCの用意は必要不可欠でもある。現在の複雑なITシステムでは上述したようなこの“何か”が発生することが必然となっている。

 大規模かつ複雑に連動している複数のシステムから、この“何か”を明確に、リアルタイムに把握することは大きな挑戦だ。しかし、何かしらの課題や問題を解決するためにシステムの状況を分析すれば分析するほど、その様子はまるで洞窟探検のようであり、暗闇の中に光をあてて当該部分は分かっても、全体は見通せないということがある。

 例えば、ネットワークマネジメントシステム(NMS)では障害検知がトラップとして報告され、どこで問題が起きているかは分かるが、次のステップに踏み込むことが容易ではない。もちろんテンプレートとしてのアプリケーションやOS、ネットワークなどの監視は可能だが、階層化されたそれぞれの層の監視ではなく、業務としての監視が必要だ。つまり、エンドツーエンドの流れを理解した上で業務として監視する。単一層での監視に加え、複数層のITシステムを相関させることによって因果関係を見出したり、共通メッセージで括ることで今まで見えていなかった事象が見えてきたりする。

マシンデータ起点のITオペレーションとは?

 ITオペレーションは、クラウドや物理といった環境の違いを問わず、リアルタイムな可視性を備え、インテリジェンスによる状況把握が可能であること、そして、大規模環境すらもエンドツーエンドで網羅するものとして提供されるべきだ。

 そのためにはシステムを構成するあらゆるモノが出力するマシンデータをPushまたはPull型で収集し、それらの相関から“何か”を可視化していくことが重要だ。マシンデータの分析プラットフォームのSplunkは、元々はITオペレーションにまつわる問題や課題を“見える化”するために誕生したことから、複雑なITシステムの複数層にまたがる状況を容易に把握することを得意としている。

 オペレーション担当者が深部までドリルダウンしながら分析するだけでなく、ダッシュボードからマネージャーや経営層など職務や所属に応じてカスタマイズした情報の提供もできる。マシンデータを利用した最適なITオペレーションの実現を目指すことを「オペレーショナルインテリジェンス」と呼ぶ。

 Splunkでは無償利用できるWindowsやUnixなどに対応したAppsを利用することで、実装済みのサーバシステム、ネットワークシステム、データベースシステムの可視化がすぐにできる。まずは“藁の中の針”を探すところから始まり、問題や課題を生じさせているたくさんの針を見つけ、取り除いていく。こうすることでシステム停止をもたらす要因を根本的に激減させる。

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ