新しいクラウド時代を迎えるための「3つのキーワード」とは?運用管理に見直しが迫る!

サーバ仮想化やクラウドコンピューティングの導入が進んだ今、情報システム部門の運用管理体制には、大幅な見直しが迫られている。従来の手法だけでは、新たなIT基盤に対応しきれないからだ。そこで、これからの運用管理に求められるのは「見える化」「共有化」「自動化」の推進である。

» 2013年08月28日 10時00分 公開
[PR/ITmedia]
PR

複雑なシステム運用管理の課題解決が急務

 企業の情報システムにサーバ仮想化技術が取り入れ始めてから、およそ10年が経過した。当初は、業務アプリケーションやハードウェアなどレガシーなIT資産を延命するために利用されることも多かったが、現在は基幹システムも含めたIT基盤をプライベートクラウド環境として刷新するためのテクノロジーとして、サーバ仮想化は当たり前に使われるようになった。

 サーバ仮想化の普及により、最も大きく変化したのが、情報システム部門のシステム運用管理体制だ。過去の企業システムは、業務単位の縦割りでそれぞれ独立した、いわゆる「サイロ型」と呼ばれる形態が一般的だった。こうしたサイロ型システムの運用管理では、サーバやストレージなどのハードウェア、OSやアプリケーションなどのソフトウェア、およびネットワークの稼働状況を監視して障害発生に備えたり、万一の障害、または被災に備えたバックアップを実施したりすればよかった。自分が担当するシステムだけに精通し、自分のやり方を守れば日々の運用管理業務をこなせたわけだ。

 ところが、複数の業務システムが共通のシステム基盤上で稼働する仮想化・クラウド環境では、これまでのように限定されたシステムとは違い、幅広い運用管理のスキルを身につける必要がある。仮想環境と物理環境が混在するような複雑なシステムではトラブル対応が難しく、スキルを持つ担当者に仕事が集中する傾向にある。つまり、運用管理業務の属人化が進んでしまったというわけだ。このような「負のスパイラル」に陥っている企業は、少なくないのが現状だ。

 仮想化・クラウドの複雑なシステム運用管理の課題を解決するには、当然のことながら日々の運用管理業務を見直し、改善しなければならない。そのためには、システムを効率的に監視して安定稼働を確保するための「見える化」、運用管理手順を整理し、標準化してレベルを平準化する「共有化」、そして人手によるオペレーションミスを排除する「自動化」を推進することである。

監視の「見える化」に有効なメッセージ統合

 まず、最初に取り組むべきことは、監視の「見える化」だ。

 別々の物理サーバで構成されていた従来のサイロ型システムでは、CPU使用率やメモリ使用率といったOSレベルのリソース、システムを構成する各機器の応答状況だけ監視していればよかった。しかし、仮想化・クラウド環境の大規模なシステム基盤では、同じ監視体制では通用しない。それはなぜだろうか?

 例えば、ある業務システムに著しい負荷が掛かり、ハードウェアごとダウンしてしまったとする。このような事態は、ハードウェアに業務システムが「相乗り」している格好の仮想化環境において、複数のシステムが連動してダウンしてしまうことを意味する。

 また一般的に、仮想化環境におけるシステム構成は、サイロ型に比べて複雑である。そのため、トラブルの内容を把握して原因を究明するのに時間が掛かってしまうことになる。このように、1つのシステムで発生したトラブルが、複数のシステムのサービス品質を低下させるおそれがあるわけだ。

 加えて複数システムの相互の負荷状況によって構成が変化するよう環境を設定している場合、サービスの状況を把握することが難しく、効率的なシステム拡張が行われずに損害をもたらしてしまう。同時に、効率面や信頼性の課題も解決しなければならない。

 ここまで述べてきたような「クラウド化によってもたらされた運用管理の課題」を解決するためには、従来のような性能や死活監視だけでなく、より高度なシステム運用へ移行する必要がある。目標は、システム停止時間を極小化することである。

photo これからの高度なシステム運用

 仮想環境と物理環境が混在する複雑なシステムでは、各機器・ソフトウェアが出力するメッセージログが運用管理サーバに送られてくる。メッセージのフォーマットは、当然のことながら機器・ソフトウェアによってまちまちである。さまざまな機器から上がってくるメッセージを読み解き、その重要度を判断するには高度なスキルが必要になってくる。そこで、統合監視サーバによってメッセージのフォーマットを統一し「見える化」し、更に運用に合わせた新しい基準で重要度を設定すれば、すばやく判断できるようになる。また、直接障害の要因とならない些細なメッセージは取捨することにより、無駄な対応コストを削減できる。

 また、各メッセージに対処法を付加することで、高度なスキルを持たない管理者でもメッセージの内容に即応できる仕組みも用意できる。

 このようにメッセージをより「見える化」すれば、システム監視の属人性が排除されるため、高度なスキルを持たないオペレータでも、トラブルの一次対応に当たることが可能だ。メッセージのフォーマット統一作業は容易なことではないが、それを乗り切れば非常に効率的な監視体制が完成する。

利用者視点による「サービスの可視化」

 「見える化」の観点で、もう1つ進めるべきなのが「サービスの可視化」である。

 業務システムなどをサービスとして利用者に提供する場合、従来のように機器やソフトウェアだけを監視していると、サービスに障害が発生してから対応を始めるため、企業の利益損失に繋がることになりかねない上に、サービス利用者のシステムに対する不満をつのらせることにもなる。そこで、サービスを可視化――すなわち、利用者視点で何が起きているかを「見える化」し、障害の予兆を捉えることで、システムの安定稼働が実現できるようになる。

 この高度な運用を強力に支援するのが、「障害の予兆」を検知する運用管理ツールである。これは、現在のサービス性能と過去のデータ(ベースライン) を比較して「いつもと違う」稼働状況・サービス性能を検知、通知してサービスに関連するシステム性能データを分析して原因の候補を提示する機能を提供するもの。

 障害の予兆を検知して通知がきた際は、CPUやネットワーク等のどこがボトルネックになっているのかを、サービス単位で把握することが出来る。さらにボトルネックとなる項目が複数ある場合は分析期間を調整することにより原因候補の絞込みが可能だ。障害予兆の原因と思われる候補が絞りこめたら、根本原因を調査して対処すればよいのだ。

photo 仮想化環境を構成するサーバやアプリケーションの稼働状況を俯瞰できなければ、クラウド基盤における障害原因の究明は難しい。図では障害を特定するまでの流れを示している

 このようなサービス性能を「見える化」する仕組みを利用すれば、従来では見つけることが難しかったトラブルにも対応できるようになる。例えば、期間限定のキャンペーンサイトを立ち上げたとき、本来はアクセス集中によってサービス性能に少しでも違った予兆が見られるはずなのに、それが普段と変わらなければ、どこかに異常があるのかもしれない。

 だが、従来の監視ではトラフィックが増加しなければアラートが上がって来ないため、運用管理担当者は知る由もない。それに対し、サービス性能を監視する仕組みがあれば、スループットに変動がないことを把握できるため、早期にトラブルを発見、対応できることになる。

 さらに、万が一、障害が発生した場合や、OSパッチ適応などでマシンの停止が必要になった場合はシステム構成要素の相互関係をグラフィカルに表示することができる。これによってマシンの先にある業務システムやサービスへの影響範囲を的確に把握することが可能だ。

 「見える化」しなくてはいけないのは、上記で紹介したメッセージ監視やサービスの可視化だけではない。トラブル発生時にどのような対処を行ったのか、そのイベントと運用手順をインシデントとして登録する仕組みを用意するのだ。これにより経験豊富なベテランか、それとも新人なのかを問うことなく、運用品質の均一化を図ることができる。

「共有化」と「自動化」で運用品質を向上

 「見える化」による高度な運用を実現した次のステップが、「共有化」と「自動化」である。「見える化」した情報を企業で「共有化」すれば、発生した問題を漏れなく、効率的に解決することができるのである。

 さらに、人手を介さずに対応できる運用については、極力「自動化」を進めることが望ましい。自動化すれば、ヒューマンエラー(オペレーションミス)を撲滅することができるほか、実行頻度の高い作業を効率化することも可能だ。

 このように、仮想化・クラウドの複雑なシステム運用管理に求められるのは、「見える化」「共有化」「自動化」を推進することだが、その機能をオールインワンで提供しているのが、日立の「JP1」である。企業に最適な運用管理の仕組みをワンストップでインテグレートできるところが、JP1の最大の特長だと言えよう。

関連記事

Daily Portal Z×ITmedia:

新入社員がイスでコロコロしだす瞬間をたしかめた

「システム障害の予兆検知」と言われてもピンとこない……そんな読者に「あ〜、こんな光景あるある!」という“オフィスあるある”で分かりやすくご紹介します。初々しかった新入社員が社内でイスに座ったまま移動しだす予兆とは? Daily Portal ZとITmediaのコラボ企画。

特集INDEX

ビッグデータからモバイルまで:

「情報システムの総合力」を高めるソリューション大全

分散と集合を繰り返してきた情報システムのトレンドに変化が訪れつつある。分散であり集合でもあるクラウドの一般化をはじめ、垂直統合型システムの登場やスマートデバイスの普及により、従来の手法ではIT基盤の構築・運用もままならない。 今や、情報システムに求められているのは個別最適ではない。ビジネスを成長させる「総合力と完成度」を備えたIT基盤とはどのようなものか? そのソリューションを探る。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:株式会社日立製作所
アイティメディア営業企画/制作:ITmedia エンタープライズ編集部/掲載内容有効期限:2013年9月25日