稼働状況を視覚的に把握:「止まらないシステム」は企業の生命線――日立のJP1で実現

ITシステムと経営が切り離せない時代になり、ITシステムの障害がビジネスに致命的な影響を与えるケースが増えている。日立製作所が提供する統合システム運用管理「JP1」のサーバ稼働管理製品「JP1/Performance Management」は、システムを監視して問題を未然に防ぐプロアクティブな管理を実現。万が一障害が発生してしまった場合にも、すばやい原因分析を可能にすることで、運用管理者を強力にサポートする。


「ひとたびシステム障害を起こすと、復旧に莫大なコストが掛かり、企業としての社会的信用も失墜する」

 ある運用担当者は、システムの停止は企業活動の致命傷になり得ると話す。例えば、Webを利用したキャンペーンサイトやチケット購買サイトを手掛ける企業の場合、特定の時間に自社のWebサーバにアクセスが集中することがある。特に、有名人などをプロモーション活動に使ったときなどが顕著だ。

 ここ一番というときにサービスを効果的に提供できなくなってしまっては、ビジネスとして大きな機会損失を被ることになる。何よりも、Webサイトにつながらないことに顧客が不満を募らせ、ライバル企業のサービスに移ってしまうといった事態だけは避けなくてはならない。

 ではどうすればいいのか。システム障害については「事前に抑止する方法」と「事後にすばやく復旧する方法」の大きく2つに分けられる。ここで、止められない企業システムの運用に不可欠な存在になりつつあるのが、「JP1/Performance Management (以下、JP1/PFM)」だ。ミッションクリティカルな情報システムからWeb系システムまで、あらゆるシステムの稼働を監視し、システムの安定稼働を支援するのである。

障害を事前に避ける

 システム障害を「事前に抑止する方法」から見ていこう。JP1/PFMは、CPUやメモリの使用量、アクセス数、Java VM、データベースのテーブルの使用率、ディスクの状況、アプリケーションサーバの実行待ちの状態やコネクション数など、情報システムのさまざまな項目を監視することができる。あらかじめ設定したしきい値を超えた場合、その情報を運用管理者へのメール通知や外部コマンドを実行することで自動通知することが可能。しきい値は各ユーザーが設定することも、標準提供されているテンプレートを利用することができる。このテンプレートを活用すれば、インストール直後からスムーズな運用を開始できる。

 システム全体の監視において、運用管理者にシステムダウンの兆候を事前に知らせてくれるのがJP1/PFMの大きな特徴だ。システムダウンには必ず理由があり、監視していれば高い確率で予測できる。不具合の兆候を事前に検知して障害発生の前に対処するのと、実際に障害が発生し、さまざまな関係者がその対応に追われるのとでは、業務効率に大きな差が生じる。

画像をクリックすると操作イメージを動画でご覧頂けます。

ムービーの閲覧にはFLASHプラグインが必要です。

障害発生後にすばやく復旧する

 次に、障害が発生してしまったり障害発生の予兆を検知したあとは、原因を究明し迅速に対処することが重要だ。例えば、システムのレスポンス低下を検知した場合には、運用管理者は最初にレスポンス低下に関連する稼働情報を調査することになる。例えば、応答時間がしきい値を超えていれば、CPU使用率とOSのメモリ使用量などを調べる。JP1は、見たい時間のプロセスごとのグラフを表示させる事ができるので障害の原因となったプロセスの見当がつけられるのである。

画像をクリックすると操作イメージを動画でご覧頂けます。

ムービーの閲覧にはFLASHプラグインが必要です。

 JP1/PFMは、システム停止の原因を的確に把握するための分析ツール「JP1/PFM- Analysis」も備えている。JP1/PFM- Analysisは、HTTPやDNS、IMAP4などのサービスや、ファイアウォールやルータなどのホスト、データベースなどのアプリケーションで構成されるシステム全体を俯瞰して監視し、例えば、メモリやCPUなど、同じタイミングで大きくリソース量が増えたり足りなくなっている項目を洗い出し、不具合との相関関係などを自動的に分析処理する。最終的には、メモリの使用率などが急激に上がった原因はこのリソースが関係しているのではないかとランキング形式で知らせてくれる。ボトルネック分析や問題を事前回避するための分析などがきめ細かく実施できるため、運用管理者にとって心強い。

 システムが停止した際の損失は、復旧コストはもちろん、株価の下落や企業イメージの毀損など二次的なものも含めると予測を大きく超えた規模になる可能性がある。その意味で、JP1はビジネスの継続性確保だけでなく、コストの削減はもちろん、二次的な損失を最小限に抑えることにも大きく寄与するのである。

将来のための監視も

 JP1/PFMでは、予測に基づき、計画的にシステムを増強しておくこともできる。「アクセス数が増加傾向にあり、レスポンスも悪くなっている」といった場合、CPUやディスクの利用率、プロセスごとのメモリ使用率、トランザクション数などを分析することで、性能悪化の兆候を見つけたり、障害の発生を未然に防いだりできる。例えば、「このままでは、半年後に性能悪化のしきい値を超えてしまう」など予測をたてたり、データベース(DB)サーバへの接続要求数が徐々に上がっている中で、要求数のしきい値到達時期を予測していれば、「チケット販売システムが、半年後にDBサーバのボトルネックによってダウンする可能性がある」と認識できたりする。

 そこで、システム運用管理者は「来年はデータベースサーバとWebサーバを増設しよう」といった具体的で明快な意思決定を下せる。

仮想化システム、複数コアのCPUにも対応

 情報システムの構築手法として、仮想化が広く浸透し始めている。長い間使ったシステムを新規に作り替えるのではなく、仮想化機能やSOA(サービス指向アーキテクチャー)などを使って既存システムを利用し続けるといったケースが今後増えてくるという。仮想化は、1台の物理サーバ上に仮想的なレイヤーを設け、その上にWindows(R)やLinux、UNIXといったOSの仮想領域を生成する技術だ。JP1/PFMは、物理サーバと仮想マシンの両方について、CPU使用率やメモリ割り当て量などさまざまな項目を監視できる。

これにより、仮想環境で障害が起きた際も、問題が起きている物理サーバをすぐに特定でき、対処方法を正しく判断できるのである。対処方法としては例えば、障害が起きている仮想マシンのリソース割り当て量を増やす、仮想マシンを別の物理サーバ上で稼働するように変更するといった方法がある。もちろん、物理サーバを増設するケースもあるだろう。

 また、ハードウェアに関連したところでは、最近ではデュアルコアプロセッサなど複数のコアを持つCPUが増えてきている。JP1/PFMは、コア別にシステム運用状況を監視できる。1つでもコアがしきい値を超えれば、異常として検知できる。JP1/PFMなら、このようにさまざまなシステム要件に柔軟に対応できるのである。

管理者をサポートするレポート機能

 運用管理担当者にとって、日々の作業を助けてくれるのが、標準で組み込まれているレポート機能だ。システムの稼働状況を記したレポートを作成するには、さまざまな情報ソースを参照するなど手間も時間もかかってしまう。JP1なら「1カ月の状況」などを、グラフ入りで簡単に自動生成できる。

 レポート出力では、業務系プログラムであるジョブを自動実行するJP1のジョブ管理製品「JP1/Automatic Job Management System 2」と連携することも可能。月初めに先月一か月分のレポートを自動生成するといった運用が可能となり、管理者の工数を削減できる。

 また、JP1/PFMは、数年分にわたって稼働情報を保管することができる。蓄積した過去の稼働情報をもとに、現状のシステムの課題を分析してレポート出力するといった使い方もできるだろう。

用途や場面ごとに監視内容を変更

 多くの企業で、昼と夜では監視条件が異なる。昼間はWebへのアクセスが多いために、WebサーバのCPU監視のしきい値を変える必要があるかもしれない。夜はバッチシステムが活躍するため、業務系サーバのしきい値を変えるなど事情はさまざまだ。

JP1/PFMは、監視する項目や値を「アラームテーブル」にまとめられる。例えば、監視しているすべてのサーバに共通して適用する値を設定したアラームテーブルと、特定のサーバに特化したアラームテーブルを作成する。アラームテーブル同士は組み合わせることもできるため、さまざまな値を詳細レベルで監視できる。

 これまで見てきたように、JP1/PFMはシステム障害の予防、事後の早急な原因究明、パフォーマンスやリソース増強を判断するための予測という運用管理者にとって重要な役割を強力にサポートするツールだ。システムを一元的に監視できるユーザーインタフェースやレポート作成機能など、現実的できめ細かい機能を備えており、利用すればシステムの安定稼働という目的達成に大きく近づくことになる。

●JP1を導入したいのですが……
Q:価格およびサポート費用を教えてください。
A:JP1/PFMの中核となる監視マネージャと監視コンソールは合わせて420,000円(税込)から、OSやアプリケーションごとに用意されている監視エージェントは105,000円(税込)から導入可能です。サポート費用は平日のみのサポートでそれぞれ73,080円(税込)から、16,380円(税込)からです。目的に合わせて監視エージェントを選べるため、初期投資を抑えた導入も可能です。

Q:24時間365日のサポートはありますか?
A:あります。問題解決の支援の対応時間に応じて、「24時間週7日」と「平日8-19時」という2つの商品を提供しております。詳しくは、Webにてご確認ください。
http://www.hitachi.co.jp/soft/service/

Q:準備を含め導入にかかる期間はどれくらいですか?
A:導入する環境にもよりますが、複数OS混在環境で監視アプリケーションも多岐にわたる場合、およそ1ヶ月程度を要します。

Q:OSなど稼働環境について教えて下さい。
A:Windows 2003/2008、RedHat Linux、HP-UX、Solaris、HP-UXをサポートしています。ただし、Manager/AgentごとにサポートしているOSは異なります。また、監視対象のアプリケーションのバージョンも制限があります。詳しくは弊社営業までお問い合わせください。

コスト削減と安定稼働の切り札 JP1による運用管理の自動化

 「コスト削減といっても何を削減すればいいか分からない」

 あるシステム管理者はこう漏らす。米国発の金融危機の影響で景気が急速に冷え込む中、経営層からコスト削減を命じられるシステム管理者は少なくない。既存の情報システムを運営する上でどうすればコストを削減できるのか。さらに、それを売り上げ増加への布石にできるのか。

<<JP1の業務自動化に関する記事はコチラ>>




提供:株式会社日立製作所
アイティメディア営業企画/制作:ITmedia エンタープライズ編集部/掲載内容有効期限:2009年4月30日