サーバの応答が急に遅くなったという問題もよく発生する。その原因で多いのが、サーバのメモリやハードディスクの空き領域不足である。アプリケーションのプロセスが増加し、いつのまにかメモリを圧迫しているので、空き容量が不足した時点で仕方なくリブートして対処している場合も少なくない。しかし、必要な空きメモリやハードディスク容量を監視するツールがあれば、応答が遅くなるなどの目に見える障害が発生する前にリブートもできるし、警告発生時の各プロセスの状態を調べることで原因追求にも役立つ。
監視ツール上では、あらかじめ許容範囲をしきい値として指定し、その値を超えたときに通報するようにしておく。通報は、ネットワーク監視やプロセス監視同様、アイコンやメールでよいだろう。
また、最近ではWebアプリケーションなどの状態を監視し、レスポンスが一定以上悪くなった場合に警告を発し、サービスの各コンポーネントの状態を確認できるようなツールもある。このようなツールを使えばアプリケーションのボトルネック解析などもできるようになる。
ITインフラの管理に関しては、状態を監視し、レスポンス低下や通信途絶など通常と異なる状況を検知して管理者に通知するのが主な役目だ。システムの規模が大きくなると接続されている機器の数も増加し、障害発生時に原因となる場所は多くなる。監視ツールが導入されていない場合、原因として考えられる個所をすべてチェックする必要があるうえに、人の目ですべてを監視することは不可能だ。監視ツールを使えば簡単に障害の場所が特定でき、調査の時間は短くて済む。システムのダウンタイムを短くするためにも、インフラ管理は必須のものといえる。
運用管理ツールを利用したサーバ側の管理項目としては、ジョブ管理とシステムのインフラ監視/管理という役目が主になる。この2つはシステムを運用する上で最も重要なものであることは言うまでもない。重要な仕事だけに管理者としては、この部分の省力化は必須のものといえる。毎日の定型処理に管理者が忙殺され、トラブル発生などの「いざ」というときに管理者がすばやく対応できないようではシステムの運用環境は健全とはいえない。表1に代表的な運用管理ツールを上げるが、これらはすべてここで挙げたような管理が可能だ。まずこれらの運用管理ツールでサーバの管理を行うことが、システム運用を確実に行う第一歩だといえるだろう。
メーカー | 製品名 |
---|---|
日立製作所 | JP1 |
富士通 | Systemwalker |
NEC | WebSAM |
日本IBM | Tivoli |
コンピュータアソシエイツ | CA Unicenter |
NRIデータサービス | eXsenju |
日本オラクル | Oracle Enterprise Manager |
Copyright© 2010 ITmedia, Inc. All Rights Reserved.