上手なキャパシティ管理ITILを深める! サービスデリバリ編(2/2 ページ)

» 2005年08月22日 11時49分 公開
[インフォリスクマネージ,ITmedia]
前のページへ 1|2       

 各顧客やユーザーの利用可能なストレージ容量を、サービスレベルとして置き換えて考えた場合、利用者の増加やデータの増加が、そのままサービスレベルの低下となる。キャパシティ管理とはバランスを取る活動であると前述したが、この場合には、ストレージへディスクを増設することによって、顧客やユーザーの要求とサービスレベルのバランスを取ることができる。ただし、ここで考慮しなければいけないことは、ディスク追加のコストが適正であるかということである。

 この検討には、顧客とコミットしているSLA(サービスレベルアグリーメント)や事業計画が重要な情報源となる。SLAで顧客やユーザーごとに利用可能なストレージ領域をコミットしている場合には、SLA違反にならないように検討を行う必要があると同時に、利用者の増加に伴うキャパシティ追加の時期やコストについて、事業計画を視野に入れ、検討を行う必要がある。

 事業の変化やテクノロジーの進歩により、ITシステムに対する要求は常に変化していくものである。キャパシティ管理はこれらの要求を事前に予測し、対策を計画することで事業のリスクヘッジや、サービス品質の維持を行えるのである。

キャパシティ管理の実装

 キャパシティ管理を行うためには、監視による定常的な情報収集、その分析、分析結果を基にキャパシティ追加計画の策定、そしてその計画に基づいた実装といった作業を常に繰り返して行う必要がある。

図2 キャパシティ管理のイメージ

以下、各作業について順番に説明していこう。

監視

 適切にITサービスが提供されている状態を維持にするためには、個々のリソース、サービスの利用状況が継続的に監視されていることが重要になる。監視の方法としては、システムの運用担当者が定期的にシステムにログインして、手動でシステムリソースの使用状況やパフォーマンスの状態を記録するといった方法もあるが、監視ツールにより自動収集するというのが現実的かつ効果的となる。

 自前で監視を実装する場合には、Windowsのパフォーマンスモニタなど、OS特有のツールを利用する方法もあれば、専用の監視ツールを利用する方法もある。専用の監視ツールには、MRTGNagiosなどに代表されるフリーツールも多数存在し、必要なものを組み合わせて構成することも可能である。または、MSP(マネージドサービスプロバイダー)ベンダーを利用し、リソース使用状況やサービスのパフォーマンスデータの提供を受けるというのも1つの選択肢となる。

 典型的にモニタリングすべき情報としては、以下のものが挙げられる。これ以外にもシステムに応じてさまざまな監視項目があるので、必要に応じて追加を行うとよいだろう。

  • CPU使用率
  • メモリ使用率(実メモリ/仮想メモリ)
  • ディスク領域使用率
  • ディスクI/O
  • ネットワークトラフィック
  • サービスへのアクセス数
  • トランザクション応答時間

分析

 監視で収集したデータにより、リソース使用状況や、パフォーマンスに関する傾向、将来の変化の予測が可能となる。ITILの赤本によると、それぞれのリソースとサービスについては、短期/中期/長期にわたって、またそれらが記録されている期間における利用率の最小値、最大値、平均値を検討する必要があると記載されている。これらのデータを理解し、分析することで、より容易に将来的なシステム負荷の情況が予測でき、リソース不足や、パフォーマンス低下などといった問題が発生する前に対策を打つことができるようになる。

 監視サービスをMSPベンダーなどへアウトソースしている場合には、システム的な観点からの監視データの分析についても対応を依頼することができるだろう。この分析により、下記のような問題点が見つかる場合がある。いずれも弊社で報告したことのある実例である。

  • システムリソース使用率の継続的な増加傾向
  • サービス応答時間の継続的な増加傾向
  • アプリケーションのエラーによる不適切なCPUの占有
  • あるプロセスが利用しているメモリのリーク
  • ジョブ実行時に作成されるテンポラリファイルによるディスク領域の圧迫
  • WEBアクセスの集中による応答レスポンスの遅延

プランニング

 監視データの分析により、ボトルネックになっているポイントや、将来キャパシティ不足になりえるポイントが発見された場合、これらへの対策を検討することになる。

 対策には、データベースのテーブルに対してインデックスを作成して検索を高速化したり、負荷分散の方式を変更して特定のサーバに対する負荷を軽減したりといった既存システムのチューニングでの対応と、メモリ、ディスクの追加、サーバの増設といったようなリソースの追加による対応が含まれる。

 将来的なリソース追加計画を策定する際には、事業計画と照らし合わせながら、これが妥当であるかを評価する必要がある。また、顧客やユーザーと合意しているSLAのサービスレベルを、現在から将来にわたって提供し続けることが出来るように計画を策定する必要があるだろう。

実装

 監視データの分析から計画された対応策に従って、変更を実施することになるが、この変更は正式な変更管理のプロセスを通して着手されなければならない。通常、システムのチューニングやリソースの追加といった変更時を行う場合には、顧客やユーザーへ提供しているサービスに与える負のインパクトや、リスクが大きくなりがちである。例えば、サービスの停止、機器のリブート、設定変更時のミスなどである。

 正式な変更管理に基づいて、チューニングやリソースの追加を行うことで、顧客やユーザーに対する負のインパクトの削減や、リスクをコントロールできるようになるだろう。

 また、実装完了後は対応策の効果を評価するために、さらなる監視を行うことが重要になる。この結果によっては、切り戻しや、再度の変更が必要になる場合もあるかもしれない。

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ