可用性管理――SLAに定められたレベルを維持する初心者歓迎! ITIL連載講座(3/4 ページ)

» 2007年10月31日 08時00分 公開
[谷誠之,ITmedia]

可用性管理の手法

 可用性管理を行っていく上で効果的な手法をいくつか紹介しよう。

1.コンポーネント障害インパクト分析(CFIA:Component Failure Impact Analysis)

 構成アイテム(CI)ごとに、そのCIが障害を起こした時のビジネスへのインパクトを予測して評価する手法である。この結果からSPOFを見つけ、対応する。

2.故障樹解析(FTA:Fault Tree Analysis)

 ITサービスの障害につながるイベントの連鎖を識別する手法である。いくつかのイベントのうち一つでも発生すれば次のイベントが発生する(ORゲート)、いくつかのイベントのすべてが発生して初めて次のイベントが発生する(ANDゲート)などのイベント同士の関係を図式化し、障害の発生確率やインパクトを定量的に扱うことができる。

3.CRAMM(CCTA Risk Analysis and Method Management)

 「資産」「脅威」「脆弱性」という3つの観点からリスクを分析し、対策を講ずるリスク分析手法である。

可用性管理で扱われる式

 代表的な計算式を3つ紹介しておこう。(図1)

図1:可用性管理の計算式

1.平均修理時間(MTTR:Mean Time To Recovery)

 一般に「ダウンタイム」と呼ばれるものである。障害が発生してから復旧するまでにかかる平均時間のことである。この値を減らすためには、故障個所の特定をしたり、修理をしたりする際の手順をきちんと決めておく、修理部品や予備機をすぐそばに常設しておく、といった方法が考えられる。

2.平均故障時間(MTBF:Mean Time To Failure)

 一般に「アップタイム」と呼ばれるものである。障害が復旧してから次の障害が発生するまでの平均時間のことである。この値を増やすためには、より信頼性のある機器に交換する、機器を多重化する、前述の分析手法を用いてSPOFを特定し、あらかじめ見合った対応をとっておく、といった方法が考えられる。

1.平均システムインシデント間隔(MTBSI:Mean Time Between System Incidents)

 連続する2つのインシデント間の平均時間のことである。MTBFとMTBSIの値を分析することで、障害の発生頻度とそのインパクトが分かる。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ