雷、サージ……電源を巡るトラブルからシステムを守るディザスタリカバリで強い企業を作る(2/4 ページ)

» 2006年08月25日 16時15分 公開
[佐志田伸夫,ITmedia]

ファシリティ関連のディザスタ

 次に、サーバルームが置かれた建物や設備そのものなど、ファシリティ関連のディザスタ要素を考えてみよう。大きく次のような現象が挙げられる。

1)地震:振動によりIT機器やファシリティ機器に物理的な被害をもたらすとともに、長時間の停電や空調用の冷却水供給停止などの原因ともなる。

2)空調機の能力不足による温度上昇:IT機器の発生熱量増大に空調設備の能力が対応できていないと、仕様を超える温度上昇が発生する。特に、外部温度が高い夏季には空調室外機の能力に余裕がなくなるので注意が必要だ。また、オフィスの全体空調と共用になっている場合には、夜間や休日に空調機が停止したり、冬季は暖房になったりするので、IT機器の冷却には適さないことがある。

3)空調機の故障停止:空調機には可動部分があるため、電気的な故障以外に機械的な故障が発生する可能性がある。また、フィルタ清掃などのメンテナンスで定期的に停止させる必要もあるため、IT機器の稼動条件との整合を図る必要がある。さらに、IT機器の高密度化により、停電などで空調システムが停止してしまうと、急激に温度が上昇するため注意が必要である。

4)水害:IT機器も水に浸ってしまえば、なんら用を足さなくなる。

リカバリの目安は?

 「ITシステムがどれくらい停止することなく稼動できるか」を評価するための指数としてよく使われる目安が、「可用性」(アベイラビリティ)だ。これは、装置が稼動すべき全時間に対する実際の稼働時間の割合として表され、次のような関係がある。

 ディザスタリカバリとの関連で考えると、MTBFはディザスタの影響を最小限にとどめるための事前準備、MTTRはディザスタが発生してしまった場合の迅速な復旧、と言い換えることができる。可用性を向上させるには、事前の準備による信頼性向上と、ディザスタ発生時に迅速な復旧ができるようにシステムを構築しておくことの両方が重要である。

●MTBFの向上

 システムの信頼性を高める一般的な手法は冗長化である。また、ヒューマンエラーによるディザスタを避けるためには、標準化も有効な手段である。さらに、故障が発生する前に事前に診断、部品交換などを行う「予防保守」「メンテナンス」も欠かすことができない。

●MTTRの削減

 万一システムに故障が発生した時の復旧時間を早めるには、

1)故障部位を早く特定し

2)短時間で修理する

必要がある。そのために、システムに故障検出/警報機能を設けるとともに、標準化やモジュール化によって故障部位を短時間で交換し、復旧できるようにしておくことが望ましい。

 例えばモジュール化されたUPSでは、予備モジュールを準備しておき、万一の故障時にはそれを交換することにより、MTTRを10分の1以下に短縮することができる。したがって、可用性を一桁高くすることも可能である。

 もう1つ忘れてはならないのが、機器の保守サービス契約だ。MTTRを許容範囲内に収めるために、故障時などの対応時間(たとえば4時間以内に対応するのか、あるいは翌日になるのか、など)を明記したSLA(サービスレベルアグリーメント)を契約に含めるケースも多くなっている。

いざ、対策を考えよう

 では次に、これらのディザスタに対し、具体的にどのような対策を実施すればよいか説明しよう。

●電源周りの対策

 電源障害に備えたUPS(無停電電源装置)の設置は、特にサーバルームなどの場合はほぼ常識となっている。UPSは、前述の7つの電源障害すべてに効果を発揮してくれる。

 しかし、UPSを選択する場合にも、前述の可用性の条件をよく検討する必要がある。例えば、モジュール方式のUPSはMTTRを短くするため、リカバリ時間の短縮、すなわち可用性の向上に大きな効果がある。

 ただし、UPSは自家発電装置ではない。電源に異常が発生した際に、最低限正常にシャットダウンを行えるだけの時間を稼ぐための機器ととらえるほうがいい。設計されたバッテリバックアップ時間(通常5〜10分)以上停電が継続すると、結局は出力電圧がなくなり、最終的にはIT機器に影響が及んでしまう。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ