システム運用では、原因究明より大切なことがあるシステム管理入門(8)(2/3 ページ)

» 2010年09月21日 12時00分 公開
[谷 誠之(テクノファイブ),@IT]

原因を究明している間、システムは通常通りに使えない

 しかし、この症例はこれで解決とはいきませんでした。電源装置を交換してもらって、元気に動き出したはずのPCが、しばらくするとまた気まぐれな再起動を繰り返すようになってしまったのです。PCメーカーとサービススタッフに対する私の尊敬は一瞬にして崩れ去りました。あれだけ自信を持って「それは電源装置の不具合ですと言ってたのに違うじゃないか」と。再び(ちょっと怒り気味で)サービスセンターに電話をしました。

 先日と同じ人がやってきました。私は勝手に「電源装置じゃなくて、CPUかメモリがおかしいんじゃないの?」と思っていましたが、結局、そのサービススタッフは「なぜ再起動を繰り返すのか」という原因究明に乗り出しました。かなり長い時間がかかりました。私は「そんなこといいから早く修理してくれよ」という気持ちでいっぱいです。そう、原因究明という活動は、インシデント管理の本質と矛盾するのです。原因究明という活動をしている間は、そのPCは使えないわけですから。

 やがて根本原因が分かりました。それは実に意外な(しかし聞けばもっともな)原因でした。サービススタッフは「ついに宝箱を見つけた」という顔で言いました。

 「このPCがつながっているコンセントの電圧がフラついていますね」

 何と根本原因は電圧のふらつきだったのです。ここで、先ほど述べた「古いビル」という伏線が生きてきます(そんなおおげさな話でもありませんが)。オフィスに大量のPCが導入されることを想定せずに建てられたそのビルは、いっぺんに増えたPC(とブラウン管のディスプレイ)の電源容量を全て賄えるだけの設備が用意されていなかったのです。後から分かったのですが、全てのコンセントの電圧が100ボルトを下回っていました。そして、その気まぐれに再起動を繰り返すPCがつながっていたコンセントは、なんと90ボルトをも下回っていたのです。

 時間はかかったけれど、ちゃんと根本原因を特定してくれたサービススタッフ。私の思いは、ふたたび尊敬へと変わりました。めまぐるしい。CPUやメモリじゃなかったんですね。疑ってごめんなさい。

 ちなみに電気事業法では、供給電圧は101Vの6V前後、つまり95V?107V が許容範囲と定めています。ただ、これは電力会社とビル内配線の境目のところで計測する数値なので、そこから分電盤やブレーカー、構内配線を通ってコンセントに到達した時点では電圧はもう少し下がることになります。従って、たいていの電気器具は 90V?110V程度の電圧を許容範囲としていますが、さすがに90Vを割り込んでしまうと稼働することはできせん。

 こうして根本原因が「電圧のふらつき」と分かったところで、次は再発防止策を検討する必要があります。とはいえ、私が勤めていた会社は、そのビルの一テナントに過ぎませんし、ビル内の配線をいじるのは大変お金が掛かります。そこで結局、比較的安価な CVCF(Constant Voltage Constant Frequency)??定電圧定周波数装置(安定した交流電力を提供し続けられるようにする装置)をコンセントに設置することで、解決することとなりました。

 さて、皆さんはこの話の教訓がどこにあるか、お分かりでしょうか?

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ