設計段階から運用管理を意識せよシスマネ必携! 運用管理ルールブック

上手なIT運用管理のノウハウは、豊富な運用実績と的確な情報蓄積、見直しを繰り返してきたプロに聞くのが一番。ITアウトソーシング事業者の持つノウハウ集においては、設計段階から運用を強く意識することを求めている。

» 2007年08月08日 07時00分 公開
[岡田靖,ITmedia]

このコンテンツは、オンライン・ムック「運用管理の過去・現在・未来」のコンテンツです。関連する記事はこちらでご覧になれます。


ルール1:障害は必ず発生するものと想定して設計せよ

 機械は常に故障の可能性を持つ。どんなに耐障害性を高めたところで、システムに障害が発生しない保証はない。むしろ、いつか必ず障害が発生する、という前提で設計を行うべきだ。

 例えば、ハイエンドのディスクアレイなどは、障害前提のシステム設計の参考になるだろう。HDDは故障しやすい部品のため、故障を前提としてストレージ全体の障害を回避するよう設計されている。中でも分かりやすいのは、HDDの冗長化に関する部分だろう。最近では、RAID6と呼ばれる、1つのHDDグループ内で2つの冗長化を行える機能を備えた機種が増えてきた。RAID6では、1つのHDDが故障した状態でも冗長化を維持でき、安全に運用を継続できるのが大きな特徴となっている。

 故障したHDDのデータは、他のHDDに記録されているデータから再構成し、予備のHDDに書き込むことが可能だ。運用を止めずに再構成処理を行う場合、生き残ったHDDに対して通常の読み書きに加えて、再構成のための読み込みが行われることになる。そのため通常運用時より負荷が格段に高まり、故障の危険も高まる。また、同一ロットのHDDは同じタイミングで故障しやすいという経験則もある。こうした理由から、RAID6のような「冗長化の冗長化」を行うのがトレンドとなったのだ。

 冗長化は、システムの安定性向上に大きな効果を発揮する。だが、冗長化設計を行うのであれば、それと同時に冗長化が正しく機能しているかどうかのチェック機構を盛り込み、さらに冗長化が失われた状態での運用についても意識する必要がある。

ルール2:システム設計時には保守作業の手順も同時に設計せよ

 故障を想定するなら、その後の保守作業も想定しておくべきである。もちろん、バックアップやデータベースのインデックス再構築、あるいはアップデートパッチ適用などといった日常的な保守作業についても同様だ。

 こうした保守作業を想定できるのであれば、安全かつ確実な作業手順を設計することも可能なはず。作業ミスを防ぐために、設計した手順についてマニュアル化を行うのはもちろん、シェルスクリプトやジョブ管理ツールなどを用いて可能な限り自動化を図るべきであるのは、第1回で解説したとおりだ。

 なお、設計開発と保守運用の担当者が別である場合、こういった部分まで細かく作り込むには、設計開発担当者の技量はもちろん、保守運用担当者からのフィードバックが欠かせない。設計段階のかなり上流の部分から、保守運用担当者が参加し、協力し合って「保守しやすいシステム」を作り上げていくべきであろう。

ルール3:セキュアなリモートアクセス手段を用意せよ

 データセンターは、できるだけ無人で運用しておきたいものである。常に乾いた冷風(ときには熱い排気)と騒音にさらされ、しかも狭苦しいラック前で作業するのはオペレータの作業環境としても良くないばかりか、ヒューマンエラーが他の無関係なシステムにも及びかねないという危険も伴う。ハードウェア自体の保守は別として、できるだけラックの前で作業しないことが望ましい。

 そのためには、適切なリモート操作環境が必要となる。リモート操作環境といっても、さまざまな種類があるが、現時点ではKVMスイッチが最善の解と言えそうだ。サーバの電源やリセットボタンなども扱うことができるし、BIOSの操作も可能だ。しかも、リモートからウイルスなどが入り込む心配もない。

 KVMスイッチを選ぶポイントは、いくつかある。まずは、確実な認証を行える製品であることが必須だ。オペレーターの担当するサーバにのみアクセス可能とし、他のサーバに触れる可能性を排除するべきである。

 また、オペレータの操作ミスや不正な操作に備え、その操作内容を記録しておく機能も望まれる。情報漏えい防止、内部統制といった観点からも役に立つし、操作ミスからのリカバリーに際しても操作記録が有効な情報となるからだ。

 これは主に中〜大規模のデータセンターに関するノウハウと言えるが、中小規模のサーバ室であってもリモートアクセス手段は役に立つ。規模が小さなところでは運用担当者が24時間365日の常駐をすることも難しいが、リモートアクセスができるなら、サーバ室にいなくても迅速な対応が可能となる。さらに、適切な運用監視ツールを用い、トラブルやその予兆となるしきい値でのメール通知機能を活用していれば、より効果的だ。(取材協力:野村総合研究所)

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ