確率論を究める――交通事故とシステムダウンの関係:ITIL Managerの視点から(3/3 ページ)
今回は、可用性を高めるために先人が残した分析手法を紹介する。温故知新という言葉もある。昔から色々と研究され、編み出された手法を使わせてもらうのは非常に有効な手段である。
確率の2要素
「確率の2要素」について、「東京から大阪に移動中、事故にあって命を落とす」という(物騒な……)状況を例にとり、考えてみる。話を簡単にするために、移動手段は新幹線と飛行機に限定しよう。
ある統計によると、航空機が事故を起こす確率は438年に1回なのだそうだ。一方、新幹線は1964年の開業以来、地震やトンネルのコンクリート片の落下などが原因で、脱線をはじめとした多くの事故が起きている。少なくとも、「事故が起きる確率」は飛行機よりもはるかに高い。
一方、事故が起きてしまった際に命を落とす確率を考えてみる。統計的な数字はさだかではないが、飛行中の航空機が墜落したらまず助からないだろう。命を落とす確率は非常に高いといえる。一方、新幹線は開業以来、事故が直接の原因で乗客が亡くなった事例は1995年に1件あるだけである。そう考えれば新幹線は、事故そのものは多いものの、事故が起こっても命を落とす可能性は極めて低いと考えられる。
同じようなことが、システムにも言えるだろう。すなわち、「その事象が本当に起こる確率」と、「その事象が起こったときに致命的な損害が発生する確率」は分けて考えなければならないのである。例えばハードディスクがクラッシュしてしまったら、中身を参照できる可能性はまずない。しかし人的ミスでデータを失った場合は、特定のレコードだけが消える可能性は否定できないものの、すべてのデータが消失してしまう可能性は極めて低いだろう。
もしこれらの分析ツールを使ってみたいと思ったら、これらのツールの使い方をきちんと学習してから使うことをお勧めする。
谷 誠之(たに ともゆき)
IT技術教育、対人能力育成教育のスペシャリストとして約20年に渡り活動中。テクニカルエンジニア(システム管理)、MCSE、ITIL Manager、COBIT Foundation、話しことば協会認定講師、交流分析士1級などの資格や認定を持つ。なおITIL Manager有資格者は国内に約200名のみ。「ITと人材はビジネスの両輪である」が持論。ブログ→谷誠之の「カラスは白いかもしれない」
関連記事
- 究極の選択――落ちないシステムとすぐ直るシステム
MTTR(平均修理時間)が短いシステムとMTBF(平均故障間隔)が長いシステム、あなたならどちらを選択するだろうか。システム管理者にとっての究極の選択である――。 - 初めてのサービスレベルアグリーメント【その3】
SLAを支援する文書として、OLA(Operational Level Agreement)およびUC(Underpinning Contract)を紹介する。 - 初めてのサービスレベルアグリーメント【その2】
連載初回では、SLAの意義や作成手順について述べた。今回は、SLAの具体的な中身を解説する。 - 初めてのサービスレベルアグリーメント
企業のIT担当者ならば、「サービスマネジメント」というコトバに聞き覚えがあるだろう。要は効率の良い、費用対効果の高いシステム管理のことであるが、ITがビジネスの根幹になって以来、未解決の課題となっており、多くのIT担当者がその実現に悩んでいるのだ。 - ITガバナンスを定義してみる
- ITILの成り立ちと現状を知る
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.