Googleのサービス障害にみるトラブル対策の勘所:Weekly Memo(2/2 ページ)
今回は、先週および先々週に相次いで起こったGoogleのサービス障害を中心に、大規模システムにおけるトラブル対策の勘所について考えてみたい。
浮き彫りになったリスクマネジメントの重要性
このGoogle AppsとGmailのサービス障害で気になったのは、障害時間の長さと、サービスを利用しているユーザーに対するGoogleの対応だ。報道によると、Googleの障害についての質問へのあいまいな回答や、サービス復旧時に原因の説明がなかったことに対して、不満に感じるユーザーが少なくなかったという。
実は今回のテーマとして掲げた大規模システムにおけるトラブル対策の勘所はここにある。Googleも当然、認識しているだろうが、とりわけGoogle AppsとGmailの長時間に及ぶサービス障害は、これからのSaaSおよびクラウドコンピューティング時代におけるリスクマネジメントの重要性をあらためて知らしめた格好となった。
ではどのようにリスクマネジメントすればよいのか。
前回の本コラムで紹介した富士通の野副州旦社長は、同社がシステムを担う東京証券取引所で7月に起きたトラブル対策として専任組織を新設し、「新組織は経営トップ自らが責任を持ち、経験やノウハウを持つ人材を投入して第三者機関として機能することによって、(東証のシステム障害のような)問題が二度と起こらないように、あるいは万一起こっても迅速に対応できるようにするのが使命だ」と語った。
このコメントの最後にある「万一起こっても迅速に対応できるようにすること」が、まさしく大規模システムのトラブル対策におけるリスクマネジメントの勘所である。
筆者がこれまで取材してきた大手企業のCIOもほぼ口を揃えて、「トラブルを起こさないように努力するのは当然だが、万一起こったときでもいかに短時間で復旧させるか、被害を最小限に食い止めるか、そして被害者への迅速なケアを行えるか。そうしたリスクマネジメントを万全に遂行できる体制と仕組みづくりが最も重要だ」と語っていた。
SaaSおよびクラウドコンピューティングにおけるサービス障害は今後、社会システムのトラブルと同様、ビジネスや生活に大きな影響を及ぼすようになる。さらにいえば、停電や断水と同じだ。その認識をしっかりと持って、ベンダーもユーザーもトラブル対策への万全なリスクマネジメントを心がけてもらいたい。
関連キーワード
三菱東京UFJ銀行 | Google | サービス障害 | 銀行 | Gmail | リスクマネジメント | Google Apps | システム障害 | ATM | クラウドコンピューティング
プロフィール
まつおか・いさお ITジャーナリストとしてビジネス誌やメディアサイトなどに執筆中。1957年生まれ、大阪府出身。電波新聞社、日刊工業新聞社、コンピュータ・ニュース社(現BCN)などを経てフリーに。2003年10月より3年間、『月刊アイティセレクト』(アイティメディア発行)編集長を務める。(有)松岡編集企画 代表。主な著書は『サン・マイクロシステムズの戦略』(日刊工業新聞社、共著)、『新企業集団・NECグループ』(日本実業出版社)、『NTTドコモ リアルタイム・マネジメントへの挑戦』(日刊工業新聞社、共著)など。
関連記事
- Google AppsとGmail、一部ユーザーで15時間にわたる障害
- Gmailでまたもサービス障害
- 三菱東京UFJのシステム移行は「概ね順調」
三菱東京UFJ銀行におけるシステム統合の第2弾が7月7日に始まった。 - 不具合の原因は「カタカナでなく漢字だったから」――三菱東京UFJのシステム障害
三菱東京UFJ銀行のキャッシュカードがセブン銀行のATMで使えなくなるシステム障害が発生した。原因は「カタカナで転送すべきデータを漢字で処理していたから」だった。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.