IaaS障害、ユーザー企業はどう対処すればいい? クラウドベンダーが教える対応法と振り返り(2/2 ページ)
IaaS障害は一種の災害のようなもので、ユーザー企業側では解消できない。しかしユーザー企業のサービスは自力で復旧させる必要がある。障害発生時や収束後にユーザー企業がやるべきことをクラウドベンダーに聞いた。
対応が終わったら振り返りを 人員の冗長化も重要
障害対応が一段落したら、システムの構成と社内の体制を見直すフェーズに移る。
まずは冗長化構成の見直しだ。冗長化をしておらず、IaaS障害に巻き込まれた企業は、障害を機に冗長化を検討するのがいい。かけられるコストや人的リソースとも相談しながら、サーバ単位で冗長化するのか、データセンター単位で冗長化するのかを検討できる。
同じ構成でも制御ソフトウェアの設定を変えるだけでコストをかけずに障害耐性を上げることもできる。IaaS障害発生時にソフトウェアが思い通りに動かず、冗長化していたにもかかわらずユーザー企業のサービスがダウンした事例もあるため、ソフトウェアの設定見直しは必要な作業だ。
次に検討できるのが社内の体制だ。障害対応では「対応経験もマニュアルもなく、エンドユーザーへどのように告知すればいいか分からない」「障害対応が属人化している」「上司への報告基準が分からない」など、ハードウェアもソフトウェアも関係ないところで多くの課題が洗い出される。
これを記録に残し、検討を加えることで「障害発生から告知までのフローを文書化しよう」「人員を増やして教育も施し、属人化を解消しよう」「報告ガイドラインを定めよう」など対処ができる。
ここで考えられるのが“人員の冗長化”だ。属人化を防ぐため、障害対応に当たれる人材を複数人配置するのも人員の冗長化といえる。
複数人を別の勤務地に分散させるのも有効だ。IaaS障害は自然災害で発生することもある。同じ地域に複数人配置していても全員被災して障害対応できないという可能性もある。地域を分散させれば一方が被災していても、もう一方が対応できる。
このようにIaaS障害への対応はその場の復旧作業だけでなく、事前の準備と事後の振り返りが重要だ。このような対応はIaaS障害に巻き込まれてみないと気付きにくい。しかしIaaS障害に巻き込まれて気付くようでは遅いこともある。だからこそ、日頃からIaaSへの理解を深め、想像力をもって対応方法を検討するのが大切だ。
関連記事
- IaaS障害はどこでどうやって起きるのか? ユーザー企業が受けるサービスダウン以外の影響とは
日本では官民でIaaSの活用が進んでいるが、大手クラウドサービスの影響力が増した分、障害発生時の影響の大きさも目立ってきた。IaaS障害に対処するには、障害が発生する場所と原因、影響範囲を知り、冗長性確保や責任の明確化などを行うのが重要だ。 - 設定ミス→漏えいの影に潜む“クラウドへの誤解” いま理解したい「責任共有モデル」
クラウドサービスの活用が広がるのに比例して発生する、設定ミスに起因するセキュリティ事故。数々のインシデントが報じられる中、なぜこういった事故はなくならないのか。ガートナー ジャパンの亦賀忠明さんによれば、背景には日本企業特有の「クラウドへの理解不足」があるという。 - 富士通、東証のシステム障害で謝罪 「原因究明、再発防止に取り組む」
10月1日に東京証券取引所(東証)で発生したシステム障害の影響で国内の主要株式市場が終日取引停止となった件で、システム開発元の富士通が謝罪。同社の時田隆仁社長は「原因究明、再発防止に取り組んでいく」と述べた。 - 「クラウドは信頼できない」は本当か? AWS、Office 365、自治体IaaSの障害を経て、私たちが知っておくべきこと
2019年は国内外で、大規模なクラウドサービスの障害が相次いで発生した。それに伴い、「クラウドサービスは信頼できないのでは」といった議論も巻き起こった。だが、オンプレミスにも課題はある。メリットとデメリットを認識した上で、クラウドとうまく付き合っていくべきだろう。そのために必要な基礎知識と考え方を、ITジャーナリストの谷川耕一氏が解説する。
Copyright © ITmedia, Inc. All Rights Reserved.