ITmedia NEWS > 社会とIT >

担当者が長年マニュアル無視、上長も容認──ファーストサーバ障害、調査報告書を公開

» 2012年08月01日 18時11分 公開
[ITmedia]

 ヤフー子会社でレンタルサーバを手がけるファーストサーバが6月に起こした大規模障害について、同社は7月31日、第三者委員会による最終調査報告書の要約版(PDF)を公開した。報告書によると、担当者がマニュアルを無視し、独自方式でシステムメンテナンスを行った際に使用した自作プログラムにミスがあり、顧客データの消失につながったという。「軽過失の枠内ではあるものの、比較的重度の過失」と報告書は判断している。

 報告書は、弁護士2人とセキュリティコンサルタント1人の計3人で構成する第三者委員会が作成した。フル版は同社の業務機密や、従業員の氏名などプライバシー情報が含まれるため、要約版のみを公開。「事故の原因究明に必要な情報は全て記載されている」としている。

担当者のマニュアル無視を容認、独自プログラムで更新 削除コマンド消し忘れ

 報告書によると、同社のシステムメンテナンスは通常、社内マニュアルに沿って行われるが、不具合を起こした担当者だけは約10年前からマニュアルを無視し、自ら作成した更新プログラムを利用するなど独自方式でメンテナンスを行ない、上長もそれを容認していたという。

 この担当者が6月20日午後5時ごろ、メールシステムの障害対策のため、以前作成した更新プログラムを改変し、更新プログラムを作成した。その際、過去に書いていた「対象外サーバ群のファイル削除」コマンドを消し忘れたという。

 検証環境下で対象サーバ群に更新プログラムを送付して実行したが、プログラムの不具合は「対象“外”のサーバ群のファイル削除」だったため、対象サーバ群ではこの不具合が見つからなかった。メンテナンスの内容自体は、空ファイルを対象サーバ群に作成するという簡単でリスクが低いものだったことから、担当者は会議中の上長の許可を求めず、「まず少数のユーザーに適用してから本番で実行」という通常のプロセスも省き、本番の更新を行っていいと判断したという。

 担当者は本番環境下で、更新プログラムを対象サーバ群だけでなく、対象外サーバ群を含む全サーバ群で実行。プライマリディスクとバックアップディスクを同時に更新した。その結果、プログラムに残っていた「対象外サーバ群のファイル削除」というコマンドが実行され、対象外サーバ群のデータがバックアップを含めて全て消失することになった。

 担当者は午後5時48分ごろ、監視システムによるアラートで異常に気づき、更新プログラムを緊急停止したが、その時点で対象外サーバ群のデータはほとんど全て消失していたという。

 報告書では、担当者がマニュアルに従わず、独自方式でメンテナンスしていたことや、更新プログラムを上長の許可なく全サーバで実行したことが過失に当たると指摘しつつも、担当者が約10年前から独自方式でメンテナンスを行い、これまで重大な事故はなかったことなどを勘案し、「軽過失の枠内ではあるものの、比較的重度の過失」と判断。故意と同視できるほどの過失(重過失)には当たらないと評価している。

 同社は開発・運用プロセスの見直しや、2次バックアップの取得など再発防止策を検討。報告書では、「一般的なレンタルサーバ業者の水準に照らしても、適切なもの」と評価している。

データ漏えいの可能性――顧客データ喪失経験なく、復元マニュアルなし

 同社が6月21日、消失したデータを復元して顧客に提供した際、同じサーバを共有する顧客同士などでデータが混在する不具合があり、情報が漏えいした可能性があった。

 原因は、同社が使用したオープンソースの復元プログラムに、復元したデータの混在や置き換わりが起きる可能性があることを認識していなかったこと。同社は顧客データ消失の経験がなかったため、データ復元にあたってのルールやニュアルが存在せず、復元プログラム利用時のリスクの洗い出しができていなかったという。

 報告書では、(1)復元プログラムで顧客データが混在する可能性があったにもかかわらず、データを復元して顧客に提供したこと、(2)データ消失を想定したマニュアルや手順書がなく、従業員に教育などを行なっていなかったこと──を同社の過失だと指摘。「軽過失の枠内ではあるものの、比較的重度の過失」と判断した。

 同社は今後、データ消失時の対応マニュアルを整備するほか、リスクマネジメントに関する組織を作ることなどで再発を防止するとしており、第三者委員会は再発防止策を「適切なもの」と評価している。

Copyright © ITmedia, Inc. All Rights Reserved.