ファーストサーバ、データ消失事故の再発防止策を発表

開発および運用体制の見直しやデータバックアップの強化、リスクマネジメントに関する組織の設置などを8月24日までに実施するとしている。

» 2012年08月10日 12時09分 公開
[ITmedia]

 レンタルサーバ事業者のファーストサーバは8月10日、6月20〜21日に発生した大規模なデータ消失事故に関する再発防止策を発表した。7月31日に第三者委員会から受領した最終調査報告書およびその要約版を基に、開発および運用体制の見直しやデータバックアップの強化、リスクマネジメントに関する組織の設置などを8月24日までに実施するとしている。

 再発防止策は、最終調査報告書が指摘した2つの事故(システムメンテナンス作業での過失およびデータの消失)に沿って段階的に実施するという。第1事故(システムメンテナンス作業での過失)に対する実施計画は以下の通り。

再発防止策および実施計画

開発・運用プロセスの見直し(8月10日までに実施完了予定)

1.システム変更のための社内マニュアルを開発プロセス、運用プロセスの視点により検証し、安全性を確認した上で、部内ルールとして再徹底する。

2.潜在的な問題が発見された場合には、リスク分析の上で対処方法を検討。

3.開発・運用プロセスについて、以下の改定を行う。

A.運用組織における「リリース作業」の受け入れ厳格化と受け入れ基準の明確化

(a)本番システムのシステム変更権限を運用部門に限定し組織牽制を明確にする。

(b)運用部門にて受け入れ業務を定義し、システム変更作業の受け入れを可能とする。

(c)システム変更のための社内マニュアルに則った受け入れ基準(条件)を定義する。

  • 運用部門での配布試験
  • 運用部門でのサンプリングによるシステム検証試験
  • 各種レビューの実施状況と結果
  • CS部門など関連部門への外部仕様レビュー結果など

(d)リリース作業に関するワークフロー及び条件を運用部門内においても整備する。

B.完全に排除できないリスクへの対応

(a)システム変更のための社内マニュアル及び配布システムを利用しても発生するリスクとして重大と判断した以下のケースにおいては、コードレビューの実施についてシステム変更のための社内マニュアルに規定する。

  • プラグインを開発し、システム変更を実施する場合
  • ホスト環境のシステム変更を実施する場合

(b)その他関連する課題についても、以下の通り、規定の追加や見直しを実施する。

(i)検証範囲に関する課題の検討――配布範囲と検証内容の適合性を確認する規定を追加し検証内容の漏れを無くす。

(ii)バックアップ領域に関する運用の明確化――バックアップディスクへの変更について、明確に禁止した条項が無いことから追加し、バックアップディスクの更新禁止を明確化する。

(iii)プライマリディスク障害時の運用設計――プライマリディスクに障害が発生した場合の対策について検討し、リスクの回避を実施する。

牽制(開発・運用)を含めた体制の確立(8月24日までに実施完了予定)

1.開発、運用組織に関しては兼務者を極力廃止し、責任と役割の分担を明確化する。

2.開発部門と運用部門を分離し、社内ルールの徹底及びシステム変更管理業務の責任範囲を明確化する。

システム変更業務の運用移管と分掌整理(8月24日までに実施完了予定)

1.システム変更のための社内マニュアルにて記述されているシステム変更に関する業務フローについて見直しを実施し、本番環境下のシステムへのリリース作業を運用部門へ移管することにより、開発担当者の属人的なシステム変更を抑制する。

2.業務移管にあたっては、システム変更のための社内マニュアルの改善にて実施する「運用組織における受け入れ基準の明確化」に基づいた運用部門での受け入れ精査を実施する。

3.業務フローの見直し(曖昧な内容の排除)を実施し、開発部門と運用部門の業務を明確化する。

2次バックアップの取得(7月25日より取得開始済み)

1.毎朝午前6時30分に同一筐体内で取得する現在の運用のバックアップに加え、オペレーションミスや、プログラムのバグなどの影響を受けない外部バックアップシステムを構築し、2次バックアップを追加する。

2.2次バックアップシステムは、バックアップシステム側から本番環境下のサーバに接続してデータを取得する設計とし、サーバのオペレーションや更新プログラムの配布システムの不具合によるデータの消失が発生しにくい仕組みとする。なお、バックアップ周期、世代管理数に関する仕様は、現在策定中。


 これらの施策は第1事故の対象となったサービスより実施し、その他サービスについては順次実現性を検討して、再発防止策の対象とするか否かを検討していくという。

 第2事故(データの消失)に対する再発防止策は以下の通りとした。

第2事故の前提となった第1事故の防止

第2事故の前提となった第1事故の再発防止策の実施。

データ消失時の対応マニュアル整備(8月10日までに実施完了予定)

それでも第1事故のようなデータの消失事故が発生した場合に備え、データ消失時の対応マニュアルを整備して、第2事故のような情報の漏えい事故の発生を防止する。具体的には、データ復旧ソフトによる復旧は実施しないことを明確化する。

リスクマネジメントに関する組織の設置(8月21日までに実施完了予定)

第2事故と同様に、事前に想定していない事象が発生した際に、場当たり的な対応にならないよう、リスクマネジメントに関する組織を設置し、重大事故発生に備えた社員教育などを実施する。


 また同社は、関係社員を所要の手続きを経て処分したほか、磯部眞人代表取締役社長から役員報酬の月額50%、本山一幸取締役管理部長から同30%を、ぞれぞれ3カ月間自主返納するとの申し出があったことを併せて明らかにした。磯部社長は、「今回の事態を厳粛に受け止め、二度とこのようなことを起こさぬよう、再発防止に万全を尽くし、一日も早く皆様の信頼を回復できるよう社員一同、全力で取り組んでまいります」との声明を発表している。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ