米Salesforceは、日本時間11月15日午後から夜にかけて発生した「Salesforce」のグローバルな障害の原因と対策について中間報告を、17日に発表した。原因は、「誤ったコマンドを含むデータベースメンテナンスタスクの実行」だったとみており、再発防止策を講じるとしている。
障害を検知したのは、日本時間15日午後2時55分ごろ。問題のコマンドを含むデータベースの変更を、コアサービスのインスタンス全体に展開していた際に起きた。
問題のコマンドが、Salesforceアプリとデータベースを適切に操作するために必要な内部オブジェクトを削除してしまい、それが多くのデータベースで実行されてしまったという。
同社は影響を受けたインスタンスを修正しつつ、データベースの変更を中止。ロールバックして16日午前0時22分までに障害が解消した。顧客のデータにも影響はなかったという。
この後も一部のユーザーで、パフォーマンス低下などの問題が続き、個別に対応。16日午後2時6分までにすべての障害対応が終了したという。
再発防止策として、本番環境を変更する際の承認プロセス強化、データベース構成変更時の監視強化やガードレールの追加、アプリケーション機能に影響を与え得るコマンドの制限の見直しなどをあげている。
「Salesforce」で障害発生 金曜夕方直撃で、ユーザーからは悲鳴【復旧済み】
ブルースクリーン問題の米CrowdStrike、「Uber Eats」10ドル分の詫びクーポンを配って苦笑される
世界規模のWindows障害が情シス的にだいぶ恐怖なワケ ブルースクリーン多発事件
Spotify、3月8日に起きた世界規模のログイン障害について原因を報告 Google Cloudの障害が影響Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR