ITmedia NEWS > 社会とIT >
セキュリティ・ホットトピックス

サーバダウンはなぜ起きる? AWSやMicrosoftでも発生、原因と対策はこの頃、セキュリティ界隈で(1/2 ページ)

» 2023年06月28日 10時00分 公開
[鈴木聖子ITmedia]

 クラウド最大手の米Amazon Web Services(AWS)で6月に起きたクラウドサーバの障害は、大手企業のアプリやサービスなどに大きな影響を及ぼした。同月初旬には「Microsoft 365」がダウンしてOutlookやWordが一時的に使えなくなる障害も発生。AmazonやMicrosoftのような最先端企業でさえも防ぎ切れないサーバダウンは、なぜ起きるのか。

サーバダウンはなぜ起こるのか?

 今回のAWS障害は米東部時間6月13日にUSイースト1リージョンで発生。原因は「AWS Lambdaの容量管理を担うサブシステムの問題」だったと説明している。

 AWSでは同リージョンで2022年12月にも「複数のネットワークデバイスの障害」が発生した他、過去にもソフトウェアの問題や人為ミスを原因とするサーバ障害に見舞われたことがある。そのたびにAWSを利用する顧客のサービスやWebサイトがつながりにくくなったりダウンしたりする被害が広がり、クラウドサービスの障害が及ぼす影響の大きさを見せつけた。

サーバ障害の原因とは?

 システム障害については金融庁が毎年、金融機関で起きた事例に関する分析レポートをまとめている。21、22年のレポートによれば、サーバの障害は主にシステム統合や更改、プログラム更新、普段と異なる特殊作業、日常の運用・保守などの過程の中で発生しているという。

 原因については「作業に起因してどのような障害が発生し得るのか想定できていないなど、適切にリスクを認識するに至っていない」「リスクマネジメントプランの整備が不十分なまま作業が実施された」などと分析。また、本番環境のシステムで行った作業の誤り、委託先での作業の誤り、設定の不備といった人為ミスや知見不足に起因する障害も多いと指摘する。

システム障害の一例(金融庁のレポートから引用)

 自社で未然に防止することが困難なクラウドサービスの障害も増えていることから「障害を想定した代替手段の確保やサードパーティーとの不断の情報連携などの取り組みが必要」とレポートでは解説している。

注目商品・サービスではアクセス集中も

 他にサーバダウンの原因としてよくあるのがアクセスの集中だ。これはサーバが許容できるアクセス数を超過し、サーバに過剰な負荷がかかってしまうことで発生する。特に人気ゲームサイトや注目の商品・サービスに関連したWebサイトなどで起こりやすい。

 最近ではバンダイナムコが新作ゲームをリリースした直後にグループ共通アカウントで障害が発生し、負荷が集中してログインしづらい状況が続いた。Reebokの日本公式ECサイトは、ジャニーズコラボ商品を発売した影響でつながりにくくなった。「サーバ最強」で臨んだはずだったが、予想を上回るアクセスが殺到して最強を越えてしまったらしい。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.