この記事は新野淳一氏のブログ「Publickey」に掲載された「マイクロソフトのクラウドサービス「Microsoft Teams」がサーバ証明書を更新し忘れ。2時間のあいだユーザーからアクセスできなくなる障害発生」(2020年2月6日掲載)を、ITmedia NEWS編集部で一部編集し、転載したものです。
マイクロソフトがチャットサービスとして提供する「Microsoft Teams」は、急速に人気を高めているSlackに対抗するべくマイクロソフトが力を入れているサービスのひとつです。
先月、1月9日には日本の民事訴訟手続きにおけるIT化を推進するため、Web会議やコラボレーション用ツールとしてMicrosoft Teamsが採用されたと発表されています。
そのMicrosoft Teamsが日本時間2月3日夜11時19分から翌2月4日午前1時19分の少なくとも2時間、ユーザーからアクセスできなくなるという障害を起こしていました。
マイクロソフトによると、その原因はサーバ証明書の更新し忘れによる期限切れであることが明らかになっています。
ユーザーがMicrosoft Teamsにアクセスできないという障害が表面化したのは、2月3日夜11時19分。障害原因の調査が開始されます。
「We've determined that an authentication certificate has expired causing, users to have issues using the service.」(認証の証明書の期限が切れていることが、ユーザーがサービスを利用できない問題の原因であると特定しました)
Webブラウザとサーバとのあいだで安全な接続を行うために、一般にSSLと呼ばれる暗号化通信が使われます。Microsoft TeamsでもSSLが使われています。
SSLで通信を行うためには、サーバ側に暗号化のための鍵が含まれるサーバ証明書が必要となります。
このサーバ証明書には有効期限があり、現在では最大で有効期限が2年となっています。つまり、2年ごとに新しいサーバ証明書に更新する必要があるのです。
今回のMicrosoft Teamsの障害は、このサーバ証明書が適切に更新されず、有効期限が切れてしまったことが原因だということになります。
そしてこの原因が判明してから1時間後の午前1時19分。更新された証明書がデプロイされたことで復旧が開始され、無事にMicrosoft Teamsの利用が可能になりました。
マイクロソフトはその後、サーバ証明書が適切に更新されるような改善も行ったとのことです。
クラウドサービスを提供するシステムは、一部に障害があったとしても全体としてサービスは継続できるように冗長化や多重化が行われるものですが、システム全体に共通するサーバ証明書を用いたことで、ここが単一障害点のように作用してしまったようです。サービスの設計というのは難しいものですね。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR