この記事は新野淳一氏のブログ「Publickey」に掲載された「インシデント発生時のチーム対応を支援する「Grafana Incident」、無料でGrafana Cloudが提供。SlackやGitHubなどと連携」(2022年9月15日掲載)を、ITmedia NEWS編集部で一部編集し、転載したものです。
Grafana Labsは、インシデント発生時にチームでのインシデント対応を支援するクラウドサービス「Grafana Incident」をGrafana Cloudで無料提供することを発表しました。
システム運用中に何らかのインシデントが発生した場合、インシデントの状態把握、原因の調査、インシデントからの復旧、ユーザーや関係者への報告など、それぞれの役割をアサインされた担当者がチームとなってインシデント対応にあたることになります。
Grafana Incidentは、これらのインシデント時に要求される担当者のアサインとそれぞれの業務の支援、進捗の共有などを支援し管理できるクラウドサービスです。
Grafana Incident上でインシデント発生が宣言されると、自動的にそのインシデント専用のZoomやGoogle Meetのオンライン会議室、Slackの専用チャンネル、Google Driveのフォルダなどが設定され、調査担当、管理者(Commander)など担当者のアサインも行うことになります。
また、チャットボットがGrafana Incidentのコマンドライン上で関連するダッシュボードへのリンクを投稿。GitHub Issueと同期し、Grafana Incident上でIssueの状況も把握できます。
管理者はタスクマネージャを利用して各担当者へタスクを割り振り、タスクの進捗を管理できます。
これらの機能によってタスクの管理と進捗、インシデントの状況などをGrafana Incidentで管理できるとともに、Grafana Incident上では「Activity timeline」と呼ばれる機能で、何が起きているのか、何が行われているのかが時系列でまとめられます。これにより途中からインシデント対応チームに参加したメンバーもこれまでの経緯を容易に把握可能です。
インシデントが解消した後は、ポストモーテム(事後検証)プレゼンテーション機能が、インシデントの振り返りとまとめを支援してくれます。
Grafana IncidentはGrafana Cloudのフリーティアを含めた全てのユーザーが無料で利用できるとのことです。インシデント対応のベストプラクティスを体験し、参考にできるサービスではないでしょうか。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR