この記事は新野淳一氏のブログ「Publickey」に掲載された「Amazon CloudWatch、機械学習により異常値(アノマリー)を自動検出できる新機能」(2019年10月25日掲載)を、ITmedia NEWS編集部で一部編集し、転載したものです。
ITシステムの運用監視において、通常とは異なる状態、例えば急にトラフィックが跳ね上がる、動作速度が遅くなる、プロセッサの使用率が上がる、ネットワークのレイテンシが大きくなる、などを検知し、警告を発することはもっとも基本的かつ重要な機能です。
しかし、通常の状態にはある程度の幅があります。一体どの程度の範囲を超えたら異常であると判断するのか、閾値の設定は容易ではありません。
閾値を低くすれば、ひんぱんに異常と判断されて警報がいつのまにか軽視されてしまう心配があります。逆に閾値を高くすれば、小さな異常が見過ごされてしまう恐れがあるため、適切な設定には試行錯誤が必要です。
しかも昼と夜、平日と休日では適切な閾値は異なるでしょうし、キャンペーン期間やテレビコマーシャルの投入など特定の期間も閾値は変化するなど、閾値の設定は動的に行う必要もあります。
こうした難しい異常値の検出を機械学習により自動的に行う「Anomaly Detection」(異常検知)機能を、AWSの監視サービスであるCloudWatchが搭載したことが発表されました。
下記は「New - Amazon CloudWatch Anomaly Detection」から、CloudWatch Anomaly Detectionの説明を一部引用します。
CloudWatch Anomaly Detection has its roots in over 12,000 internal models. It will help you to avoid manual configuration and experimentation, and can be used in conjunction with any standard or custom CloudWatch metric that has a discernible trend or pattern.
CloudWatch Anomaly Detectionは、1万2000を超える内部モデルを起源に持ち、手作業による設定と試験を不要とし、識別可能な傾向やパターンを持つCloudWatchの標準もしくはカスタムなあらゆるメトリクスを扱えます。
CloudWatch Anomaly Detectionは、管理画面からアイコン(下図の波型アイコン)をクリックするだけで指定されたメトリクスの履歴データを読み込み、機械学習を基に正常値の範囲を自動的に設定します(画像も上記記事より引用)。
機械学習の結果グレーの範囲が正常値の範囲として設定され、この範囲から外れた値が自動的に異常値と判断されるわけです。
機械学習の対象から取り除きたい履歴の期間も設定でき、機械学習のモデルもカスタマイズ可能。
CloudWatch Anomaly Detection機能は全リージョンで利用可能になっているとのことです。
関連記事
- AWS障害、“マルチAZ”なら大丈夫だったのか? インフラエンジニアたちはどう捉えたか、生の声で分かった「実情」
AWSの障害に、各社はどのように対応したのか。ITmedia NEWS編集部では問題に直面した企業やエンジニアに聞き取り調査を行った。生の声から、実情が見えてきた。 - 「君、今日からクラウド担当ね」 未経験者が1人で始めた、ファミマのAWS移行の舞台裏
「AWS Summit Tokyo 2019」のセッションに、ファミリーマートでクラウド移行の責任者を務める土井洋典さんが登壇。土井さんは、前任者が突然退職したため、ある日突然上司からクラウド担当を任された経験を持つ。たった1人でのスタートだったというが、どうやってAWS移行を成功させたのだろうか。 - Slackに新機能 連携アプリを一括管理、電話会議や高度なデータ収集にも対応
Slackに新機能が順次追加。連携済みの外部アプリを一括管理できるようになる。「Block Kit」もアップデートされ、開発者が必要な設定を済ませると、Slackのホームタブ上で電話会議など外部アプリの幅広い機能を利用可能になる。 - Amazon決算は増収減益 AWSの伸びが鈍化
Amazonの7〜9月決算は、売上高は24%増だったが、純利益はプライム会員向け翌日配送のための投資がかさみ、26%減だった。AWSの売り上げは伸びているが、そのスピードは鈍化している。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.