モニタリングサービス「Datadog」で、3月8日午後3時半ごろから障害が起こっている。米国やヨーロッパなど、政府向けを除く全リージョンで問題が発生。セキュリティ監視やログ管理機能などに遅延・エラーが見られるという。
午後7時34分の時点では、各リージョンで問題の調査と軽減に取り組んでいるとしている。一部リージョンではエラーが起きにくくなったが、逆に発生しやすくなっているリージョンもあるという。
関連記事
- ChatGPTにKubernetesのアラート対応を教えてもらえる 監視ツールとAIをつなげる「Kubernetes ChatGPT Bot」登場
Kubernetesのモニタリングツールと「ChatGPT」を統合した「Kubernetes ChatGPT Bot」が登場。発生したアラートの内容を自動的に受け取り、対処方法をAIがチャットで教えてくれるという。 - Google CloudのPrometheusマネージドサービスが正式版に 6京5000兆のポイントを保持するバックエンド上に構築、事実上無限の指標に対応可能
Google Cloud上で動作する運用監視ツール「Prometheus」をマネージドサービス化した「Google Cloud Managed Service for Prometheus」が正式版になった。 - Oracle Cloudから運用監視ツール登場 マルチプラットフォーム対応 ログの一元管理、分析、分散トレーシングなど可能
米Oracleが、新サービス「Oracle Cloud Observability and Management Platform」を発表。さまざまなログの収集、解析、アプリケーション監視などを行える包括的な運用監視ツール。DevOpsなどの現場で役立つとみられる。 - Microsoft、フルマネージドな負荷テストサービス「Azure Load Testing」を正式リリース
米Microsoftが、クラウド上で大規模な負荷テストを行えるフルマネージドな負荷テストサービス「Azure Load Testing」を正式リリースした。 - 「いつの間にか精度が落ちて慌てて直す」──“AI運用あるある”を成功に導く「MLOps」とは
さまざまな企業がAIを活用するようになったが、AI開発はその前後の運用に課題がある。この課題をクリアする開発手法として、近年「MLOps」(エムエルオプス)という開発手法に注目が集まり始めている。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.