クラウド運用で起こるあるあるミスの対処法 オンプレと同じじゃ恩恵は受けられない?はじめてのクラウド導入“これ”に注意(2/2 ページ)

» 2023年04月11日 08時00分 公開
[折笠丈侍ITmedia]
前のページへ 1|2       

あるあるミス4:属人・手動ベースのシステム運用に頼る

 組織の頼りになるエキスパートやベテラン担当者には、責任や権限に加えてタスクが集りがちだ。企業文化やリソース面の制約など、さまざまな理由で彼らのナレッジ共有やスキルトランスファーが進まず、「特定の担当者に依存したまま」というケースも多い。この状態が長く続けば担当者のストロングポイントが逆に組織やシステムにとってのSPOF(単一障害点)になりかねない。

 属人的運用の改善にはワークフローの可視化や自動化ツールの導入、ドキュメント共有ツールの活用などで解決が図られる。ツール導入の際は、事前に関係者で「脱属人化の必要性の共有」や「移行期間の確保」などを話し合っておくことが重要だ。組織によってはシステム運用担当者の評価体系の見直しや企業文化の変革も必要になる。

あるあるミス5:承認ステップが増えがちになる

 一度、バグや障害、インシデントが発生すると、再発防止策の策定と報告のプレッシャーから既存の承認プロセスにやたらと承認ステップや承認者を追加したり、アプリケーションのテスト項目を増やしたりするなど、「障壁の追加」に走りがちだ。

 根本的な発生要因の特定作業においても、個人の判断ミスやオペミスに責任転嫁しがちで、その問題を引き起こした背景や構造的問題に着目した組織的で根本的な解決が講じられないケースも多い。

 結果、チェック項目を増やすだけで根本的な再発リスクは減らず、運用担当者の負荷とプレッシャーは高いままでビジネスの迅速性が失われるマイナススパイラルに陥る可能性がある。

 現場レベルで着手できる改善アプローチの一つとして、既存の承認プロセスの中に自動化できそうな項目があるかどうか確認するのが有効だ。そもそも手動の承認フローは「緊急」という名目や交渉でバイパスされ得る。承認の自動化が進めば強制と効率化の両立が進む。自動化できそうなプロセスが見つかったら、ワークフローのツールやサービスに組み込んだり、自前でコードを開発したりするなどして、PoCで検証し実例と検証データをベースに議論を積み上げることが重要だ。これにより「承認プロセスを自動化する文化」を組織に定着させられる。

あるあるミス6:ログやデータを蓄積するだけ

 ログやデータを蓄積してもモニタリングや分析が無ければ、有用な情報として活用できない。セキュリティ面におけるモニタリングの活用例として、AI(人工知能)ベースの脅威検知サービスである「Amazon GuardDuty」をここで紹介する。これはAPIコールログやネットワークのトラフィックとフロー、DNSクエリなどのデータをモニタリングしAIで解析することで、未知の脅威の侵入を検知する。

 また、データレイク(注1)に蓄積した大量のデータを、データウェアハウスやAI/ML(機械学習)ソリューションで分析してBIツールで可視化し、システム運用やセキュリティ対策の改善に生かしたり、ビジネス上の意思決定や事業予測につながる知見を発掘してビジネスパフォーマンス向上に結び付けたりすることが可能だ。

組織が意識すべきは、DevOpsによる開発チームとインフラ運用チームの融合

 ソフトウェアがビジネスにおいて不可欠になるにつれて、アプリケーションやサービスにおける開発スピードの高速化要求が高まり、それらを支援するさまざまなツールやサービスがリリースされている。これらにはロールバック可能な小さな単位ごとに検証と修正を繰り返しながら開発を進める「アジャイルの考え方」という共通の特徴がある。

 このアジャイルな考え方をインフラ運用に拡張した「DevOps」という手法は、従来分断されていた開発チームとインフラ運用チームの垣根を取り払い、お互いが知識と責任を共有してコミュニケーションを取りながら一体的な開発や運用モニタリングの実現に加え、自動化によってアプリケーションやサービスのリリースと改善のサイクルを高速に回すことも目指している。

 AWSでは「AWS CodePipeline」というマネージドサービスでCI/CDパイプラインを自動化する(注2)。これにモニタリングロギングとマイクロサービスによるシステムの疎結合化および「AWS CloudFormation」というサービスによるインフラのコード化(IaC:Infrastructure as Code)を組み合わせてDevOps環境を構成している。

 DevOpsはこれらのツールや迅速性・柔軟性に優れるクラウドサービスの普及によってより現実的になっているが、企業文化や評価体系には従来の価値観や仕事の優先順位が含まれていることから単にツールを導入しても効果は薄く、コミュニケーションによって文化や評価体系を変えていく作業が必須だ。

注1:データベースが扱うような正規化された構造化データだけでなく、JSONのような半構造化データや 画像ファイルやテキストファイルなどの非構造化データをまとめて蓄積できるストレージのこと。AWSではS3(容量無制限のオブジェクトストレージ)が該当する

注2:ビルドやテスト、マージ、デプロイといった一連のソフトウェア配信プロセスを自動化する手法のこと

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ