インフラ担当とサービス担当、お互いの“距離”を縮めるために必要なこと:リクルート流、SREコトハジメ(3)(2/3 ページ)
SRE部という組織を立ち上げても、すぐにSRE活動が行えるわけではありません。自分ごととしてサービスを理解し、事業との距離を“本当の意味”で縮めることで、初めてできるようになることがたくさんあるのです。
リソースをモニタリングしていたところ、当初の見込みよりもアクセスが伸び、リソースが不足する懸念があることが確認されたのです。すぐに関係者と相談し、リソースの増強を決定して適用しました。エンドユーザーへの影響が出ることなく、繁盛期を乗り切れたのです。
サービスとインフラの担当者が絶えず対話し、現状の認識を正しくすり合わせ、それぞれの施策に対する温度感や重要度を正しく把握することで、自ずとメンバーのサービスに対するオーナーシップは高まり、プロアクティブに効果的な対応を行える可能性は高まります。「サービスを守るために、インフラ側では何ができるのか」という意識で動ける環境を作ることで、少しずつメンバーの意識に「SRE」を根付かせていくのです。
事業との「物理的な距離」と「論理的な距離」を縮める
このように、ビジネス(サービス)とインフラが緊密な連携をとるために、よりスムーズに物事を進められるよう、コミュニケーションを整理する取り組みを行っています。
まず、事業別SREグループにおいては、事業組織の中に席を置き、単純にシステム構築や運用作業の依頼を受けるだけでなく、要件の検討やビジネス開発の初期検討から加わるなどし、サービス担当者と一緒に動く形としました。
案件の初期から対面で会話することで、万が一障害が発生したときの原因究明や対処もスピーディーに実施できる可能性が高まります。さらに、会議などでその予兆に気付き、障害発生前に対処できる可能性も高めることができるのです。
とはいえ、対面で会話できる時間は限られているため、コミュニケーションツールの利用が不可欠です。しかし、メールのような非リアルタイムなコミュニケーションでは、情報が伝わるスピードや連携という観点では限界があります。
そこで、私たちはコミュニケーションツールの「Slack」を使って、リアルタイムのコミュニケーションを促進しています。密なやりとりを行い、関係者間との認識のずれを抑えることが狙いです。
そして、Slack上での相談や議論を、実際のタスクに落とし込んだ後に管理するツールとして、アトラシアンの「JIRA(ジラ)」を利用しています。タスクごとにJIRAのチケットを登録し、チケットに必要な経緯のみをコメントとして残すことで、サービス担当者との認識の再確認や、関係者間のタスクの受け渡しもスムーズに行えるようになりました。
関連記事
- コレ1枚で分かる「SRE(Site Reliability Engineer)」
これからの運用技術者に求められるアプローチとして注目される「SRE(Site Reliability Engineer)」について解説します。 - APIで社内、そして世界とつながる――リクルートのAI活用、そのキーマンに迫る
自社サービスにAIを積極的に導入しているリクルートだが、その活用を推進する部署がリクルートテクノロジーズにある。彼らがどのようにして業務部門と連携しているのか。そのカギの1つに「API」があるという。 - 脆弱性発見のプロ集団ーーリクルート「レッドチーム」の仕事とは?
インシデントを未然に防ぐために、社内のセキュリティリスクを洗い出す「レッドチーム」。日本でいち早く“自前”のレッドチームを立ち上げたリクルートテクノロジーズに、そのミッションと日々の活動を聞いた。 - ビッグデータで社会をあっと言わせるサービスを リクルートテクノロジーズ・泉さん
月間で数十億レコードという大量データを生成するリクルートは、ビッグデータの専門組織を立ち上げ、ビジネス成果を生み出すためのデータ活用基盤を構築。そのプロジェクトを率いる泉さんが考える未来像とは――。
Copyright © ITmedia, Inc. All Rights Reserved.