現状の把握も終え、いよいよ運用作業を自動化しようとしているアナタ。私自身もSRE活動を始めてすぐに自動化に取り組みましたが、実は最初に「大失敗」をしてしまいました。そこで「トイルの削減=自動化」と勘違いしていたことに気付いたのです。
SRE活動というと、どうしても自動化やツール導入から進めたくなるものですが、一呼吸置きましょう。まずは現状を正しく把握することが先決です。これは、SRE活動を行うための「健康診断」といえるでしょう。
SRE部という組織を立ち上げても、すぐにSRE活動が行えるわけではありません。自分ごととしてサービスを理解し、事業との距離を“本当の意味”で縮めることで、初めてできるようになることがたくさんあるのです。
2017年4月に「SRE部」を立ち上げたリクルートテクノロジーズ。今回はその背景や、立ち上げ時に苦労した点についてお話しします。一番難しいのは、ミッションの変化に合わせて、メンバーの意識を変えていくことでした。
インフラ構築や運用に必要なコストが変わってきている昨今、運用技術者に求められる役割が変わりつつあります。それが「SRE」です。日本ではまだまだ一般的ではない概念ですが、本連載ではリクルートグループの例を通じて、その実態をお伝えしていきます。