5分で分かるSREの基本 JCBがその効果を公開

Googleが提唱するSREは本当に組織にとって有効な概念なのか。JCBがSREへの取り組み内容とそこから得た効果を公開した。

» 2022年09月07日 08時00分 公開
[関谷祥平ITmedia]

この記事は会員限定です。会員登録すると全てご覧いただけます。

 グーグル・クラウド・ジャパンは2022年8月29日、「『SRE』(Site Reliability Engineering:サイト信頼性エンジニアリング)と JCB の採用事例に関する記者説明会」を開催し、SREとJCBによる活用事例を紹介した。

5分で分かるSREの基本

 「SREとは本番システムを信頼性高く開発、運用するための一連のプラクティスと心構え、及び職務だ」――。そう話すのはグーグルでシニアデベロッパーリレーションズエンジニアを務める山口能迪氏だ。

 山口氏は、Googleをはじめとするサービス提供者の信頼を脅かす要因として「テスト環境とは違った振る舞いをするサービス」や「サービスの成長に伴うスケーラビリティ問題」などを挙げ、「これらを解決できる概念がSREだ」と話す。

 ここで山口氏は、信頼を脅かす要因の一例として、「ソフトウェア開発フェーズと運用フェーズの矛盾」を挙げる。

 ソフトウェア開発は「設計」と「開発」を指すが、実際にコストがかかり始めるのは「運用」の段階で、開発にかかるコストの10倍もの金額になることもある。さらに、開発チームはサービスに新たな機能を追加するなどしてその機能性を上げようとするが、ソフトウェアのメンテナンスや信頼性などの責任を負う運用チームはリスク低減のために開発スピードを下げようとする。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ