メディア

300人から1000人へ――メルカリは開発組織を拡大するために「マイクロサービスアーキテクチャ」を採用した（後編）：Mercari Tech Conf 2018（4/4 ページ）

» 2018年10月12日 08時00分公開

マイクロサービスプラットフォームチームがこれから取り組もうとしていること

　最後に、今後われわれが取り組んでいきたいことをご紹介します。先ほどお話ししたように、現在本番環境で動いているマイクロサービスの数が19であるのに対して、開発中のマイクロサービスは73もあります。

　マイクロサービスの開発を始める環境はできてきた一方、これからは本番環境に出て行くマイクロサービスが増えてきます。すると次の課題は、マイクロサービスの開発者が、自分たちのサービスをいかに高い信頼性を持つサービスとして運用できるようになるかです。

　これに対して、現在いくつかアイデアがあります。1つ目のアイデアは、GoogleのSREが採用しているSLI/SLOという指標を導入することです。SLI（Service-Level Indicator）はサービスレベルの定量的な指標、SLOはService-Level Objectiveの略でSLIに対する目標値です。これらはサービスの特性に合わせて決定できます。

　例えば、レスポンスを速く返すことが重要なサービスであれば、SLIは全てのリクエストのうち、100ミリ秒以内にレスポンスを返した割合で計る、といったものです。SLIとSLOを設定することで、数字に基づいて、サービスの機能開発と信頼性に対する取り組みのバランスをとることができるようになります。

　SLOを99.9％に設定した場合、これを満たしているうちはひたすら機能開発を続ける。これを下回ってしまったら機能開発を止めて、信頼性の向上に努めるといった方針転換がすぐにできます。これにより、機能開発ばかり進めて、障害がひんぱんにおきるサービスをなくしたり、逆に信頼性ばかり追求して、機能追加が進まなかったり、といった状況を避けることができるでしょう。

　マイクロサービスプラットフォームチームとしては、SLI/SLOという考え方を浸透させることがまず重要で、その後にサービス全体のSLOを俯瞰できるようなダッシュボードを整えていくのも一つのアイデアかなと思います。

カオステスティングとサービスメッシュの採用

　2つ目のアイデアはカオステスティングです。障害対応を開発者が行うことは、これまであまりありませんでしたが、これからは開発者自身が障害に対する一時対応を行う必要があります。

　カオステスティングの手法でわざと障害を起こし、問題になるコードをすぐ見つけるとか、障害が起きたことにすぐ気付けるかとか、そもそもモニタリングやアラートが動いているかを確認することができる。また、開発者が障害対応を経験することで、実際に障害が起きても落ち着いて対応できるようになる、という仕組みを作っていきたいと思っています。

　最後のアイデアはサービスメッシュです。モノリシックなアプリケーションでは、関数呼び出しで全てが完結しました。しかし、マイクロサービスにおいては、ネットワーク越しのコミュニケーションが大量に発生します。

　サービスメッシュを導入することで、サービス間のコミュニケーションのオブザーバビリティ（観察性）を改善するとか、ネットワークコネクションの信頼性を向上させるとか、セキュリティを強化することもできると考えています。

　この記事は、新野淳一氏のブログ「Publickey」の記事「メルカリは開発組織を拡大するためにマイクロサービスアーキテクチャを採用した（後編）。Mercari Tech Conf 2018」を許可を得た上で転載、編集しています。

300人から1000人へ――メルカリは開発組織を拡大するため「マイクロサービスアーキテクチャ」を採用した（前編）
現在300人程度という開発者の数を3倍以上の1000人に増やそうとしているメルカリ。そのために同社はマイクロサービスアーキテクチャを採用し始めました。このシステムをうまく機能させるため、技術面と組織面の双方でさまざまな取り組みを行っています。
変化に強いシステムを目指し、マイクロサービス、サーバレス、内製化に挑戦　最先端技術に挑むダイソーの情シスたち
市場環境の変化が速い小売業界で勝ち残るためには、システムも変化に柔軟に対応できるものでなければならない。ならばマイクロサービス、サーバレス、内製化に挑戦しよう――。そんな大創産業の情シス課長、丸本健二郎氏の挑戦を追った。
コレ1枚で分かる「マイクロサービス」
Eコマース企業やオンラインサービス企業などに採用され、注目を集めているソフトウェアアーキテクチャ「マイクロサービス（Microservices）」について、特徴とメリットを解説します。
SREって、具体的にどんな仕事する人たちなの？
インフラ構築や運用に必要なコストが変わってきている昨今、運用技術者に求められる役割が変わりつつあります。それが「SRE」です。日本ではまだまだ一般的ではない概念ですが、本連載ではリクルートグループの例を通じて、その実態をお伝えしていきます。