「クロネコヤマト」でおなじみのヤマトホールディングス(HD)が、ビッグデータの活用に本腰を入れる。クロネコヤマトとビッグデータの組み合わせと聞いて、意外に思う読者もいるかもしれない。宅配便は「手書きの伝票1枚でセールスドライバーが全国津々浦々に荷物を届ける」という、どちらかといえばアナログなビジネスモデルの印象が強いからだ。しかし、従来のビジネスの在り方が急速に変わりつつある今、変革を迫られているという。
「ECの興隆によって宅配便が扱う荷物量は大幅に増え、お客さまのニーズも年々多様化しています。にもかかわらず、少子高齢化のあおりを受けて労働力は減る一方です。これまでのやり方を続けていては、今までの宅配便ビジネスが立ち行かなくなることは明らかです」
こう語るのは、ヤマトHDの中林紀彦氏(執行役員 データ戦略担当)。2019年に創業100周年を迎えた同社は、大胆な改革に着手。2020年1月には経営構造改革プラン「YAMATO NEXT100」を発表した。その内容は多岐にわたるが、目玉の1つが「データ・ドリブン経営への転換」だ。経験や人手、紙帳票に頼った業務プロセスでの意思決定を見直し、データを基に迅速かつ正確な意思決定を行う。業務の状況をデータ化し、可視化・予測して、業務効率を向上させるとともに顧客に新たな価値を提供する。
「ヤマトはこれから、徹底的に変わります」──創業100周年を迎えたヤマトHDの牧浦真司氏(専務執行役員)はそう宣言する。物流業界を取り巻く環境変化は著しい。ECの普及により配達量は右肩上がりで増える一方、人手不足は深刻だ。荷物の送り方、受け取り方でも柔軟性が求められるようになった。次の100年も生き残るため、同社が社運を賭ける一つがデータの活用だ。
このデータ・ドリブン経営の実現に向け、ヤマトHDはグループ全体を横断する共通のデジタルプラットフォーム「YDP」(ヤマトデジタルプラットフォーム)およびその中でビッグデータ分析基盤「クロネコビッグデータ」(KBD)の構築・活用を進めている。YAMATO NEXT100の発表以前から着々と進められていたもので、既に一定の成果を上げている。
分析基盤の大まかな仕組みは、次の通り。まず社内のさまざまな業務システムから、分析に役立つデータをクラウド上のデータウェアハウス(DWH)に吸い上げて集約する。ユーザーはこのDWHに対してBIツールを使ってアクセスし、さまざまな角度からデータを分析してビジネスに役立つ知見を得る。また機械学習による予測モデルなどさまざまなAIモデルを開発し経営資源の最適化などに役立てる。
常に50〜60人ほどのユーザーがこの分析基盤を日々利用している。そのうち半分ほどはユーザー自身が独自にクエリを生成して発行するような、高度な使い方をしているという。しかし、この仕組みには課題も少なくなかった。
KBDが抱えていた問題について、同社の中田勇気氏(デジタル戦略推進機能 アシスタントマネジャー)は次のように述べる。
「メンテナンス性が悪いのが最大の問題点でした。データ量の増加に伴いディスク容量が常にひっ迫していましたが、容量を拡張するためにはわざわざデータベースを再構築する必要がありました。安定性にも問題があり、システムダウンがしばしば起きていました。さらにはユーザーからも、『クエリの応答がなかなか返ってこない』といった声が上がるなど、パフォーマンス面でも課題がありました」
これら諸問題の元凶は、ある程度はっきりしていた。クラウド上にDWHを構築してはいたものの、実際に動かしていたのはオンプレミス向けのデータベース製品だった。つまりクラウドとはいっても、IaaS環境上でオンプレミスと同様の環境を運用していたにすぎなかった。
中林氏も、こうした状況を問題視していた。「実質的にはオンプレミスと同じアーキテクチャでしたから、クラウドならではの柔軟なスケーラビリティや可用性などのメリットを全く享受できていませんでした。こうした課題を根本的に解決するには、IaaSではなくPaaSのマネージドサービスを使ってクラウドならではのメリットを引き出せるようにDWH基盤を再構築する必要があると考えました」
データ活用の肝であるDWH基盤がこのままのありさまだと、全社方針であるデータ・ドリブン経営の実現もおぼつかない。そこで思い切って、PaaSを使ってデータ分析基盤を刷新する決断を下した。
早速、主要なクラウドベンダー数社に相談を持ち込んだ。実際にヤマトHDが運用しているデータとクエリを使ったパフォーマンステストを実施し、有力な選定候補の1つとして挙がったのが、Microsoftの「Azure Synapse Analytics」だった。
これは「Microsoft Azure」のPaaSの1つで、ビッグデータ基盤をマネージドサービスとして提供するものだ。パフォーマンステストに携わった、日本マイクロソフトの大橋洸輔氏(クラウド&ソリューション事業本部 インテリジェントクラウド第二統括本部 Azure第四営業本部 Data&AIスペシャリスト)は、次のように振り返る。
「日本マイクロソフト社内のリソースだけでなく、海外のAzure Synapse Analyticsのエキスパートチームにも協力してもらい、(ヤマトHDから)依頼いただいた検証作業を行いました。その結果、他社のサービスより良好なパフォーマンスを発揮できました」
中田氏によれば、Azure Synapse Analyticsは他製品と比べて複数のアドバンテージがあったという。「ヤマトHDの基幹データベースには日本語の列名が付けられています。Azure Synapse Analyticsの競合製品は日本語の列名をサポートしていなかった一方、Azure Synapse Analyticsはそれに対応していました。また課金体系もAzure Synapse Analyticsは従量課金制ではなく固定料金だったため、当社のようにユーザーが自由にクエリを発行するような環境では安心感がありました」
こうした点が決め手となり、ヤマトHDはAzure Synapse Analyticsを採用し、データ分析基盤を再構築することにした。
再構築に当たってはデータの器だけでなく、データそのものの構造にも大幅に手を入れた。旧データ分析基盤のデータモデルは、データソースのデータ構造をそのまま持ってくるような形だったため、データの検索性や使い勝手にかなり難があった。新しいデータ分析基盤では、ユーザーがよりデータを扱いやすくなるように、データモデルを入念に設計し直した。
オンプレミスの各業務システムから取得したデータは、まずはMicrosoft Azure上のオブジェクトストレージのPaaSサービス「Azure Blob Storage」に格納される。その後、分析基盤のデータモデルに合わせて「Azure Databricks」と「Azure Data Factory」を用いてデータの加工を行い、最終的にAzure Synapse AnalyticsのDWH基盤に格納される。
このようにDWH周りの全ての機能をMicrosoft AzureのPaaSで構成することで、従来のIaaS上に構築したDWH基盤と比べてさまざまな面でメリットが得られるという。
「最大の課題だったDWH容量の拡張性については、クリック1つで簡単に拡張できるようになりました。システムの安定性も、以前とは比べものにならないほど向上しました。クエリの応答速度も、パラメータ1つで簡単に性能を向上させられるため、面倒なチューニング作業が不要になります」(中田氏)
セキュリティ面でも、PaaS環境に全面移行したことで大幅にレベルアップしたという。旧データ分析基盤はクラウド環境でありながらクローズドなネットワーク環境で運用しており、分析環境から外部のインターネットへのアクセスは厳しく制限されていた。そのため外部システムとのAPI連携などは難しく、例えばPythonを使って分析を行うユーザーは社外のライブラリにアクセスできず不便を強いられていた。
同社は現在、新しいデータ分析基盤とインターネット間をセキュアに行き来できるゼロトラスト・セキュリティモデルの構築を進めている。PaaSでサービスを構築するとともに、Azure Active Directory上でユーザーアカウントを一括管理してアクセス制御を行うことで、社外ネットワークからセキュアにアクセスできたり、パートナー企業のシステムとAPIを介してデータ連携できたりするシステム基盤の実現を目指している。
「データ・ドリブン経営戦略の一環として、外部のパートナー企業と広範に連携する『ECエコシステム』の構築を目指しています。この構想を実現するためにも、ゼロトラスト・セキュリティモデルの導入を急いでいます」(中林氏)
現時点ではまだ一部のパイロットユーザーのみが利用しているが、その用途は徐々に拡大しつつある。これから段階的にユーザー数を増やしていく予定だが、ネックになる恐れがあるのがBIツールの拡張性だ。
DWH基盤は今回、PaaSで刷新したが、エンドユーザーが利用するBIツールはいまだにIaaS基盤上で稼働している。今後ユーザー数が急増した場合、システムのキャパシティーがあふれてしまう可能性がある。そこで、既存のBIツールに代わり、Azure Synapse Analyticsとの親和性が高い「Power BI」の導入を検討しているところだという。
「現時点ではBIツールを通じてアクセスしているユーザーはさほど多くありませんが、今後はどんどん増やしていき、社内でより広くデータ活用を浸透させたいと考えています。その場合、IaaS環境上で稼働している現行のBIツールより、Power BIを利用したほうがスケーラビリティやアカウント管理の面で有利なため、今後はPower BIへの移行を進めていきたいです」(中田氏)
データ分析基盤上のデータを使ったAIモデル開発も、現時点ではIaaS環境上にAI開発フレームワークを導入して行っている。前述のAzure Active Directoryと合わせ、これらのPaaSを2020年10月までに導入する計画という。
「これまでも何か分からないことが出てきた際には、Microsoft Teamsのチャットを通じて日本マイクロソフトの技術担当の方に質問すれば即座に回答をいただけていたので、非常にスムーズに開発を進められました。充実したサポートに加え、各PaaSのさらなる使い勝手向上にも期待しています」と中田氏は笑顔を見せる。
中林氏は「環境を意識せずに、自分たちがやりたいことをできればいい。データセットがあれば、取りあえず分析基盤に投入し、分析などが迅速に進められればいい。PaaSの活用には、そんなメリットを期待しています」と話している。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:日本マイクロソフト株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2020年8月17日