初心者でも即戦力に 膨大なデータをラクラク集計できる「Z-Adam」の実力

» 2020年02月28日 10時00分 公開
[PR/ITmedia]
PR

 ネットにつながるあらゆるモノから膨大なデータを集め、価値の高いデータを抽出・分析し、業務改善や新規事業の創出につなげる──そんな“ビッグデータ時代”が到来したといわれるようになって久しい。多くの企業・ビジネスパーソンが業種や職種を問わずデータの重要性を認識し、活用に取り組もうとしている。

 しかしデータの量が膨大になると、分析どころか集計の初期段階でつまずくことも珍しくないはずだ。「専用ツールの使い方が分からない」「集計・分析基盤の構築に、莫大な費用がかかる」──そんなハードルの高さを感じた人もいるだろう。

 こうした悩みを解決するツールの1つが、ゼッタテクノロジーが提供する統計集計システム「Z-Adam」(ジーアダム)だ。初心者でも手軽に統計表を作成できる上、導入コストを抑えられるため、少人数の部署でも使いやすいという。Z-Adamを開発するゼッタテクノロジーの松尾勝弘氏(取締役顧問)、松野隆士氏(営業部 部長)に話を聞いた。

初心者も使いやすいGUI

photo ゼッタテクノロジーの松尾勝弘氏(取締役顧問)

 「Z-Adamの特徴として、初心者でも使いやすいGUI(グラフィカル・ユーザー・インタフェース)が挙げられます」――ゼッタテクノロジーで約30年間、Z-Adamのルーツである集計エンジンの開発に携わってきた松尾氏はこう話す。

 Z-Adamのルーツは30年ほど前、同社がデータの専門家ではない官公庁の事務官でも統計表を作れるツールを開発したことが始まりだ。多くの官公庁が同社のツールを導入し、現在でも利用している官公庁・外郭団体がある。官公庁に限らず、POSデータを集計・分析したい民間企業も採用してきた。

 30年間でテクノロジーが大きく進歩し、データ活用の重要性が高まる中、より手軽にデータ集計・分析ができるよう、バージョンアップさせたものがZ-Adamだ。

 Z-Adamでは、まず集計・分析対象になるCSVファイル(官公庁発表の統計データや自社のPOSデータなど)を取り込むところから始まる。取り込んだデータを基に、項目やカテゴリを決め、集計・分析を行う。最終的に導き出した結果は、Excelファイルなどで出力するという流れだ。

photo Z-Adamを使った集計・分析の流れ

 正確な統計表を作成するために、肝になるのがデータ集計・分析のフェーズだ。ここで使用するデータの特性を把握し、「性別」「年代」といった項目定義や調査などの回答データのカテゴリ選択を適切に行うことが、統計表の精度に大きく影響する。データ集計に慣れていても、こうした作業を面倒に感じる人は少なくないだろう。

 そこでZ-Adamでは、直感的な操作でデータの集計ができる、GUIベースの仕組みを用意している。

 Z-Adamでは、CSVファイルを取り込んだ時点で、統計表の設計に必要なデータと項目の特性に関する情報を自動で作成。最大値、最小値、平均値、中央値、最頻値の他、値ごとの件数分布を示すコードリストも表示する。仮説設定や統計表の検証に欠かせない情報も確認できる。

 集計作業に進んだは良いものの、つまずく人が多い項目定義の場面でも、GUIベースの仕組みが効果を発揮する。項目定義は、CSVデータを読み込んだ時点で自動的に完了。ワンクリックで自動的に項目定義を行うため、ヒューマンエラーも防げる。

 中計・小計、年齢階級の区分といった調査などの回答データを分類するカテゴリの設定では、よく使われるテンプレートを標準搭載。国勢調査、労働力調査、全国消費実態調査、社会生活基本調査などのカテゴリなどをテンプレート化している。ユーザーが使用したいテンプレートを選ぶと設定が完了。既存のテンプレートに新しいカテゴリを追加、修正することも可能だ。

 カテゴリ設定の重要性について、松尾氏は「統計によって年齢の区切りが5歳ごと、10歳ごとと異なるケースは珍しくありません。一つ一つ手作業で設定せずに済むよう、統計の種類や業界、組織単位で求められるニーズをできる限り反映し、テンプレート化しました」と話す。

 作成中の統計表はいつでも、画面右側のプレビューでチェックできる。集計項目の選択や入れ替えは、表計算ソフトのピボットテーブルのようにドラッグ&ドロップで行える。

 「どの時間帯にどのような人が来店するのか、どうすれば収益が上がるのかといったデータを可視化するためには、統計表を1回作ってみないと把握できません」と松尾氏。集計結果を出力した後、項目を変更するとなると二度手間になる。だが、Z-Adamでは「作成した統計表が本当に意味あるものなのか、作成途中でも繰り返し確認できる」ため、そうした無駄を防げるのだ。

 完成した統計表は、48種類の罫線(けいせん)付きレイアウトの中から目的に応じて選んで、ExcelファイルやCSVファイルで出力が可能。レイアウトは、政府指定統計などで使われるものも用意。複数の統計表の場合、ブック単位やシート単位での出力にも対応する。数億件に上るレコードも、ワンクリックかつ数秒で出力できるという。

photo レイアウトを選択し、統計表を出力

やり直しの“無限ループ”から脱却

 データの扱いに慣れている人は、Z-Adam専用のスクリプトを使って統計表を作成することも可能だ。他のツールでは膨大・複雑な記述を要する場合でも、Z-Adamでは1行程度の記述で済むという。

 GUIの使用中にスクリプトを書き込み、実行することも可能。カテゴリの再定義や表操作、回帰分析、バスケット分析、RFM分析などの関数処理や表間演算も行える。

photo スクリプトにも対応

 やり直しの“無限ループ”に陥りやすい集計・分析業務だが、Z-Adamは初心者・経験者を問わず、業務効率化をサポートする。

 「Z-Adamではデータの特性をスピーディーに見極められ、項目やカテゴリの設定、入れ替えも簡単に行えます。そのため、分析の方針が定まっておらず、検証したい仮説を見つける作業を繰り返す『非定型分析』、仮説や分析の方向性が定まっている『定型分析』の両方で活用できます」(松尾氏)

“一人二役”システムでコストダウン

 こうしたZ-Adamの操作性を支えるのが、同社が独自に開発したシステムだ。一般的にビッグデータを処理するシステムは、(1)データを蓄積するデータベース、(2)蓄積したデータを集計・分析するツール──と、それぞれ独立している場合が多い。Z-Adamは両方の役割をまとめて担っている。

 Z-Adamでは、CSVファイルを取り込むと、独自のカラム型データベース「データマート」を作成。データサイズも圧縮するため、8CPU搭載・64GBメモリのサーバで集計・分析を行っても、1億レコードを約1秒で処理できるという。

 「データマートに格納したデータは独自のカラム型データベースのため解析しにくく、データ保護の役割も果たします。情報漏えいが起きにくい、セキュリティ面も優れたシステム環境を目指しました」(松尾氏)

photo 共有データの保護化/データ圧縮
photo ゼッタテクノロジーの松野隆士氏(営業部 部長)

 OSはWindowsとLinuxに対応。提供プラットフォームは、オンプレミス、クラウドの他、ノートPCなどスタンドアロンの環境(研究者など個人で使用するユーザー向け)にも対応する。製品費用は導入規模によって異なるが、月額約9万円から、年間90万円からの提供を想定している。

 Z-Adamはスケールアップによる環境強化にも柔軟に対応できるため、クラウド環境での利用に親和性が高い。集計・分析のデータ規模や分析内容によって、クラウド環境を変更することで適切な集計・分析基盤を築ける。

 また、RDBを使わず、データの蓄積、集計・分析システムを1つにまとめたことで、導入・運用コストを抑えるというわけだ。

 「どんな組織でも使ったことのない“初物”だと、導入時の巨額の投資は尻込みしてしまいます。その点、Z-Adamは部署単位や個人でも使いやすいようコストを抑え、月額制のプランで使えます。データ集計・分析の操作性も含め、初心者でもデータに親しみやすい、間口が開かれたツールです」(松野氏)

今後も進化を遂げるZ-Adam

 スピード、コスト、使いやすさと三拍子そろったZ-Adamだが、今後もアップデートを継続していく。松野氏は「多重接続時のパフォーマンスは、さらに改善できると思います。お客さまによりストレス無く使っていただくため、ツールのCPUとメモリのバランスを考慮し、多重処理の性能を向上させていく予定です」と意気込む。

 データが分散して集計・分析がうまくいかない──といった課題を解消するため、2つのデータマートを1つのデータマートに統合できる新機能「データマートJOIN」も2月リリースの新バージョンで搭載する。例えば、1億件の「ID-POSデータ」と100万件の商品マスターを、10秒程度で1つのデータマートに統合できるようになるという。

photo 2つのデータマートを1つのデータマートに統合

 ユーザー自身が作成した統計表とオープンデータを取り込んで、双方を比較できる機能も準備する。複数の統計表を比較した上で新たな統計表を作るといった、さらなるデータ活用を後押しする。

 Z-Adamは、省庁や自治体はもちろん、民間企業での活用も想定。医療や保険業界、小売・流通など活躍できる場面は幅広いという。民間企業のニーズにも応えるため、現状のシンプルなユーザーインタフェースを維持しつつ、項目の追加や統計表のデザインをカスタマイズできる機能も検討する。業界ごとのニーズを吸い上げ、実現可能な機能はテンプレート化して搭載していく。

 「データを集計・分析することで、未来を予測し、展望を描くことができます。データはわれわれにとって資源なのです。データと真摯(しんし)に向き合っていく姿勢こそ、今後ますます求められていくのではないでしょうか」(松尾氏)

Copyright © ITmedia, Inc. All Rights Reserved.


提供:ゼッタテクノロジー株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2020年3月29日