Hadoopに社運を賭けるモバイル広告ネットワーク企業の事情Computer Weekly

モバイル広告ネットワーク企業Billy Mobileは、Hadoopを中核とするビッグデータ分析環境に社運を賭ける。Kafka、Spark、Storm、Hive、HBaseで構築した意思決定アルゴリズムとは?

» 2016年02月03日 10時00分 公開
[Brian McKennaComputer Weekly]
Computer Weekly

 スペインのバルセロナを拠点とするモバイル広告ネットワーク企業Billy Mobileは、米Apacheソフトウェア財団の「Apache Hadoop」に社運を賭ける。2013年末に設立された同社は、自社の成長を支えるため、米Hortonworksとテクノロジー使用契約を交わした。

Computer Weekly日本語版 2月3日号無料ダウンロード

本記事は、プレミアムコンテンツ「Computer Weekly日本語版 2月3日号」(PDF)掲載記事の抄訳版です。本記事の全文は、同プレミアムコンテンツで読むことができます。

なお、同コンテンツのEPUB版およびKindle(MOBI)版も提供しています。

ボタンボタン

 Billy Mobileのビジネスインテリジェンスマネジャー、ジェフリー・クリーブス氏は次のように語る。「Hadoopを使用する企業はあるが、恐らく部門レベルでの使用だ。当社は自社のテクノロジーモデルの90%にHadoopを採用している。使用しているのは、『Kafka』『Spark』『Storm』『Hive』『HBase』だ。当社がHortonworksと手を切るとしたら、終わりを迎えるのはビジネスの一部ではなく、全てだ」

 同社は、データの収集、処理、分析にHortonworksの「Hortonworks Data Platform」(HDP)を使用する。これに置き換える前は、「PHP」「MySQL」、オランダElasticの「Elasticsearch」を採用していた。

 「Elasticsearchはプライマリーデータストアにはなり得ない。ビジネスインテリジェンス用のドライバがないからだ。これに対して、HDPには必要なODBCドライバが存在する」とクリーブス氏は話す。

 クリーブス氏によると、Billy Mobileはモバイルプラットフォームにおけるパブリッシャーと広告主の架け橋になり、「パブリッシャーの資産を収益に結び付ける手助けをし、通信業者にアプリエコシステムを開放する」ことを目指しているという。

 同社は主にスペイン語圏で事業を展開しているが、インドやアジアにも進出している。現在のところ、1日当たりのアクセス数は2500万程度だが、Hadoopを使用して事業を拡大することで、1日当たり数十億のアクセスを目指している。

 同社のデータチームは、データを視覚化するツールとして米Tableau Softwareの「Tableau」を使用している。このデータチームは2人のデータサイエンティストとクリーブス氏の3人編成だ。クリーブス氏の役割は、商業的に最も魅力のある利用状況を特定することだ。「データサイエンティストは、この情報を土台に、どの広告をどのユーザーにどのタイミングで提供するかを決めるアルゴリズムを生み出す」(クリーブス氏)

 同社の広告主は、英William Hill、中国Alibabaなどで、パブリッシャーにはエンターテインメントサイトなどがある。ユーザーがアプリをダウンロードするたびに広告主はBilly Mobileに対価を支払い、Billy Mobileはパブリッシャーに歩合を支払う。

 クリーブス氏によると、「当社は、モバイルが前例のない速度と規模でインターネットに大変革をもたらすと考えている。当社のビジネスモデルはこの考え方を核に構築している。こうしたインターネット変革の中で有利な立場を保てると考え、HortonworksとHadoopを選択した」という。

 「当初からHortonworksには好印象を持っていた。初期のローカルサポートから、信頼性とコスト効率の高いHDPプラットフォームまで、どれも感心させられた」

 Billy Mobileは、2015年7月から業務でHDPの使用を開始し、さらに新バージョンへの移行を2015年12月上旬に完了した。

 Billy Mobileは自社の業務を機能させるために、1日数千万件ものレコードに取り組み、セマンテック分析や機械学習を使って、適切なユーザーに適切なサービスを提供しようとしている。

 サイトにアクセスしたユーザーのプロファイルとそのユーザーに表示された広告データをKafkaに保存し、Stormを使ってその情報をHiveとHBaseに流し込む。その後、SparkのバッチプロセスでHiveのデータを分析する。意思決定アルゴリズムはWebフロントエンドに配置している。

 クリーブス氏は次のように話す。「毎日の広告表示回数が数十億件に急増しても、Hadoopならクラスタを拡大することで負荷に対応できると考えている。Hadoopは主にJavaで実行されるが、Java開発者はたくさんいるので不安はない。Hiveのクエリ言語『HiveQL』はSQLによく似ているので、当社のビジネスアナリストはその構文を簡単に理解できる。TableauをHiveに直接つなぐこともできる」

 Billy MobileがHortonworksと手を組むことを決めたのは、同社の純粋なオープンソースアプローチが気に入ったためだった。このアプローチは、米Clouderaや米MapR Technologiesなどの同等製品とは対照的だ。Billy Mobileは、Hortonworksによるプロフェッショナルサービスサポートも利用している。

Computer Weekly日本語版 2014年8月6日号:RAIDはもういらない(転載フリー版)も公開中!

過去の大人気号を無償公開! 閲覧に会員登録は不要! 転載・再配布OK! の特別バージョンです。「大容量HDDでRAIDを組んではいけない理由」を解説した大ヒット企画の他、4本の記事を収録しています。

※本PDFは、TechTargetジャパン会員でなくても無料でダウンロードできます。


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ