ヤフー、高次元データの高速検索技術「NGT」をオープンソース化 企業に“眠る”ビッグデータを分析しやすく
ヤフーが、高次元データの高速検索技術「NGT」をオープンソースで公開。
ヤフーは11月24日、高次元データの高速検索技術「NGT」(Neighborhood Graph and Tree for Indexing)を、商用・非商用を問わず利用できるApache License 2.0のオープンソースソフトウェア(OSS)として「GitHub」で公開した。同技術に関する特許実施権も無償提供する。
NGTは、テキストや画像、商品データ、ユーザーデータなど、複数の特徴を持つ高次元データを、大量のデータベースの中から高速に検索・特定できる技術。200万件の言語データを対象にした場合、これまで最速だった技術「SASH」の約4倍、主流の技術「FLANN」の約12.3倍の速さで検索でき、1000万件の画像データが対象だと、これまで最速だった「直積量子化手法」の約5.6倍、FLANNの約13.5倍の速さで検索できるという。
NGTを使えば、近似したデータを高速でマッチングできる。項目数が多くフォーマットや入力方法がばらばらなデータを高速で照合でき、データの名寄せなど、企業内で活用しきれていないビッグデータを使いやすい形に置き換えることも可能という。人工知能(AI)の活用に必要な、高品質なビッグデータの生成に貢献するとしている。
ヤフーでの活用アイデアとして、スマートフォン向けYahoo! JAPANアプリでのニュースコンテンツのパーソナライズ配信(ユーザー1人1人に合わせた配信)や、運用型ディスプレイ広告の配信精度の向上などに同技術を応用できる可能性があるという。
同社はこれまで、商用不可の研究用途に限定し、NGTを2015年9月から「Yahoo! JAPAN研究所」で公開していた。社内外問わず同技術を発展させるため、特許実施権の無償提供を決めたという。
関連記事
- インフルエンザ、すでに流行入り? 昨年より2カ月早く……ヤフーがビッグデータ分析で予測
「Yahoo!JAPAN」の検索データから分析したインフルエンザの感染状況の予測で、14日に流行ラインに到達した可能性があることが分かった。 - AIとビッグデータで投資判断 ヤフーグループの投資信託「Yjamプラス!」登場
AIとビッグデータで投資判断するヤフーグループの投資信託「Yjamプラス!」が登場。 - ヤフー、年間340万件の“ユーザーの声”をIBM Watsonで分析 スピードは人の30倍
ヤフーが、ユーザーから寄せられる指摘や提案の分析にIBM Watsonを活用。1カ月当たり約800時間かかっていた分析作業を、20〜30時間ほどに短縮する見込みという。 - 恋愛相談もビッグデータで Yahoo!知恵袋がIBM「Watson」で集合知を学習し“脈アリ”を判断
ヤフーが、知恵共有サービス「Yahoo!知恵袋」のAndroidアプリに「IBM Watson」を活用する「これって付き合える? 脈ありチェッカーβ」を提供開始した。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.