ニュース
分析データの前処理を自動化する2つの新技術、富士通研から:準備時間が5日から半日に(2/2 ページ)
富士通研究所が、さまざまな形式のデータを連携させてデータ分析に活用するためのデータ準備作業を自動化する技術を開発した。
データセットの特徴をメタデータで用意
類似データ高速絞込み技術では、目的の加工データを得るために不足データセットがある場合、人間は背景知識を基に適切なデータセットを探すが、これを自動化する場合、ライブラリに用意した補助データセットから総当たりで調べる必要があり、処理時間が膨大になる。
今回、ライブラリとして用意しておく補助データの列ごとに、列に含まれる値の分布の特徴をメタデータとしてあらかじめ算出しておき、中間データから算出した特徴と類似度を算出することで、不足データを高速に絞り込む技術を開発した。
近年、POSデータとSNSのデータなどを組合せたマーケティング分析や、病院の電子カルテを分析した創薬研究など、さまざまなデータを統合し、新規ビジネスの創出や新製品の開発に活用する手法が注目を集めている。
富士通研究所では、そうした市場に向け、さまざまデータ処理技術をデータ流通、活用の視点で体系化し、「Data Bazaar(データ バザール)」とう呼称で体系化している。今回のデータ準備の自動化技術は、その構成要素の1つに位置付けており、2018年度の実用化を目指すとしている。
関連記事
- 橋の振動データからディープラーニングで内部の損傷度合いを推定――富士通の新技術
富士通と富士通研究所は、AI「Zinrai」を活用し、橋の振動データから内部の損傷度合いや劣化状態を推定できる分析技術を開発。損傷の初期段階での推定も可能になるという。 - ブロックチェーンのトランザクション処理を約2.7倍高速化 富士通研から新技術
富士通研究所は、これまでボトルネックとなっていたブロックチェーンのトランザクション処理を高速化する技術を開発。オンライン取引システムなどへの適用を見込む。 - AIを活用し、スマホで赤ちゃんの便秘チェック――富士通と日本トイレ研究所が実証実験
富士通九州システムサービスと日本トイレ研究所は、便秘を発症する0歳児が多いことから、AIを活用した便のチェックで赤ちゃんの健康をサポートするシステムを構築。実証実験を行う。 - 富士通研究所、大規模システムから業務仕様を自動抽出する技術を開発
業務システムのプログラムを解析し、実装されている業務上の決まりや計算の方法などを理解しやすい条件表として自動抽出するという。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.