富士通、オープンデータへのリンクを自動付与する技術を開発

富士通研究所が「Linked Open Data」へのリンクを自動的に付与し、データの利活用を推進する技術を開発した。実証実験を進め、2015年中の実用化を目指す。

» 2014年01月16日 16時28分 公開
[ITmedia]

 富士通研究所は1月16日、Linked Open Data(LOD)へのリンクを自動的に付与する技術を開発したと発表した。国や企業が所有するデータと世界中で公開されているとの間で、同じ対象を表現するデータを発見し、リンクを自動的に付与するという。

 LODは、Linked Data形式で公開されているデータセット群で、特定のアプリケーションに依存せず、異なるWebサイトに存在するデータ同士をリンクできる。2013年現在で約340の主要なLODデータの公開サイトがあり、全体では400億項目のデータ量がある。

 LODの個々のデータは、異なるWebサイトで公開されているデータにリンクを付けることが推奨されているが、ほかのWebサイトのデータにリンクを付けるためには、公開されているデータの内容を理解し、関連するデータを発見する必要があった。また発見した場合でも、データ構造が異なっていたり、異なる表記で書かれていたりするケースがあり、単にキーワードの一致を調べるだけでは解決できない課題もあった。

 今回開発した技術は、異なるデータ構造や表記であっても同一性を自動的に推定。LOD活用基盤で用いることにより、世界中のLODの中から同じ対象を表すデータを発見し、自動的にリンクを付与することが可能になる。同社によれば英語だけでなく、各国語版のデータセットに対しても対応可能だといい、例えば、国が所有するデータをLODとして公開したり、企業が所有するデータをLODと組み合わせて利用したりすることが簡単になる。

 この技術は中国や米国の学術会議が主催した評価コンテストで第一位の推定精度を達成しており、富士通研究所では同技術と連携可能なLODの検索サービスを1月中に一般公開する予定。今後、官公庁や自治体におけるオープンデータの各種実証実験に適用して技術検証を進め、2015年度中の実用化を目指すという。

開発したアルゴリズムの概要

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ