ITmedia NEWS > 科学・テクノロジー >

人とコンピュータの論理的な対話実現へ テキスト解析で意見の根拠を示す技術、日立が開発

» 2015年07月23日 12時53分 公開
[ITmedia]

 日立製作所は7月22日、賛否が分かれる議題について、大量のテキストを解析し、肯定的・否定的な意見の根拠や理由を英語で提示する技術を、東北大学大学院の協力を得て開発したと発表した。

 人とコンピュータの論理的な対話を可能とする人工知能の実現向けた基礎技術としており、将来、企業の文書や病院の電子カルテなどを解析し、業務を支援するデータや意見を生成するシステムへの応用が期待できるとしている。

画像

 人やコミュニティーにとって重要と考えられる健康や経済、治安などの「価値」に着目。多数の議題に対する賛成・反対の意見を登録したディベートのデータベースを基に、「健康」という価値に「運動」はポジティブ、「病気」に「肥満」はネガティブ――など、単語と価値の関連性を体系的にまとめた「価値体系辞書」を作成した。

 大量のニュース記事を解析し、事象と価値の「相関関係データベース」も作成。「騒音が健康被害をもたらす」という記事からは、「騒音」が「健康」を抑制するというネガティブな影響を抽出するなど事象がもたらす価値がポジティブかネガティブかを示したもので、約970万件のニュース記事か、約2億5000万からなる相関関係データベースを作成した。

 価値体系辞書と相関関係データベースを組み合わせ、大量のニュース記事から、議題と関連性の高い価値を複数選定。その価値のいずれかを含む文章をニュース記事から選び出し、引用元の記載や数値データの有無、使われている表現などの指標を用いて、議題との関連性と確実性が高い文章を選出、提示する。

 各プロセスで、多数のアルゴリズムを非同期・分散的に実行できるアーキテクチャを構築し、処理速度を速めた。

 2014年に同社が開発した、電子カルテから病態や病気の部位などの指定された情報を高精度で抽出する技術に、新開発の技術を組み合わせた。さらなる研究開発を推進し、人とコンピュータの論理的な対話を可能とする人工知能の実現を目指すとしている。

Copyright © ITmedia, Inc. All Rights Reserved.