ITmedia NEWS >

テキストマイニングの構文解析技術特集[顧客の声活用ソリューション:TRUE TELLER]

» 2004年08月27日 00時00分 公開
[須藤英介,野村総合研究所]

コールセンターにおけるデータ活用の課題

 テキストマイニングは、いまやコールセンターにおいて不可欠な技術となりつつある。しかし、「分析した結果を理解できない」「具体的なアクションにつなげる手段が用意されていない」「入力内容が貧弱で、分析しても結果が出ない」といった問題から、期待とは裏腹に有効活用できていないケースもある。また、同じ理由から導入を躊躇している企業もいまだに多い。ここでは、蓄積された情報を有効活用するための構文解析技術に絞って解説する。

データ活用に不可欠な構文解析

 テキストマイニングでは、キーワードの出現数の集計や、商品ごとの傾向分析、問い合わせ内容の時系列的な推移などの分析を行う。従来、これらの分析は売上データやアンケートの選択式回答結果などを利用して行っていたが、テキストマイニングでは自由記述の文章を対象とする。売上データであれば集計するだけで事足りるが、自由記述の文章をそのまま集計することは不可能である。そのため、まず個々の発言内容を集計可能な単位にまで正規化する(一定のルールに従って整形する)必要がある。この正規化が適切に行われないと、どんなに画期的な分析手法をとり入れても、有意な分析結果は得られない。そのために重要なのが「構文解析」という技術である。

 従来のテキストマイニングは、文章内での単語の出現状況を把握するのみで、単語間のつながりを判別することは不可能であった。これに対して構文解析は、自由記述の文章(自然文)を単語単位に分割し、文法的なつながり(係り受けの関係)を判断する技術である。これによってより正確かつ詳細な文章内容の判断ができ、「何が良くて、何が悪いのか」という、自由記述文で最も重要な情報を正しく知ることが可能となる。

 このように、「構文解析」はテキストマイニングを成功させるために不可欠な、ひとつの重要なファクターである。

「TRUE TELLER」の構文解析

 現在では、多くのテキストマイニングツールが構文解析機能をもっている。TRUE TELLERに搭載されている構文解析エンジン「STRIDER」は、汎用的な構文解析エンジンに、NRIが培ったテキスト分析のノウハウを加え、分析結果をより活用しやすくするように拡張したものである。

直感的な分析結果の提供

 定性データの分析においては、結果を解釈(判断)するにあたり、少なからず感覚的な要素が絡んでくる。システム側としては、可能な限り人にとって理解しやすい結果を提供することで、分析者の作業量を軽減するのみならず、正確な解釈を支援し、顧客満足度の向上や商品品質の改善など、目的に沿った具体的なアクションへつなげることができるようになる。そのため構文解析エンジンには、商品やサービスに対するニーズが一目で把握できるように、話者の意図を判断する仕組みが組み込まれている。

 たとえば、構文解析エンジンでは解析結果を直感的に把握しやすくするため、以下のように「困難」や「要望」などの表現を、その対象となる述語に付与する。

 「説明が読みづらい」
  →「説明−読む(困難)」
 「Sサイズも販売して欲しい」
  →「Sサイズ−販売する(要望)」

 このほか、「否定」や「不可能」など8種類の表現を用いて、記述者の意図を把握できるようにしている(図1参照)。

図1

 なお、とくにコールセンターなどで精度の高い解析を行うためには、オペレーターによって入力されるデータ(自由記述文)の質(適切な句読点、単語の係り受けなど)を高める必要があり、TRUE TELLERにはそのための機能も搭載されている。

テキストマイニングの今後

 構文解析技術は、今後、1つひとつの解析結果の提供のみでなく、主題の解析や、文章の要約の提供が大きなテーマになると思われる。それによって自由記述文からより多くの有意な情報を引き出すことができるようになるであろう。

 しかし、構文解析はあくまでも顧客の声を活用するための一手段にすぎない。顧客の声を真に活用していくためには、テキストマイニングを分析システムにとどめるのではなく、業務との密な連携や全社的な展開を視野に入れたソリューションとして構築・活用していくことが重要である。

Copyright (c) 2004 Nomura Research Institute, Ltd. All rights reserved. No reproduction or republication without written permission .



Copyright © ITmedia, Inc. All Rights Reserved.