音声は非常に古いコミュニケーション手段だ。AIによって音声認識技術が進化したことで、機械も人間と同じように、声に潜む情報を把握できるようになっている。
例えば生体認証としての音声の活用だ。音声データに見られる特徴から個人を特定し、それをパスワード代わりに認証手段として利用する。これは声認証、あるいは声紋認証と呼ばれ、AI技術の応用によって高い精度が実現されるようになってきた。
NECは今年2月、5秒程度の自然な会話音声から個人を認識できる声認証技術を開発したと発表した。自然な会話音声、とわざわざ表現されているのは、声認証には大きく分けて「テキスト依存方式」と「テキスト独立方式」があるためである。
テキスト依存方式とは、認証の際に特定のテキストを用いる方式を指す。「開けゴマ」のように、あらかじめキーワードを決めておき、それを発話してもらって判断するのである。
この方式では短時間で認証が行えるものの、当然ながら事前にキーワード設定が必要になる。一方のテキスト独立方式とは、自然に会話してもらうだけで認証が行える仕組みだが、これまでは10秒程度と比較的長い時間発話してもらう必要があった。それを5秒まで縮める新技術を、NECが開発した。
新しい声認証技術は、精度が約95%にまで引き上げられ、また雑音にも強いという特徴を持つそうだ。NECはこの技術を2020年までに実用化し、ネットバンキングでの決済手続きの利便性向上などを目指すとしている。
しかし、既にパスワードや指紋認証などの認証方法があるのに、なぜ声を分析する技術を発展させる必要があるのだろうか。それにはさまざまな理由があるが、一つは「声によるコミュニケーションの利便性向上」が考えられる。
上の映像は、米ベリントシステムズがコールセンターでの声認証技術の活用について解説したものだ。ここで彼らが指摘しているように、コールセンターでは電話してきた相手が名乗った通りの人物かどうかを、いくつかの質問を通じて確認している。
氏名や生年月日、住所など、いちいち聞かれてうっとうしいと感じたことがある方もいるだろう。しかし声認証、特にテキスト独立方式の認証であれば、いきなり本題に入ってしまっても、数秒間会話しているうちに本人かどうかを特定できる。もし疑わしいと判断されれば、その時点であらためて生年月日等の個人情報を尋ねたり、あるいは会話を打ち切ってしまったりといった対応も可能だ。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR