音声AI技術の進化 オレオレ詐欺が無くなる未来が来るか

AIの音声認識技術が発達するにつれて、「オレオレ詐欺」などの犯罪に対抗できる日が来るかもしれない。

» 2023年12月25日 08時00分 公開
[David EssexTechTarget]

この記事は会員限定です。会員登録すると全てご覧いただけます。

 音声AI(人工知能)は、オンラインで素早く買い物をしたい消費者や、運転中にテキストメッセージを送りたいユーザーに恩恵を与えている。この技術を通話音声の分析などに用いれば、監視を強化することも可能だ。

 AIに関する理想主義的な意見は多い。例えば「もしAIの音声読み上げ技術があれば、2008年のリーマンショックを防げたのでは?」といったものだ。

 このような理想の実現を目指しているのが、英国に拠点を置くIntelligent Voice社だ。同社は、プライバシーとセキュリティに特化したAIベースの音声テキスト化プラットフォーム「Intelligent Voice」を提供している。

 Intelligent Voiceは、音声認識と自然言語処理を使って話し言葉をテキストに変換し、それを分析して電子メールやその他のチャネルで顧客に送信する。また、バイオメトリクス識別を使用して音声と書き起こしのメタデータを照合する。

広がる音声AIのユースケース

 Intelligent Voice社のナイジェル・キャニング氏(CTO《最高技術責任者》)は弁護士からIntelligent Voice社のエンジニアに転身した。「今は自分の後ろめたい過去を隠し、ずっと技術者だったふりをしています」と同氏は冗談を言う。

 キャニング氏は幼少期よりテクノロジーが好きで、2008年の金融危機をきっかけに本格的に音声技術に深く関わるようになった。

 「金融危機を経験し、電話を盗聴し、電子メールを読み、チャットメッセージを見て、悪い行動パターンを予測するアプリケーションを開発したいと思いました」(キャニング氏)

 Intelligent Voice社の最初の顧客は大手銀行だった。キャニング氏は「全ての従業員を適切に監視することは簡単ではありません。Intelligent Voiceを用いれば、人に代わってソフトウェアが監視作業をしてくれます」と話す。

 Intelligent Voice社は決済業界のセキュリティ基準への準拠にも取り組んでいる。

 「録音からクレジットカード番号の痕跡を消すことが大切です。人々はデータを保持したいと思っていますが、機密情報を録音に残したくはありません。Intelligent Voiceは氏名や住所、社会保障番号など、個人を特定できる情報も削除できます」(キャニング氏)

 キャニング氏によれば、Intelligent Voice社は通話相手の声を分析し、相手が話の内容を理解しているかどうかを判別する研究も行っているという。同氏は「高齢者に対する詐欺などに対抗するのに役立つと考えています」と話す。

LLMはAIの“方程式”をどう変えるか

 キャニング氏は、AIを使って音声を責任ある方法で処理することの難しさについて「人の話し方は千差万別であり、テキストよりも音声を扱う方がずっと難しいです」と述べる。音声AIにはリスクもある。音声技術と電話通信は「本質的に安全ではない」とキャニング氏は指摘する。

 「インターネットを介した音声通話は暗号化されておらず、ほとんどの人はその事実を知らないためです」(キャニング氏)

 音声認識には、大手IT企業が利用するような高価な処理能力も必要だ。生成AIとその大規模言語モデル(LLM)は、顧客がIntelligent Voiceを使って非構造化データから構造化データを抽出するのに役立つが、その適用には慎重さが必要だとキャニング氏は警鐘を鳴らす。

 生成AIが不正確な情報を事実として提示する可能性について、キャニング氏は「Intelligent Voiceは予測モデルを使用し、許容できるレベルの回答をLLMで囲い込みます」と話す。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ