ITmedia NEWS > 社会とIT >
ITmedia AI+ AI活用のいまが分かる

AIが声からウソを見抜く 劇的に進化する音声認識が変える世界よくわかる人工知能の基礎知識(2/5 ページ)

» 2019年09月09日 07時00分 公開
[小林啓倫ITmedia]

会議を変える音声認識

 それを見ていくために、会社で会議を行う場面を想像してみよう。しかも海外支社の役員クラスまで参加する、大人数での国際会議だ。

 海外拠点もまたいだ会議なので、当然ながらテレビ会議システムを立ち上げ、複数の部屋を接続しなければならない。テレビ会議用の機器接続を行ったことがある人なら分かるだろうが、操作に慣れていないとなかなか設定できず、会議の開始が遅れてしまうこともある。

 しかし近未来のオフィスでは、会議室に入って一言「会議を始めて」と言うだけで、その音声をAI(おそらく会議室に設置されているスマートスピーカーだろう)がコマンドとして認識し、予定表に入っている会議を自動的に把握して必要な設定を行ってくれるようになるだろう。

 議論が白熱して会議が予定時間内に収まらなかった場合には、会議室の予約を延長しなければならない。そんなときも、AIに向かって一言「会議室の予約を30分延長して」と言うだけで、予約を自動的に更新してくれるようになるはずだ。

 これは絵空事ではなく、米Amazon.comが自社のAIアシスタント「Alexa」の企業向けサービス「Alexa for Business」のユースケースとして想定している内容だ。

 他にも彼らは、音声を通じて会議室の予約状況を確認する、あるいは特定の時間に空いている会議室を探す、会議の関連資料を画面に表示させる――といった活用例も挙げている。企業内のスケジュール管理システムやオフィス内に設置された機器類と連動させて、音声による作業を効率化する。

 音声認識の活用先として最も期待されている分野の一つが、この音声インタフェースの実現だ。何らかのシステムや機器類の存在を前提として、その音声操作を可能にする。Alexaに限らず、AppleのSiriやMicrosoftのCortanaなど各社の音声インタフェースが登場しており、その効果を実感している人も多いだろう。Alexa for Businessのように、今後はビジネス領域に加え、医療や危機対応などよりクリティカルな分野まで普及が進むと考えられる。

 話を戻そう。われわれの会議は何とか定刻通りにスタートした。しかし手違いで通訳スタッフを手配できず、しかも海外支社の中には日本語が分からない役員がいる。そんな場合でも、近未来のオフィスでは心配いらない。そう、音声認識を利用した自動翻訳システムを利用するのである。

 音声をそのまま認識して翻訳してくれるシステムは、音声認識と自動翻訳システムを組み合わせているという点で、音声インタフェースの一例と考えられる。ただ、音声の読み取り方や、翻訳した言語をどのように返すか(字幕のようにテキスト表示するか、あるいは携帯型翻訳機のように音声を使うか)など、利用シーンに応じてさまざまな形態が登場している。

 例えば次の映像は、2017年にMicrosoftが自社の自動翻訳システム「Microsoft Translator」をデモンストレーションしている場面だ。前半は日本語の音声を日本語で文字起こしするというケースで、1分30秒辺りで音声の自動翻訳が始まる。

Copyright © ITmedia, Inc. All Rights Reserved.