タブレットの業務活用、“声”でここまで便利に――音声認識で変わる仕事の現場(2/2 ページ)

» 2012年10月11日 09時00分 公開
[後藤祥子,ITmedia]
前のページへ 1|2       

 デモで紹介しているのは、SIP、VoIPサービス大手のNextGenと共同開発した「電話日報ソリューション」。営業担当者がサービスセンターに電話をかけて報告内容を音声で話すと、音声データが自動でテキスト化される。会社に戻った営業担当者は、クラウド上からテキスト化されたデータをダウンロードして報告書を作成できる。音声データも保存されるので、誤変換があった場合には元データをチェックすることも可能。端末内にデータが残らないため、安心して利用できるという。

Photo 端末側のアプリ。通話アプリと同じようなUIだ。会社に戻ると通話で報告した日報がテキスト化されている

 電話日報ソリューションは、商用サービスとして提供される予定。ほかにも音声通話サービスやVoIPサービスを手がけている企業が、音声を利用した付加価値サービスを提供できるということで関心を持っており、新たなサービスの登場も期待できそうだ。

両手がふさがる点検作業は声で入力

 点検や検品といった作業は、両手がふさがっていることも多く、手が空いたときにいちいち端末を取り出して入力するのは面倒なものだ。これを、声の入力で解決しようというのが、「ハンズフリー音声対話ソリューション」だ。

 これは音声認識技術と音声合成を使ったソリューションで、端末を手にすることなく声だけで正しいデータを入力できるというもの。作業者が項目と数値を発声すると、端末側が自動でテキスト化して入力データを復唱するので、画面を見ずに正確なデータ入力を行える。

Photo 声によるデータ入力の作業イメージ(画面=左)。項目とデータをセットで発声すると、各項目にテキスト化されたデータが入力される

自然な対話で情報提供

 Appleの「Siri」やNTTドコモの「しゃべってコンシェル」など、音声を使ったパーソナルアシスタント機能が注目を集める中、フュートレックではこうしたサービスをより多くの企業が提供できるよう支援するソリューションを用意している。

 フュートレックグループの音声認識と音声合成、音声対話制御エンジンを組み合わせたソリューションで、利用者がカーナビや家電などの機器と自然な言葉で対話しながら、必要な情報を取得できるようにする。

 利用者の発話内容と、それに対する応答文をあらかじめシナリオとして設定する「シナリオ形式」と、利用者の発話内容から意図を解釈し、意図に即した応答をしながら最適なサービスや商品を紹介する「意図推定形式」の2種類が用意され、前者は点検・修理業務や在庫管理などに、後者は各種の情報検索に利用できるという。

 カーナビや家電製品が通信機能を備えるようになれば、より幅広い世代やリテラシーの人々がネットから情報を取得できるようになる。その際の情報検索手段として、注目を集めそうだ。

話した言葉を自動で翻訳、テキスト化まで

 経済のグローバル化が進む中、国内外で翻訳サービスの需要が高まっている。こうしたニーズに応えるのが「音声翻訳システム」だ。フュートレックは音声翻訳のデータベースも自前で持っており、音声認識技術と組み合わせたソリューションとして提供する。

 同社のソリューションは、英語と中国語の翻訳に対応しており、日本語で話した言葉を英語や中国語に、中国語や英語で話した言葉を日本語に翻訳し、テキストで表示する。

 こうした翻訳サービスでは、翻訳後の文章が正しいかどうかが気になるところだが、フュートレックのサービスでは、翻訳データを逆翻訳して表示するので、正しいかどうかを確認できるのが便利だ。

音声認識技術を活用したフュートレックの翻訳アプリ。アプリに向かって日本語で話すと、中国語に翻訳してテキスト表示する

 すでにAndroidアプリをNTTドコモのdマーケットで配信しており、年度内には他キャリア向けのAndroid版をGoogle Playで配信するほか、iOS版をiTunes Storeで提供する予定。企業や店舗向けには、商品名や施設名などをカスタマイズした形でライセンスするビジネスを想定しているという。

Photo 英語と中国語の翻訳に対応。【】の中に逆翻訳されたデータが表示され、正しい内容かどうかを確認できる

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

最新トピックスPR

過去記事カレンダー

2024年