タブレットの業務活用、“声”でここまで便利に――音声認識で変わる仕事の現場(2/2 ページ)
業務でスマートデバイスを使っていて、文字入力にストレスを感じたことはないだろうか。その解決策として注目を集めているのが音声認識技術だ。この技術はどんな業務をどのように快適にするのか。音声認識ソリューションの開発を手がけるフュートレックに聞いた。
デモで紹介しているのは、SIP、VoIPサービス大手のNextGenと共同開発した「電話日報ソリューション」。営業担当者がサービスセンターに電話をかけて報告内容を音声で話すと、音声データが自動でテキスト化される。会社に戻った営業担当者は、クラウド上からテキスト化されたデータをダウンロードして報告書を作成できる。音声データも保存されるので、誤変換があった場合には元データをチェックすることも可能。端末内にデータが残らないため、安心して利用できるという。
電話日報ソリューションは、商用サービスとして提供される予定。ほかにも音声通話サービスやVoIPサービスを手がけている企業が、音声を利用した付加価値サービスを提供できるということで関心を持っており、新たなサービスの登場も期待できそうだ。
両手がふさがる点検作業は声で入力
点検や検品といった作業は、両手がふさがっていることも多く、手が空いたときにいちいち端末を取り出して入力するのは面倒なものだ。これを、声の入力で解決しようというのが、「ハンズフリー音声対話ソリューション」だ。
これは音声認識技術と音声合成を使ったソリューションで、端末を手にすることなく声だけで正しいデータを入力できるというもの。作業者が項目と数値を発声すると、端末側が自動でテキスト化して入力データを復唱するので、画面を見ずに正確なデータ入力を行える。
自然な対話で情報提供
Appleの「Siri」やNTTドコモの「しゃべってコンシェル」など、音声を使ったパーソナルアシスタント機能が注目を集める中、フュートレックではこうしたサービスをより多くの企業が提供できるよう支援するソリューションを用意している。
フュートレックグループの音声認識と音声合成、音声対話制御エンジンを組み合わせたソリューションで、利用者がカーナビや家電などの機器と自然な言葉で対話しながら、必要な情報を取得できるようにする。
利用者の発話内容と、それに対する応答文をあらかじめシナリオとして設定する「シナリオ形式」と、利用者の発話内容から意図を解釈し、意図に即した応答をしながら最適なサービスや商品を紹介する「意図推定形式」の2種類が用意され、前者は点検・修理業務や在庫管理などに、後者は各種の情報検索に利用できるという。
カーナビや家電製品が通信機能を備えるようになれば、より幅広い世代やリテラシーの人々がネットから情報を取得できるようになる。その際の情報検索手段として、注目を集めそうだ。
話した言葉を自動で翻訳、テキスト化まで
経済のグローバル化が進む中、国内外で翻訳サービスの需要が高まっている。こうしたニーズに応えるのが「音声翻訳システム」だ。フュートレックは音声翻訳のデータベースも自前で持っており、音声認識技術と組み合わせたソリューションとして提供する。
同社のソリューションは、英語と中国語の翻訳に対応しており、日本語で話した言葉を英語や中国語に、中国語や英語で話した言葉を日本語に翻訳し、テキストで表示する。
こうした翻訳サービスでは、翻訳後の文章が正しいかどうかが気になるところだが、フュートレックのサービスでは、翻訳データを逆翻訳して表示するので、正しいかどうかを確認できるのが便利だ。
すでにAndroidアプリをNTTドコモのdマーケットで配信しており、年度内には他キャリア向けのAndroid版をGoogle Playで配信するほか、iOS版をiTunes Storeで提供する予定。企業や店舗向けには、商品名や施設名などをカスタマイズした形でライセンスするビジネスを想定しているという。
関連記事
- フュートレック、「スマートフォン&タブレット2012秋」に出展
「カンタン 便利に 音声認識」をテーマに、音声認識技術の性能や業務用スマートデバイスでの活用事例を紹介する。 - スマホ向け業務ソリューションに音声技術を――フュートレックが「vGate」ブランド立ち上げ
フュートレックが、スマートデバイス向け業務支援ソリューションに採用された自社の音声技術をブランド化した。新ブランド名は「vGate」。 - 目指すのは“意味まで分かる”音声認識――モバイルUIの変革を目指すニュアンス
端末の高機能化に伴う操作の煩雑化、慣れが必要なタッチパネル端末の文字入力など、昨今の端末操作にはさまざまな課題が見え始めている。その解決策の1つとして注目されるのが音声認識技術だ。米音声認識ソリューション大手のNuanceに、音声認識技術がスマートフォンの操作やサービスにもたらす新たな可能性について聞いた。 - Googleは競争相手ではない?――B to Bと多言語化に注力するアドバンスト・メディア
モバイル分野ではこれまでコンシューマー向けに音声認識サービスを提供してきたアドバンスト・メディアが、今後は法人向け業務アプリの開発にも注力する。また、iOSだけでなく、AndroidやWindows Phone 7向けアプリも開発していく。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.