まずはiPhoneからTwitterと連携する――音声認識技術「AmiVoice」が向かう先(2/2 ページ)
「携帯電話の音声入力はキー入力を補完するもの」と考える人が多いだろうが、アドバンスト・メディアが開発する音声認識技術「AmiVoice」は、音声入力が主役になる可能性を秘めている。キーワードは“対話”と“Twitter”だ。
対話型音声認識サービスの課題
ITmedia 説明会では、画面のキャラクターと会話ができるサービスのデモンストレーションが実施されていました。「道案内をする」「チケットを買う」といった目的型のほかに、携帯でこういう対話型の音声認識が採用される日は近いのでしょうか。
枝連 直近は難しいですが、将来的にはあり得るでしょう。住所や駅名の入力はキーを使った方が早い面もありますが、会話はキーよりも音声認識の方が適していると考えています。
ただ、現在の音声認識は話したことをテキスト化するサービスのみで、言い間違えてもそのまま文字化されます。一方、人間同士のコミュニケーションは、多少言い間違えても意味を認識することで問題なく成立します。対話型サービスは音声認識の次のステップで取り組まなければならないと考えていますが、コンピューターが人間並みにウィットに富んだ会話をしてくれるのかというと、難しいですよね。こうした知能面の課題がまずあります。
もう1つ、こうした実用とは異なるエンターテインメント機能がどれほど求められているのかは、正直まだ見えていません。現在はユーザーインタフェースも含めて検討しているところです。
Twitterとの連携サービスも提供する
ITmedia iPhone向けの音声認識メールは、Ver1.0の有償版では音声で作成した文章のコピー&ペーストが可能になりましたが、今後さらに機能を拡張する予定はあるのでしょうか。
枝連 音声入力したテキストをTwitterに投稿できる機能を9月上旬に提供する予定です。バージョンアップをすることで使えるようになります。
ITmedia 文字どおり“つぶやく”わけですね。では、iPhone以外のケータイからも音声入力でTwitterに投稿できる予定があるのでしょうか。
枝連 当初はTwitter対応の音声認識メールを利用できるのはiPhoneのみですが、iPhoneだけでは日本向けビジネスはなかなか成立しません。Twitter連携はほかの機種への展開も検討しています。ドコモ端末の場合、アプリを利用すれば技術的には可能です。
ITmedia 現在、iPhone以外の携帯で御社のサービスを利用できるのはドコモ端末が中心ですが、他キャリア向けの展開は考えているのでしょうか。
枝連 まだ詳細はお話しできませんが、こちらも検討しているところです。
ITmedia これまでお話しいただいたことを踏まえ、モバイルの分野で最も力を入れていきたいサービスや機能はありますか。
枝連 私はTwitterに対する期待が大きいですね。メールの作成は、実はすごく頭を使っているんです。頭で考えてからキーボードで入力するというのは、(ユーザーにとって)ハードルが高いんです。私が子どもの頃は、文章は書いて作っていたので、キーボード入力が普及し始めた頃は書いてから入力していました。今度はある程度慣れて、考えながらキー入力できるようになった。その次に“話しながら入力すること”を音声入力は求めてしまうので、キーボードほどではありませんが、慣れが必要です。
一方、Twitterのつぶやきは「昼ごはん食べた」とか、考えなくてもできてしまう。メールは「何かしようか」というお誘いや提案などが基本のコミュニケーションですが、Twitterは「何かしたい」と発するだけでよく、周りのユーザーが拾ってくれるので、日本の文化に合った手段だと思います。Twitterは今伸び盛りのサービスですし、モバイルとの相性もいいので、ケータイ向けに展開する意義はあると思います。Twitterはここ半年〜1年の取り組み課題ですね。
ITmedia これは音声入力の根本的な問題だと思うのですが、公共の場で音声入力をするのが恥ずかしいという人もいると思います。こうした心理的なデメリットを軽減する方法はあるのでしょうか。
枝連 この点についてはアイデアがあります。まだ発表はできませんが、“面白いコンテンツ”を現在開発中なので、ぜひご期待ください。
関連キーワード
音声認識 | らくらくホン | iPhone | 学習 | Twitter | アドバンスト・メディア | NTTドコモ | データベース | 携帯電話 | らくらくホン プレミアム | キーボード | M1000 | らくらくホン ベーシックII | らくらくホンIV | らくらくホン ベーシック | 富士通 | 医療 | NEC(日本電気) | らくらくホンV | らくらくホン6 | ユーザーインタフェース | iPhoneアプリ
関連記事
- 「アドバンスト・メディア」関連記事一覧
- 常識を超えた「超音声認識」も登場する――アドバンスト・メディアが切り開く音声認識の可能性
日本で唯一となる音声認識専門企業のアドバンスト・メディアは、医療、モバイル、コールセンター、英語教育などさまざまな分野で音声認識技術を提供している。“機械との自然なコミュニケーション”を目指すという同社の音声認識技術の強みとは。そして今後のロードマップは――。 - キーボードの代わりにiPhoneに話かけて文章入力をする「音声認識メール」
ドコモの「らくらくホン」シリーズにも採用されている音声認識エンジンが、無料のiPhoneアプリとして登場しました。認識された文字列はメールで送信できるため、iPhoneでの文字入力が苦手な人にもお勧めです。 - 声で文章作成──らくらくホンプレミアムの「音声入力メール」を試す
国内の携帯として初めて、音声で文字を入力できる「音声入力メール」機能を搭載するらくらくホン プレミアム。「意外に使えるぞ──」と思える、この機能のコツを富士通のらくらくホン プレミアム担当者に聞きながら試してみた。 - アドバンスト・メディア、702NK向けの音声認識ソフト
業務用端末としてVodafone 702NKを用い、音声認識で文字入力を行うシステムが発表された。携帯事業者などで導入が予定されている。 - FOMA M1000向けに音声認識技術を活用したビジネス統合ツール
アドバンスト・メディアは、「M1000」用のビジネス統合ツール「AmiVoice Mobile Tools - Biz Pack for M1000」を8月から提供する。音声や文章による入力や操作が可能。 - 「らくらくホンIV」の“話して目的地検索”にアドバンスト・メディアの音声認識技術
GPS搭載の「らくらくホンIV」に搭載された、目的地を話して検索する機能に、アドバンスト・メディアの音声認識技術「AmiVoice」が採用された。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.