メディア

音声認識で人間並みのコミュニケーションが可能に――「AmiVoice」の未来：Googleの「音声検索」とは違う（1/2 ページ）

» 2010年01月22日 23時31分公開

[田中聡，ITmedia]

音声認識技術「AmiVoice」は幅広い分野で採用されている

　アドバンスト・メディアは同社の音声認識技術「AmiVoice」を用いて、医療やビジネスソリューション、コールセンター、教育、議事録などさまざまな分野で“音声認識”を浸透させてきた。モバイルでは、同社のらくらくホン向け「音声入力メール」やiPhone向け「音声認識メール」のほか、GoogleもiPhoneやAndroid端末向けに音声検索を提供。音声認識は文字入力に変わる新たなユーザーインタフェースとして身近な存在になりつつある。

　音声認識技術は今後どのような進化を遂げ、どのようなビジネスモデルが創出されるのか。同社が1月22日に実施した技術・戦略説明会で、その詳細を明かした。

今後は機械が人間並みのコミュニケーション能力を持つ

アドバンスト・メディア代表取締役会長鈴木清幸氏

　アドバンスト・メディア代表取締役会長の鈴木清幸氏は、「これまでの音声認識技術は機械中心だったが、今後は人間中心に回帰する」と話し、現在が転換期であることを示唆した。同社が考える音声認識の技術ロードマップは「第1世代：単語認識（1960年～）」「第2世代：文章認識（1991年～）」「第3世代：人主体の認識（2001年～）」「第4世代：ユビキタス（2008年～）」「第5世代：超音声認識（2011年～）」の5世代。第3世代では不特定話者の会話やスピード、抑揚の違いに対応し、第4世代では携帯電話や家電、車に対応した。そして第5世代では、人間並みの音声認識を可能にする“擬人化”が実現でき、本格的なソフトコミュニケーションの時代（SCE：Soft Communication Era）に突入するという。

音声認識技術のロードマップ

　この擬人化サービスの1例として鈴木氏は、キャラクターと対話をすることでユーザーの要求を満たすサービスを紹介。自分の星座を教えると占いをしてくれたり、好きな野球チームを教えてくれたりといった日常会話ができるほか、劇場のチケットを予約するなどのコンシェルジュ的なサービスも可能になるという。「何もない状態では人はしゃべらないので、誘導するものが必要。これは単なる音声認識ではできないものだ」と同氏は自信を見せる。

　また鈴木氏は、擬人化サービスは「多様化に対応することが重要だ」と話す。同氏がデモ中、キャラクターに「年はいくつ？」「年齢は何歳？」「年は何歳だと思ってるんだっけ？」「年齢は何歳だって皆に言いふらしてるの？」といった同じ意味の質問を繰り返したが、返ってきた答はいずれも「多分4歳です」だった。また、「僕は中日ファンだけど野球はどこのファンなの？」と質問すると「ジャイアンツ」と答えるという具合に、話し言葉からキーワードを抽出して正しい反応をすることもできる。さらに、「400円のリンゴを2つ買ったら」と聞くと「800円です」と答えるなど計算能力や、ユーザーの声をコンピューターが聞き取れなかったり、答えられない質問が来た場合は決まった言葉を話すといった“逃げ”の要素も盛り込んだ。このように「知識を持った擬人化に価値がある」と鈴木氏は話す。

対話型サービスを使って占いのデモを実施

「人気のあるミュージカルについて教えてくれるかな？」と聞くと、「ライオンキング」を勧めてくれたほか、関連するWebサイトに自動でジャンプし、チケットの予約状況も教えてくれた

　アドバンスト・メディアは将来的には、デモで実施したような、機械が人間並みのコミュニケーション能力を持つサービスを普及させる構えだ。鈴木氏は「設立当初に描いていた経営のビジョンにだいぶ近づいてきた」と振り返る。こうした対話型のサービスをケータイに実装することも検討はしているが、具体的な時期は未定。「まずは音声認識ソリューションでしっかり収益を上げたい」（鈴木氏）

アドバンスト・メディアが目指す10年後の音声認識技術の世界

Googleの音声検索はユーザー集めの道具にすぎない

　鈴木氏はGoogleが無料で音声検索を開始したことにも触れ、Googleの音声検索とはビジネスモデルが異なることを強調した。「Googleは広告料で収益を得ているので、音声検索は同社にとってユーザー集めの道具にすぎない」と説明する。音声認識ベンダーにとって、音声認識事業で収益を得るのは困難だが、アドバンスト・メディアはDSR（分散型音声認識技術）クライアントとサーバ使用料徴収ビジネスや、電子カルテや議事録などで声をデータ化する（VDS）事業など、独自のビジネスモデルを確立してきた。ちなみに、iPhoneの音声認識メールやTwitter連携は、DSR利用料徴収ビジネスで収益を上げている。

　「AmiVoiceの事業はユーザーが増えるほど収益の安定化が期待でき、利用者が増えるほど真似を阻む壁が高くなるので、Googleが手を出せない領域だ」と鈴木氏は自信を見せる。

アドバンスト・メディアが2009年度上期に実施してきたサービス事業（写真＝左）。同社が考える、超音声認識技術のビジネスモデル（写真＝中）。Googleの音声検索とはビジネスモデルが異なることを強調した（写真＝右）

アクセストップ10

2026年03月14日更新

「iPhone 17e」と「iPhone 17」は何が違う？　3万円の価格差をスペックから検証する（2026年03月10日）
庵野秀明、GACKT、ひろゆき、ドワンゴ川上らが集結　“カメラのいらないテレビ電話”をうたう新サービス「POPOPO」18日に発表へ（2026年03月11日）
Apple、旧型iPhone・iPad向けに緊急セキュリティ更新を配信（2026年03月13日）
100W出力で急速充電対応「UGREEN USB Type-Cケーブル」が43％オフの743円に（2026年03月12日）
「Galaxy S26」シリーズはどこが安い？　一括価格と2年間の実質負担額を比較、お得なキャリアはココだ（2026年03月11日）
サムスンに聞く「Galaxy S26」シリーズ開発秘話　AI機能はさらに賢く、商用化まで5年を要した「プライバシーディスプレイ」（2026年03月12日）
「iPad Air（M4）」実機レビュー　「もうProじゃなくてもいい」と思えた性能、だからこそ欲しかったFace ID （2026年03月09日）
Xiaomiからも“デカバ”モデルが登場！　1万mAhバッテリー時代が到来（2026年03月12日）
キーボード付きスマホ「Titan 2 Elite」がUnihertzから登場　実機に触れて分かった“絶妙なサイズ感” （2026年03月09日）
ドコモ、個人向け「副回線サービス」を9月30日に終了　法人向けは継続（2026年03月12日）

ランキングトップ30

最新トピックスPR

過去記事カレンダー

2026年

2025年

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

2002年

2001年

Feed Back

利用規約

ITmediaはアイティメディア株式会社の登録商標です。