Google、アプリに音声認識機能を追加できる「Cloud Speech API」を公開

Googleが、AndroidのGoogle NowやGoogle Keyboardの音声入力で採用している機械学習音声認識機能をアプリに追加できる「Cloud Speech API」をGoogle Cloud Platformユーザー向け限定プレビューとしてリリースした。

» 2016年03月24日 08時38分 公開
[佐藤由紀子ITmedia]

 米Googleは3月23日(現地時間)、米サンフランシスコで開催のクラウド関連イベント「GCP Next 2016」において、アプリに機械学習による音声認識機能を追加できる「Google Cloud Speech API」(プレビュー)をリリースしたと発表した。「Google Cloud Platform」を利用する開発者はこちらから限定プレビューに申し込める。少なくともプレビュー期間中は無料だ。

 speech 1

 Cloud Speech APIは、同社がAndroidの「Google Now」の音声検索や「Google Keyboard」での音声によるテキスト入力などで使っているディープラーニングニューラルネットワーク技術「Automatic Speech Recognition」をアプリで使えるようにするREST API。

 80カ国語以上をサポートし、雑音の多い環境でも高い認識性能を誇る。

 デモ動画(記事末に転載)では、Raspberry Piベースでマイクを搭載するロボットに「踊れる?」と語りかけると、ロボットがくるくる回転してみせたり、「回れ右」と日本語で命令すると右に回転する様子が紹介されている。

 speech 2 日本語も認識する

 Googleは昨年12月には画像認識機能の「Google Cloud Vision API」を公開した。また、同日Google Cloud Platformの新サービス「Cloud Machine Learning」を発表した。開発者はこれらのサービスを利用して、画像/音声認識と機械学習を応用したアプリを開発できる。


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ