米Amazon.com傘下のAWSは11月29日(現地時間)、年次イベント「AWS re:Invent 2017」で、AI採用の3つの音声・テキスト関連サービス「Amazon Transcribe」「Amazon Comprehend」「Amazon Translate」を発表した。いずれも日本語にはまだ対応していないが、今後対応言語は拡大していく見込みだ。
Amazon Transcribeは音声をテキストに変換する機能をアプリに追加するための自動音声認識サービス。機械学習技術を採用し、Amazon S3に保存してある最長2時間の音声ファイルをAmazon Transcribe APIで解析し、テキストファイルに変換できる。
発表段階では英語とスペイン語のみサポートする。“間もなく”他の言語も追加していくという。WAV、MP3、MP4、FLACをサポートし、電話の音声など低品質なデータでも解析できるとしている。近い将来には複数の話者の識別が可能になる見込みだ。専門用語や固有名詞など、語彙のカスタマイズも可能になる予定。
Amazon Comprehendは、テキストデータを解析し、キーワードや地名、固有名詞、ポジティブ/ネガティブな言葉などの情報を抽出する自然言語処理(NLP)サービス。英語とスペイン語で利用できる。テキストを与えてから数百秒ミリで結果が返ってくる。サービス提供開始後も学習を続け、精度が上がっていく。
ユースケースとしては顧客の感情解析、検索エンジンの改良、ナレッジ管理などが考えられる。Amazon Transcribeと組み合わせれば、サポートセンターへの電話での問い合わせ解析に使えるだろう。
Amazon Translateは、機械学習技術採用のニューラル機械翻訳サービス。テキストを翻訳する。まずは英語←→アラビア語、簡体字中国語、フランス語、ドイツ語、スペイン語、ポルトガル語をサポートする。
Amazon Transcribe、テキストを自然に読み上げる「Amazon Polly」などと組み合わせれば、音声の翻訳サービスの構築も可能だ。
「AWS re:Invent 2017」で発表された新サービスはAWSの特設サイトにまとめられている。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR