年間1000円、エフエム和歌山のAIアナウンサー「ナナコ」の裏側(1/2 ページ)
AWSのテキスト読み上げサービスを使ったラジオ放送で、一躍有名になったエフエム和歌山。システムを作った山口さんが、AWSのユーザーイベント「JAWS DAYS 2018」で、AIアナウンサーの裏側を語った。
「年間1000円で働いてくれるAIアナウンサー」。エフエム和歌山のコミュニティーFM「Banana FM」が2017年7月に始めたラジオ放送は、大きな反響を呼んだ。米Amazon Web Services(AWS)のテキスト読み上げサービス「Amazon Polly」を使い、ニュースや天気予報を自動で読み上げるというもので、年間でのコストは1000円程度とも言われている。
あらかじめ新聞社などからニュース原稿を受け取り、エフエム和歌山が開発したプログラムを使い、合成音声で読み上げやすいようにルビや句読点の位置などを自動修正。原稿をエフエム和歌山のサーバに保存しておき、放送直前にAmazon Pollyが音声に変換して、自動的に読み上げる。
予算が限られがちな、小規模なコミュニティー放送局において、深夜や早朝といったアナウンサーが確保しにくい時間帯の運用を楽にしつつ、コストも削減できる。最近では、選曲も含め、音楽番組も自動で放送しているという。スタッフが1人いれば放送でき、たとえ無人でも、同じプログラムを流し続けられる。
他のAWSサービスよりも圧倒的に簡単な「Amazon Polly」
このシステムを作ったのは、同社クロスメディア局長の山口誠二さん。米国の大学を中退後、東京で3年ほどWeb系企業に勤め、その後、エフエム和歌山でラジオ業務を約10年行っているという。PHPやJavaScriptを10年以上触れ続けていたが、社内システムの面倒を見ることが多く、クラウドを使う必要性を感じていなかったという。
山口さんは自身を「AWS初心者」だと言うが、Amazon Pollyについては、ノンプログラミングで簡単に使うことができる点で、「他のAWSサービスとは違う」と話す。山口さんが、自動放送システムを作ろうと考えたのは約1年前。クラウドで使える音声合成サービス3つを比較したところ、価格はほとんど変わらないものの、日本語における音質には差が大きな出た。
「イントネーションの問題などは、機械学習の発展でいずれ改善されると考えていた一方で、音質は劇的に変わることはないと思いました。Amazon Pollyは日本語発話の品質が高く、ユーザーコミュニティーがあるので、問題が起きても解決しやすいのもポイントでした」(山口さん)
実際に、漢字や英語の読み間違いなどはどんどん改善してきており、数カ月前と今でも大きな差があるという。ただし、そんなAmazon Pollyにも「弱点」があると山口さんは話す。
関連記事
- “AIアナウンサー”がラジオ放送 Amazonの音声合成技術で
コミュニティーFMを運営するエフエム和歌山が、AIサービス「Amazon Polly」を使ったラジオ放送を7月に始めた。ニュース原稿を自動で読み上げるという。 - Amazon.comのAWS、年次イベントで「Amazon AI」など多数のサービスを発表(まとめ)
AWSが年次イベント「AWS re:Invent 2016」で、人工知能サービスや大型トラックでのデータ搬送サービスなど、多数の新サービスを発表した。 - ディープラーニングで急激に進化――意外と奥が深い「音声合成」の世界
自動音声案内をはじめとして、スマートスピーカーなどでも使われる人工的な「音声合成」。その研究は50年以上もの長い歴史があるが、最近は機械学習によって、急速な進化を遂げているのだという。 - 「Hey Siri、ニュースを読んで」で失望した話
あろうことか、「買いません」と言っていたスマートスピーカーを、つい、買ってしまいました。そして、“ある機能”がとても気に入ってしまったのです。その機能をSiriで試してみると……。 - “超”画期的なAIスピーカー
ディルバートが開発した画期的なAIスピーカーは、どうやら“人を見て”会話ができるようで……。
Copyright © ITmedia, Inc. All Rights Reserved.