年間1000円、エフエム和歌山のAIアナウンサー「ナナコ」の裏側(1/2 ページ)

AWSのテキスト読み上げサービスを使ったラジオ放送で、一躍有名になったエフエム和歌山。システムを作った山口さんが、AWSのユーザーイベント「JAWS DAYS 2018」で、AIアナウンサーの裏側を語った。

» 2018年03月22日 08時00分 公開
[池田憲弘ITmedia]
photo エフエム和歌山のコミュニティーFM「Banana FM」が、テキスト読み上げサービス「Amazon Polly」を用いた放送を始めた

 「年間1000円で働いてくれるAIアナウンサー」。エフエム和歌山のコミュニティーFM「Banana FM」が2017年7月に始めたラジオ放送は、大きな反響を呼んだ。米Amazon Web Services(AWS)のテキスト読み上げサービス「Amazon Polly」を使い、ニュースや天気予報を自動で読み上げるというもので、年間でのコストは1000円程度とも言われている。

 あらかじめ新聞社などからニュース原稿を受け取り、エフエム和歌山が開発したプログラムを使い、合成音声で読み上げやすいようにルビや句読点の位置などを自動修正。原稿をエフエム和歌山のサーバに保存しておき、放送直前にAmazon Pollyが音声に変換して、自動的に読み上げる。

 予算が限られがちな、小規模なコミュニティー放送局において、深夜や早朝といったアナウンサーが確保しにくい時間帯の運用を楽にしつつ、コストも削減できる。最近では、選曲も含め、音楽番組も自動で放送しているという。スタッフが1人いれば放送でき、たとえ無人でも、同じプログラムを流し続けられる。

他のAWSサービスよりも圧倒的に簡単な「Amazon Polly」

photo エフエム和歌山 クロスメディア局長 山口誠二さん。JAWS DAYS 2018で講演を行った

 このシステムを作ったのは、同社クロスメディア局長の山口誠二さん。米国の大学を中退後、東京で3年ほどWeb系企業に勤め、その後、エフエム和歌山でラジオ業務を約10年行っているという。PHPやJavaScriptを10年以上触れ続けていたが、社内システムの面倒を見ることが多く、クラウドを使う必要性を感じていなかったという。

 山口さんは自身を「AWS初心者」だと言うが、Amazon Pollyについては、ノンプログラミングで簡単に使うことができる点で、「他のAWSサービスとは違う」と話す。山口さんが、自動放送システムを作ろうと考えたのは約1年前。クラウドで使える音声合成サービス3つを比較したところ、価格はほとんど変わらないものの、日本語における音質には差が大きな出た。

 「イントネーションの問題などは、機械学習の発展でいずれ改善されると考えていた一方で、音質は劇的に変わることはないと思いました。Amazon Pollyは日本語発話の品質が高く、ユーザーコミュニティーがあるので、問題が起きても解決しやすいのもポイントでした」(山口さん)

 実際に、漢字や英語の読み間違いなどはどんどん改善してきており、数カ月前と今でも大きな差があるという。ただし、そんなAmazon Pollyにも「弱点」があると山口さんは話す。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ