年間1000円、エフエム和歌山のAIアナウンサー「ナナコ」の裏側(2/2 ページ)
AWSのテキスト読み上げサービスを使ったラジオ放送で、一躍有名になったエフエム和歌山。システムを作った山口さんが、AWSのユーザーイベント「JAWS DAYS 2018」で、AIアナウンサーの裏側を語った。
ビジネス課題を熟知した現場の人間が「開発者」になる時代
その弱点とは、読み上げる文章のイントネーションを調整する方法が「句読点の場所を変える」ことしかない点だ。新聞社から配信されるニュース原稿を、Amazon Pollyが正確に読み上げるかは分からない。また、音声で流すには文章が長すぎるケースもある。そのため、山口さんは文章を短縮、成形するシステムを自作した。
「クラウドサービスを使うならば、JavaScriptで呼び出せるといった動的なSSMLを作った方が便利。文章成形を自動化したのもそれが理由です。文章を短縮するためのアルゴリズムは単純かもしれませんが、ラジオの現場経験がなければ絶対にできないものだと考えています。5年〜10年くらいの経験は必要でしょう」(山口さん)
周りに大勢人がいる環境や、雑踏の中でもニュースの音が聞こえるようにするにはどうするか――。そんな細かなポイントを解説する山口さんの姿からは、現場ならではの悩みや問題への気付きが、業務変革につながることが感じられる。事実、山口さんは「プログラミングで現場の課題を解決してきた10年間だった」と振り返る。
「こうした現場の課題解決は、コンサルやSIerが苦手とする領域です。その理由はシンプルで、現場の課題は現場の人間にしか分からないから。機械学習など、どんどんプログラミングがやさしくなっていけば、ITスキルを使って、自社内の問題点を探し出して解決するような人が増えるのではないでしょうか。
30年前の新卒はPCが使えなかったことを考えると、次の30年もまた必要なビジネススキルに大きな変化が訪れるでしょう。例えば、AWSを使いこなせる人が地方のとうふ屋に行ったら、間違いなく大きなイノベーションが起こりますよね。そういう意味で、全ての人が“開発者”になる時代は近いのだと思っています」(山口さん)
関連記事
- “AIアナウンサー”がラジオ放送 Amazonの音声合成技術で
コミュニティーFMを運営するエフエム和歌山が、AIサービス「Amazon Polly」を使ったラジオ放送を7月に始めた。ニュース原稿を自動で読み上げるという。 - Amazon.comのAWS、年次イベントで「Amazon AI」など多数のサービスを発表(まとめ)
AWSが年次イベント「AWS re:Invent 2016」で、人工知能サービスや大型トラックでのデータ搬送サービスなど、多数の新サービスを発表した。 - ディープラーニングで急激に進化――意外と奥が深い「音声合成」の世界
自動音声案内をはじめとして、スマートスピーカーなどでも使われる人工的な「音声合成」。その研究は50年以上もの長い歴史があるが、最近は機械学習によって、急速な進化を遂げているのだという。 - 「Hey Siri、ニュースを読んで」で失望した話
あろうことか、「買いません」と言っていたスマートスピーカーを、つい、買ってしまいました。そして、“ある機能”がとても気に入ってしまったのです。その機能をSiriで試してみると……。 - “超”画期的なAIスピーカー
ディルバートが開発した画期的なAIスピーカーは、どうやら“人を見て”会話ができるようで……。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.