音声合成はAIの力で“棒読み”を脱した 飛躍の年、2019年を振り返る(3/3 ページ)
音声合成の分野では2019年、ビジネスシーンでのAI活用が進んだ。自然な話し声や表情豊かな歌声などが一般の人々の耳にも届くようになり、倫理的な面でも議論を巻き起こした。
2020年のキーワードはズバリ「多様化」と「データ活用」
最新の研究でも音声合成分野でホットな研究テーマといえば、「より滑らかで人間らしい話し方をできるようにすること」や、「より感情豊かな表現ができるようになること」「少ない音声データで音声合成システムを作れるようになること」などが挙げられる。
これまで以上に簡単に、さまざまなパターンの声を創り出せるようになってきているということだ。
これにより、利用者はニーズや場面に合わせて簡単にAIの声を選べるようになる。男声か女声かだけではなく、淡々と話すのか、感情豊かに話すのか、誰の声を使うのか、という選択だ。
例えば、朝は元気になる声で送り出してもらい、夜はリラックスする声で迎えてもらう、といった具合だ。身の回りのAIの声を全て自分の好きな声にもできるだろう。
先述のLINEの電話応対サービスのように音声コミュニケーションが完全自動化されるケースも増えてくると期待できる。そこで得た「どの声が利用者に行動を促しやすいのか」「どんな話し方だと利用者は心地よいのか」といったデータを活用する段階に入ってくると考えられる。
「AIに操られているようで怖い」という人もいるかもしれない。しかし、特定の人しか持っていなかったスキルが誰でも扱えるようになるのは喜ばしいことではないだろうか。20年は、これまで以上にさまざまなAIの音声に触れる機会が増えてくるはずだ。また多くの議論を巻き起こすことになるだろうが、音声合成技術がどう変わっていき、どう使われるのか、その動向に注目していきたい。
関連記事
- ヤマハ、深層学習で美空ひばりの歌唱を再現 VOCALOIDの技術をAIで発展 NHKで披露
ヤマハがディープラーニングの技術を活用した同社の歌声合成技術「VOCALOID:AI」を使い、美空ひばりさんの歌声を再現。NHKが放送する番組内で新曲を披露する。 - 元・女子高生AI「りんな」、エイベックスから歌手デビュー 人間の“息遣い”を再現
元・女子高生AI「りんな」の歌声が進化。人間の歌声のデータから抽出した「ブレス音」の特徴を学習した。 - LINE、AIが電話応対するサービスで実証実験 都内レストランの予約対応を自動化
LINEが、AIを活用した電話応対サービスの実証実験を、都内のレストランで実施する。電話の予約対応の自動化を目指す。 - Alexa、「嬉しそうな声」や「がっかりした声」で返答できるように(まずは英語で)
Amazon.comが、音声アシスタントAlexaの英語での応答の声の調子を、「非常に嬉しそう」から「非常にがっかりしている」まで、6段階で設定できるようにした。 - Amazon、録音自動削除などのプライバシー関連を含む「Alexa」の新機能を多数発表
Amazonが、Echoシリーズなどの新ハードウェアの発表に合わせ、近く利用できるようになるAlexaの新機能も発表した。録音されている過去のAlexaとの会話を自動的に削除する機能や、サミュエル・L・ジャクソンの声(米国のみ、有料)などだ。
Copyright © ITmedia, Inc. All Rights Reserved.