ITmedia NEWS > STUDIO >
ITmedia AI+ AI活用のいまが分かる

やっと現れた市販のAI歌声合成ソフト「Synthesizer V AI」 触って分かるAIの良さ、人の良さ(2/3 ページ)

» 2020年12月28日 10時30分 公開
[谷井将人ITmedia]

勝手に歌ってくれる=勝手なことをする

 一方、AIシンガーにも弱みがある。上の音声を聞いたとき、私は正直「これでは表に出せないな」と思った。AIシンガーは結構音痴だ。

 AIを使わない既存の歌声合成ソフトは楽譜に忠実に歌うので、基本的には音を外さない。従順なソフトだといっていいだろう。AIシンガーは人間の正確ではない音程をまねした結果、音を外すようになっている。「しゃくり」は上手なら歌唱表現だが、そうでなければただ音を外しているだけだ。

 リアルはリアルだが、修正の手間が掛かるようになってしまった。人間に近づけばいいというものではない。

 この傾向は他のAI歌声合成ソフトにも見られる。早口なフレーズを歌わせると、どうしても音痴になってしまう。もっともSynthesizer V AIには「自由度」という操作項目があり、自由を奪えば派手に音を外すようなことはなくなるが。

 何もしなくても勝手に歌ってくれるというのは確かに便利だが、言い換えれば勝手なことをするということでもある。使い手の思い通りにならない。AIと使う人間のセンスが一致すればいいが、ずれている場合はずっと気に入らないままになってしまう。ソフトはアップデートが掛かるまで成長しないので、人間が合わせるしかない。

 AI歌声合成ソフトやそれに対応するAIシンガーは今後も複数登場する予定だ。購入を検討する人々に気を付けてほしいのは、そのAIとセンスが合うかどうかだ。既存の歌声合成ソフトのキャラクターは声質さえ好みならよかった。歌い方は自分で全部好きにすればいい。AI歌声合成ソフトの場合は、声質と歌い方の両方が好みかどうかを見極めたほうがいい。

photo 今後発売予定のSynthesizer V AI用音源

AIの言うことを聞かなくても別にいい

 個人的に、AI歌声合成ソフトを使っていると、なんとなく「AIの言うことを聞かないともったいない」という気分になることがままある。せっかくAIシンガーが人間っぽい歌声を出力してくれたのだから、それを全部なしにして、自分で音程や音量を編集してしまうのは、AI歌声合成ソフトの持ち味を生かせていないのでは? と。

 確かに生かせていないのだが、生かす必要も特にない。出来上がった曲を聴く人は、AIシンガーが最初にどんな提案をしてきたのかなんて知らないのだから、人間が自分の思う最高の出来に仕上げてやればいい。

 Synthesizer V AIにはさまざまな編集パラメーターがある。音量や音程はもちろん「息っぽさ」「声の張り具合」「声の若さ」などをいじれるようになっている。他のAI歌声合成ソフトは音程や音量、声の若さ以外は編集できない場合が多い。

自動調整後の修正とさまざまなパラメーター

 そういう意味では、Synthesizer V AIはどちらかというと人間に寄り添ったソフトという言い方もできるかもしれない。AIシンガーの提案を完全に無視できる仕組みになっていて、AIには申し訳ないが正直使いやすい。これだけ多くの要素を編集できるソフトはまれなので、こだわりの強いユーザーでも満足いくまでいじり倒せるだろう。特に声の張り具合をコントロールする「テンション」と、息の割合を編集できる「有声/無声」は、ファルセットや語尾で息を抜く表現を作れる便利機能だ。

 提案を完全に無視するというのを、人間相手にやったら相当気分を害してしまうだろう。せっかく頑張って歌ったのに全部なかったことにされれば当然気分が悪い。その点、AIはどんなに編集しても文句を言わない。これもメリットの一つだ。今後どうなるかは分からないが。

Copyright © ITmedia, Inc. All Rights Reserved.