英語が苦手でも世界へ羽ばたける? 自分の声で“セルフ吹き替え”してくれるアプリがすごかった:小寺信良の「プロフェッショナル×DX」(3/3 ページ)
先日、Twitterに流れてきた情報から知ることになったアプリ、「Captions」を試してみたところ、今後は多くのコンテンツがワールド化するかもしれないという手応えを感じた。現時点で確認できるCaptionsのインパクトと、これがもたらす将来の可能性を考えてみる。
「Captions」がもたらす可能性
Captionsは、Vlogのような顔出しでしゃべるコンテンツの編集用として開発されている。翻訳アフレコされた音声には、編集や修正機能を搭載していない。これは翻訳された声も本人のものあることから、フェイク動画の制作を阻止するための措置であるという。追加でテキストを入力し、それを音声として追加することはできるが、追加される音声はプリセットされた声で、本人の声ではない。
こうしたCaptionsの翻訳アフレコ機能によって、Vlogのような、あるいはインフルエンサーと言われる人たちがSNSに投下するしゃべりコンテンツが、ワールドワイド化していくことが考えられる。元々英語圏の人達は英語でしゃべればかなりの人達にリーチできていたが、我々のように日本語という閉じた圏内でしか通用しない言語をしゃべるものにとっては、コンテンツをワールドワイド化するのは難しかった。したがって、日本国内という小さいマーケットだけで、成功するかどうかを考えなければならなかった。
これは英語圏のインフルエンサーと比較すれば、収益化の面でかなりハンデがある。しかし簡単にコンテンツを多言語化できれば、市場を世界へと広げることができる。この機能は、英語圏に住む人達よりもむしろ、ニッチな言語のコンテンツ製作者のほうにメリットが大きい。
現在Autodubが対応しているのは、英語のほかドイツ語、スペイン語、フランス語、イタリア語など一部の言語に限られる。日本語は、日本語から英語などへのAutodubには対応しているが、英語から日本語はAutodubに対応していない。つまり日本からの発信は可能だが、逆に英語圏から日本語コンテンツが大量に発生するという状況には、今のところない。
ただ字幕のみ対応の言語はもっと多いので、今後多くの言語がAutodubの対象になってくるかもしれない。つまりチャンスは我々日本人だけにあるわけではない。インドネシアやタイ、あるいは北欧・東欧といった国々から、ワールドワイドコンテンツが発信されてくる可能性がある。
言語が変わっても声質が同じということは、吹き替えされてもオリジナルコンテンツのイメージが変わらないというメリットがある。ただ映画やアニメなどの吹き替えは、感情的な言い回しなどの芝居が入るため、現時点ではまだAIによる同じ声の吹き替えは難しい。しかしそれも、時間の問題かもしれない。ニーズがあれば発展するのが、AI技術だ。
そうなると「AIが声優の仕事を奪う」的な話にもなるが、すでに人の声を学習させてして自由にしゃべらせたり歌わせたりするAIが登場しており、こうした技術は今後、あらゆる人に解放されるだろう。
Captionsの登場によって開かれるのは、これまで翻訳やアフレコするようなコストをかけられなかった零細コンテンツが、大きなビジネスに成長できるかもしれないという可能性だ。そして成功した暁には、もっとコストをかけて大がかりなコンテンツが制作できるようになる。ワールドワイド向けコンテンツも、いつまでもAIではなく本物を使うという流れも作れるだろうし、そうなるべきだ。
少なくとも今年中には、しゃべりコンテンツがワールドワイド化する道筋は付けられそうだ。Vlog勢は、この技術に注目しておくべきだろう。
関連記事
- 「字幕大国ニッポン」でも役に立つ? DaVinci Resolve β版の文字起こし機能を試してみた
Blackmagic Designが、編集ツール「DaVinci Resolve」の次期バージョン18.5のパブリックβ版を公開している。新たに、AIによる文字起こし機能で日本語がサポートされたが、どの程度使えるのか実際に使って調べてみた。 - どこもかしこも“Vlog強化” ここまで「Vlogカメラ」が増えた理由
Vlogカメラの先駆者は、ソニーだと言っていいだろう。2020年6月に、「VLOGCAM」と銘打ったカメラ「 ZV-1」を発売した。今回、デジタルカメラ市場でトップシェアのキヤノンがいよいよVlogへ向けて動き出したことで、改めてカメラ市場の一角にVlogというエリアがあるということが、広く認識されることになった。 - もう「テキストで動画編集」ができる時代に 試して分かったAIの進化っぷり
今ネット社会は、AIの進化に揺さぶられている。毎日画像生成AIで新しい画像が生み出され、次第に写真と見分けが付かなくなってきている。一方チャット系AIは検索補助ツールの領域を超えて、データ整形やアイデアツール、文書作成までこなせるようになった。この変化は動画編集にもおよんでいる。 - Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能
Metaは、新たな音声生成AIモデル「Voicebox」を発表した。従来のTTSの20倍の速度で音声を生成するとしている。ノイズ除去や言い間違いの修正、英語のスピーチを声はそのままフランス語に変換するなどが可能だ。 - YouTube、マルチ言語吹き替え機能を一部クリエイターにロールアウト中
YouTubeは、日本語を含むマルチ言語での動画の吹き替え機能を発表した。一部のクリエイターにロールアウト中だ。視聴ユーザーは、吹き替えトラック付きの動画が設定言語に対応していれば、自動的にその言語で動画を視聴できる。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.