19歳の学生社長が音声合成サービス開発、3日でユーザー5万人　AIの勉強はWeb授業とインターンで（1/2 ページ）

» 2021年05月27日 12時00分公開

[吉川大貴，ITmedia]

　「4月23日にサービスをリリースして、25日には5万人以上のユーザーが集まった。5月21日時点では20万人以上が利用しており、自分でも驚いている」──東京工業大学の2年生で19歳の早川尚吾さんは、自身が開発した音声合成サービス「CoeFont Studio」についてこう話す。

Yellstonの早川社長

　早川さんは学業の傍ら、自らが立ち上げたAIベンチャーYellston（エールストン、東京都港区）の社長も務めている。学生としてWeb授業やインターンで学んだ知識を基に、同社のサービスとしてCoeFont Studioを開発したという。

　CoeFont StudioはWebブラウザで利用可能。芯の通った声質「アリアル」と透き通った声質「ミリアル」（いずれも女性の声）を提供しており、ユーザーはメールアドレスなどを登録すれば、200文字までの日本語テキストを無料で音声化できる。

　読み上げの速さやアクセントの位置も調整できる他、複数のテキストを読み上げさせ、それらをつなげて1つの音声データにする機能も備える。出力した音声の商用利用も、法人・個人を問わず認めている。

アリアルのキャラクタービジュアル

　早川さんによれば、すでにCoeFont Studioで作成した音声をプラネタリウムの案内に使ったり、企業の採用VTRに使ったりする例が出てきているという。早川さんはこういった利用方法について「有料にしていなかったら出なかったと思う。（開発する）自分でも想像していなかった」としている。

音声のサンプル

　学生とAI企業の社長、二足のわらじを履く早川さんがどういった背景でCoeFont Studioを立ち上げるに至ったのか、そして今後どのような形でサービスを展開し、収益につなげていくのかを聞いた。

きっかけは友達とのゲーム？　「結構使えるものができてしまった」

　そもそも、CoeFont Studioはどういった経緯で生まれたサービスなのか。早川さんはきっかけとなったのは「ゲーム実況」だったと話す。

　「もともとゲームが好きで、友人と話しながらよく遊んでいた。昔は『ゲーム実況で世界を獲ろう』と思い、プレイの様子を録画することもあったが、聞き返すと自分の声が気持ち悪かった。そこでAIを活用すれば、もっといい声で収録できるのではないかと考えた」

　早川さんはもともと高校でプログラミングを学んでおり、AIやディープラーニングについても、米スタンフォード大学が無料で公開しているWeb授業で学習していた。その後、AI事業を手掛ける企業でインターンとして働き、そこで得た経験から、ディープラーニングを応用して声の課題を解決することを思い付いたという。

　「2018年ごろの技術ではまだ実用的ではないと感じており、その頃は別の分野を学んでいた。しかし20年ごろに改めて音声合成技術に触れてみると『これは使える』と感じるようになった。そこで実際に開発に取り組んでみると、当初想定していたよりさらに使えそうなものができた」

クオリティーの鍵は「アクセント」　アナウンサーの意見をフィードバック

　早川さんが「当初の想定以上」と話すCoeFont Studio。一体どんな仕組みで動いており、クオリティーを上げるためにどんな工夫をしているのか。

　CoeFont Studioではまず、ユーザーが入力したテキストをクラウド上の自然言語処理モデルで分析し、文章の読みやアクセントなどを設定。結果を基に、同じくクラウド上の音声合成AIで読み上げている。早川さんによれば、CoeFont Studioではこの中でも特に、自然言語処理モデルの働きにこだわることで、クオリティーの向上につなげているという。

　「アクセントなどがおかしいと、どれだけ音声合成が良くても不自然になる。（自然言語処理の）精度を上げるため、現役アナウンサーに音声を聞いてもらい、そのフィードバックを反映することで、東京周辺で話される日本語として正しい発音やアクセントになるようにしている」（早川さん）

“利用料タダ”の理由　今後のマネタイズは？

商用OK、無料のAI音声合成「CoeFont Studio」　ゲーム実況・プレゼンなどの利用見込む
Yellstonが、Webブラウザで使えるAI音声合成サービスを公開。利用料は無料で、プレゼンやゲーム実況動画といった用途を見込む。法人・個人を問わず商用利用を認める。
50代文系副社長、AI学んで1000時間　1人で作ったアプリが大手食品メーカー採用に至るまでの軌跡
「Pythonも知らない状態だった」という50代文系副社長が、大手食品メーカーも採用するほどの商用AIサービスを作るまでの物語。
「君、今日からクラウド担当ね」　未経験者が1人で始めた、ファミマのAWS移行の舞台裏
「AWS Summit Tokyo 2019」のセッションに、ファミリーマートでクラウド移行の責任者を務める土井洋典さんが登壇。土井さんは、前任者が突然退職したため、ある日突然上司からクラウド担当を任された経験を持つ。たった1人でのスタートだったというが、どうやってAWS移行を成功させたのだろうか。
AIで声質を“美少女”化　音声変換サービス「七声ニーナ」、DeNAが試験提供
ディー・エヌ・エーが、AIを活用したボイスチェンジャー「七声ニーナ」の試験提供を始めた。ユーザーは専用サイトで自分の声を録音するだけで、音声を女性の声質に変換できる。
Aimerのプロデューサーが手掛ける「ヒット曲を学習した作曲AI」　人気曲のどんな部分を学んでる？
アーティスト・Aimerのプロデューサーが監修するAI作曲アプリ「FIMMIGRM」。搭載しているAIは膨大な数のヒット曲の特徴を学習しているという。AIは一体、人気曲のどんな部分を学習しているのか。