「30秒1万円」の動画翻訳が大手に刺さった理由──7度目の起業で見つけた、AI時代の勝ち筋(1/3 ページ)
AI動画翻訳サービスが、アパホテルや大手アパレル、テレビ局に次々と導入されている。手掛けるのは2024年3月設立のこんにちハロー。取締役COOとして経営全般を見る早見泰弘氏は、これが7度目の起業となるシリアルアントレプレナーだ。
AI動画翻訳サービスが、アパホテルや大手アパレル、テレビ局に次々と導入されている。手掛けるのは2024年3月設立のこんにちハロー。取締役COOとして経営全般を見る早見泰弘氏は、これが7度目の起業となるシリアルアントレプレナーだ。「AIだけで全部できると言うベンダーは多い。でもエンタープライズは絶対に人のチェックを求める」と語る同氏に、AI時代の事業の組み立て方を聞いた。
特集:現役経営者に聞く AI時代のIT起業論
生成AIの台頭によって、IT起業のセオリーは根底から覆りつつある。サービス開発の難易度は下がり、少ないリソースで事業を始めやすくなった。一方で模倣や後追いが容易になり、競合や大手に代替されないユニークな価値の創出は難化しつつある。この状況下での起業に必要な考え方を、現役経営者たちに聞く。
築地の干物屋と、シリコンバレーのインターン
築地のある蕎麦屋は、店主がこだわりを語る30秒の動画を英語と中国語に翻訳し、Googleマップに載せた。費用は2万円。それだけで海外からの客が毎月1.5倍に増え続けている。
この動画を手掛けたのが、こんにちハローである。生成AIと人の手を組み合わせ、日本語の動画を最大37言語に翻訳するサービスを提供する。話者の声質をAIでクローニングし、唇の動き(リップシンク)まで再現する。料金は30秒1万円、リップシンクなしなら半額だ。
蕎麦屋の動画には、ちょっとした仕掛けがある。店主はゆっくり話すタイプで、英語も中国語も「ネイティブっぽくない」発音にあえて仕上げてある。日本人の店主が一生懸命に外国語で語りかけているような味を残したいという本人の希望だ。スマホで撮ったような素朴な映像に、その人の声がそのまま乗る。取材中にデモを見せてもらったが、確かに「この人が本当に喋っている」ように聞こえる。
泰弘氏自身は1995年に22歳で最初の会社を立ち上げて以来、30年間にわたりさまざまな事業を手掛けてきた。では、なぜ動画翻訳だったのか。きっかけは、築地で干物屋を営む親族の存在だった。
外国人観光客が大勢来るのに日本語しか話せず、魚のこだわりを伝えられない。「おじさんが英語を覚えるよりは、生の声でそのまま喋れたらいいよね」。漠然とした思いはあったが、手段がなかった。
風向きが変わったのは23年の年末だった。米国でインターン中だった次男(現・代表取締役CEOの早見星吾氏)から連絡が入った。インターン先の台湾人社長が英語のプレゼンに苦労しており、試しに動画生成AIにかけてみたところ、本人の声で英語を話す映像ができてしまったという。
「これはビジネスになるんじゃないか」。
帰国した次男が今度は長男の早見泰星氏(現・執行役員CSO)の動画で試すと、韓国語もタイ語もペラペラに話す映像が出来上がった。「自分がペラペラになって感動した」と泰星氏は笑う。
泰弘氏は即座に「やっちゃえ」と背中を押した。「動画が簡単に多言語になるサービスは、もう売り先が山ほどイメージできた」。
翌24年3月、息子2人で会社を立ち上げる。だが、当時使った「HeyGen(ヘイジェン)」などのAIは翻訳精度に課題があった。「正直、そのままでは使えなかった」と泰星氏は振り返る。そこで米国のHeyGen本社と交渉し、生成途中のデータを引き出せるライセンスを取得。AIの出力をそのまま納品するのではなく、人の手で仕上げる制作体制を、創業の時点から組み上げた。
Copyright © ITmedia, Inc. All Rights Reserved.


