では、人の手はどこに入るのか。制作の裏側は、見た目の手軽さとは裏腹に泥臭い。
まず動画の音声をAIで書き起こす。ここで早くもつまずく。例えば「西京焼き」が「最強焼き」と誤変換される。人がテキストを補正し、それを多言語に翻訳する。翻訳でもまた固有名詞や業界用語が正しく訳せない。再び人が直す。最後に音声の抑揚やイントネーションのパラメーターを人が調整し、映像のリップシンクも編集者が仕上げる。
「裏では結構泥臭い作業をやっている」と泰星氏は明かす。だがこの泥臭さこそが、大手企業の信頼を勝ち取る武器になった。
使うAIも1つではない。文字起こし、翻訳、音声生成、動画生成──工程ごとに得意なAIが異なる。自然な表情を作るならこのAI、IRの翻訳ならこのAI、というように案件の性質に応じて複数のAIを選び、時には組み合わせて1本の動画を仕上げる。社内では「AIソムリエ」と呼んでいるという。
この体制が刺さったのがエンタープライズ領域である。ある大手日用品メーカーの事例が象徴的だ。同社には英語や中国語ができるスタッフは大勢いる。だが求めたのは「一番売れている日本の美容部員」が商品を語る動画の多言語化だった。「誰が喋るかがすごく大事だ。ジャパネットたかたの社長が喋るから売れるのと同じだ」と泰星氏は説明する。
完成した動画は中国のSNS「RED」やドンキホーテの店頭モニターで流されている。クオリティが高すぎるため、「この動画はAIが作っています」と中国語で注釈を入れたほどだ。
アパホテルには全面導入された。客室案内の1分動画を4言語に翻訳し、客室テレビで放映している。費用は4言語で8万円。元々アパホテルも多言語の案内動画は制作していたが、ネイティブのスタッフに喋らせてスタジオで撮影するやり方で、人件費もスタジオ代もかさんでいた。「8万円以上は一切いただいていない。時間もお金も圧倒的に速いし安い」。
売上は初年度1500万円、2年目8500万円、今期は2億円ペースで推移する。創業月から一度も単月赤字を出していない。翻訳スタッフもAIエンジニアも業務委託の変動費で回し、固定費を徹底的に抑えた経営が効いている。「他のテックベンダーはAIで全部できますと言う。でもエンタープライズはAIを信じていない。人間がチェックするという保証があるから、大企業が取れた」と泰弘氏は言い切る。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR