中国Baiduは8月30日(現地時間)、画像AI「ERNIE-ViLG」を試せるデモページをオープンソースコミュニティー「Hugging Face」上で公開した。日本のTwitterユーザー間では「二次元キャラの生成に強い」などと話題を集めている。一方、先日国産の類似サービス「mimic」がβ版の機能停止を発表していたことから、中国にビジネス的なアドバンテージを取られるのではと懸念する声も見られる。
デモページでは、画像のイメージを言葉で入力し、画風を指定することで、イラストを1回につき6通り生成できる。画風は「水彩」「油彩」「アニメ風」など7種類。Baiduは中国語での利用を推奨しているが、英語も入力できる。
ERNIE-ViLGは、Baiduが手掛ける大規模データ「Wenxin」を基に、同社が開発しているAI群の一つ。中国語のテキストと画像の組み合わせを約1億4500万件学習しているという。1月に別のサイトでもデモページを公開していたが「midjourney」や「Stable Diffusion」といった競合AIが話題になった結果、Hugging Face上のデモページが日本でも注目を集めたとみられる。
デモサイトを試した日本のTwitterユーザーからは「midjourneyやStable Diffusionより二次元キャラのクオリティーが高い」などの声が出ている。一方で「天安門などと入力すると画像が出ない」といった問題点を指摘する意見も。二次元キャラのクオリティーから「日本はこの分野でも米中の企業に遅れるかもしれない」などと懸念する声も見られる。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR