中国Baiduは8月30日(現地時間)、画像AI「ERNIE-ViLG」を試せるデモページをオープンソースコミュニティー「Hugging Face」上で公開した。日本のTwitterユーザー間では「二次元キャラの生成に強い」などと話題を集めている。一方、先日国産の類似サービス「mimic」がβ版の機能停止を発表していたことから、中国にビジネス的なアドバンテージを取られるのではと懸念する声も見られる。
デモページでは、画像のイメージを言葉で入力し、画風を指定することで、イラストを1回につき6通り生成できる。画風は「水彩」「油彩」「アニメ風」など7種類。Baiduは中国語での利用を推奨しているが、英語も入力できる。
ERNIE-ViLGは、Baiduが手掛ける大規模データ「Wenxin」を基に、同社が開発しているAI群の一つ。中国語のテキストと画像の組み合わせを約1億4500万件学習しているという。1月に別のサイトでもデモページを公開していたが「midjourney」や「Stable Diffusion」といった競合AIが話題になった結果、Hugging Face上のデモページが日本でも注目を集めたとみられる。
デモサイトを試した日本のTwitterユーザーからは「midjourneyやStable Diffusionより二次元キャラのクオリティーが高い」などの声が出ている。一方で「天安門などと入力すると画像が出ない」といった問題点を指摘する意見も。二次元キャラのクオリティーから「日本はこの分野でも米中の企業に遅れるかもしれない」などと懸念する声も見られる。
AIイラスト生成「mimic」、β版の全機能を停止 不正利用などの課題を改善次第、正式版をリリース
イラストレーターの個性を学んで絵を“無限生成”するAIサービス 15枚のイラストから学習
画像生成AI「Stable Diffusion」がオープンソース化 商用利用もOK
話題の画像生成AI「Midjourney」は絵がヘタクソなマンガ家を救えるか?
Midjourneyで話題のAI絵画は歴史的には要するにカメラであるCopyright © ITmedia, Inc. All Rights Reserved.
Special
PR