画像生成AIが独自の“AI語”を生み出した? 「DALL-E 2」を巡って、米テキサス大学が論文発表
AIが人間の言葉ではない独自の言語を生成した──米テキサス大学の研究チームはそのような研究結果を示す論文を発表した。画像生成AIが生み出す文字列は意味不明なものであると思われていたが、それらの言葉は鳥や野菜などの意味を持つ“AI語”であったという。
AIが人間の言葉ではない独自の言語を生成した──米テキサス大学オースティン校の研究チームは6月1日、そのような研究結果を示す論文を発表した。文章から画像を生成するAIが生み出す文字列は、意味不明なものであると思われていたが、それらの言葉は鳥や野菜などの意味を持つ“AI語”であったという。
論文で取り上げられたのは、米AI研究企業OpenAIが開発した「DALL-E 2」。文章から画像を生成するAIとして開発され、22年4月に発表された。その生成した画像のクオリティーの高さに「最新のAIやばすぎる」「個展開ける」など、驚きの声が上がっていた。
(関連記事:最新AIの描く絵が「ヤバすぎ」「個展開ける」と話題 文章から画像を生成する「DALL・E 2」、米OpenAIが発表)
一方「野菜と書かれた本がある」や「10カ国語で書かれた野菜という言葉」など、画像中に文言を入れるリクエストは苦手であるという。例えば「 “Two farmers talking about vegetables, with subtitles.」(野菜について話す2人の農夫(字幕付き))と入力すると、2人の農夫の画像は生成できるが、字幕には「Vicootes」や「Apoploe vesrreaitais」など意味不明な文字列を提示した。
しかし研究チームは、多くの場合でこれらの文字列は画像中に表示するはずの単語と強い相関があると指摘。DALL-E 2に「Vicootes」と入力すると野菜の画像を、「Apoploe vesrreaitais」では鳥の画像を生成したという。つまり2人の農夫の画像では“野菜に害を与える鳥”について話す字幕を、AIの独自言語で表示していた可能性があるとしている。
また、DALL-E 2は生成する画像の画風を指示できる機能を持つ。これがAIの独自言語でも有効か、「Apoploe vesrreaitais」で検証したところ、鳥だけではなく飛翔する虫の画像も生成した。画風を変えた場合でも「飛ぶもの」という視覚的なコンセプトは維持されており、研究チームでは「adversarial」(敵対者)を示す言葉ではないかと推察している。
研究チームは、AIが生み出した意味不明な言葉は、バックドアなどのサイバー攻撃や、不適切な画像を生み出さないように設置したフィルターを回避するために使われる可能性があると指摘。セキュリティの観点からも、さらなる研究が必要としている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
最新AIの描く絵が「ヤバすぎ」「個展開ける」と話題 文章から画像を生成する「DALL・E 2」、米OpenAIが発表
米AI研究企業OpenAIは、文章から画像を生成するAI「DALL・E 2」を発表した。生成した画像を掲載するデモサイトも公開しており、その絵のクオリティーの高さにTwitter上では「最新のAIやばすぎる」など、驚きの声が出ている。Google、文章から画像を生成するAI「Imagen」 「DALL-E 2より好まれる」
Google Researchは、文章から画像を生成する拡散モデル「Imagen」を発表した。独自ベンチマークではOpneAIの「DALL-E 2」よりも人間に好まれる結果が出たとしている。OpenAI、自然な言葉の説明からイラストを描くAI「DALL・E」発表
AI研究企業のOpenAIが、人間の言葉による説明を入力するとそれを画像として生成するAI「DALL・E」を発表した。例えば「チュチュを着て犬を散歩させる大根の赤ちゃん」というシュールな設定でも絵にする。OpenAI、文章から画像を生成する新モデル「GLIDE」 前モデルよりも高品質な画像を生成
OpenAIの研究チームは、自然言語からフォトリアリスティックな画像を生成する機械学習の新しいモデル「GLIDE」を開発した。「マジック:ザ・ギャザリング」風のカードを自動生成できるAI 好きな言葉をカード名に入れるだけ
自然言語処理モデル「Cohere」などを開発する、カナダのCohere社はトレーディングカードゲーム「マジック:ザ・ギャザリング」(MTG)風のカードを自動生成できるAI「Urzas.ai」を作成した。