まさに「世界変革」──この2カ月で画像生成AIに何が起きたのか？：新連載　清水亮の「世界を変えるAI」（3/5 ページ）

» 2022年10月26日 14時27分公開

[清水亮，ITmedia]

前のページへ 1|2|3|4|5 次のページへ

　なぜこうしたことが起きたのかという背景を振り返っておこう。21年1月にイーロン・マスクと米Microsoftが支援する企業OpenAIが、「なんでも作画するAI」である「DALL・E」を発表し、米Googleも続いて22年5月に同様の機能を持つ画像生成AI「Imagen」を発表した。

「DALL・E 2」は一般公開したが招待制かつ有料で、ごく一部の人だけが使うことを許されるものだった

　しかし、彼らは「発表」したが「公開」はしなかった。OpenAIにしろGoogleにしろ、その影響力の大きさから、世間の評判を異常に恐れることで萎縮せざるを得ないムードがあった。

　また、OpenAIが先に発表したGPT-3は、差別的な文章を生成してしまうことが大きく問題視された。言葉でさえ人間にとって好ましくない結果を生成してしまうAIが、もしも画像で同様の差別的なものや好ましくないものを出力したらどうなってしまうだろうか。

　その結果に責任は負えないということで、OpenAIからもGoogleからも、かなり機能の制限されたオモチャのようなAIだけが「論文が正しい証拠」として公開されただけだった。見方を変えれば、一部の大物が支配するビッグテックが、最先端のAIの成果を独占して見せびらかしているだけのように見えた。

　ところがAIの世界ほどオープンソースの恩恵を受けている場所はない。あらゆるものがオープンソース化され、交換され、それがまた互いに刺激を与えて共進化することがAIコミュニティ全体の発展に大きく寄与している。

　ところが画像生成AIに関してだけは、極端に慎重な姿勢が、むしろオープンソースコミュニティを根城とする現場のAI研究者たちの反感を買うことになった。

　OpenAIはその後、DALL-Eの後継の「DALL・E 2」の一般公開を開始したが、これも招待制かつ有料で、ごく一部の人だけが使うことを許されるものだった。

　ここに風穴をあけたのが、前述したStable Diffusionである。これまでビッグテックが慎重に囲い込んできたユーザーを、一気に一般ユーザーまで拡大した。

Stable Diffusionをもとにした新機能続々

AI研究者兼プログラマーが「AI Programmer」について社長に聞いてみた
突如としてネット上に出現した「AI Programmer」なるサービスがバズっているとのことで、ITmedia NEWS編集部から依頼を受けた筆者は、早速うわさのサービスAI Programmerを使ってみることにした。
今、最も話題の画像生成AIサービス　1位は？
この数カ月で急速に注目を集め出した画像生成AIサービス。どの画像生成AIサービスがメディアに取り上げられているか。
「とんでもなくハイクオリティー」　話題の画像AI「Novel AI」でひたすら二次元美少女と美少年を生成してみた
画像生成AI「NovelAI Diffusion」が注目を集めている。有料会員しか利用できないにもかかわらず、Twitterではすでに「二次元美少女に強い」「とにかくハズレなくとんでもないハイクオリティーの画像がバンバン出てくる」などと話題に。同サービスの性能を試すべく、二次元の美少女・美少年をひたすら生成してみた。
大ウケした「Midjourney」と炎上した「mimic」の大きな違い　“イラスト生成AI”はどこに向かう？
8月29日に登場した「mimic」がSNS上で議論を巻き起こした。画像生成AIは「Midjourney」や「Stable Diffusion」などに一躍注目が集まっているが、こうした各種画像生成AIとmimicとの違いは何か。
画像生成AI「Stable Diffusion」がオープンソース化　商用利用もOK
AIスタートアップ企業の英Stability AIは、画像生成AI「Stable Diffusion」をオープンソース化した。AI技術者向けコミュニティサイト「HuggingFace」でコードやドキュメントを公開した他、同AIを試せるデモサイトなども公開している。