まさに「世界変革」──この2カ月で画像生成AIに何が起きたのか?:新連載 清水亮の「世界を変えるAI」(5/5 ページ)
2022年8月22日。日本時間にして午前4時ごろ、「世界変革」はついに実行された。「どんな絵も描ける」AIである「Stable Diffusion」がついにオープンソースとして公開されたのだ。そこからの2カ月を振り返る。
さらに話題を呼んだのは、英語の作文支援AIを提供する「NovelAI」が提供した画像生成AIだ。NovelAIの追加機能として作られた独自の画像生成AIは、それまでStable DiffusionやMidjourneyが苦手としていた手やポーズの表現といったものを大幅に改善していて多くのファンを驚かせた。
円安の折、NovelAIへの10ドルの課金はきついと思いつつも課金する人が続出し、NovelAIの画像生成AI最強説が流れる。
また、Stable Diffusion自身の高速化・軽量化も随分進み、当初は10GB以上のVRAM(ビデオカードのメモリ)がなければ動作できなかったところを、8GB、6GB、4GBとどんどん必要なVRAMが小さくなっていった。AIが小さくなるということはその分高速に動作するということでもある。最終的には時間はかかるがCPUのみで推論する仕組みも構築された。
Stable Diffusionを利用してAIそのものを学習する試みも行われている。微分可能レンダラとStable Diffusionを組み合わせて、言葉だけからハンバーガーの3Dモデルを生成することに成功した例もある。これももちろんオープンソースだ。
さらに、Stable Diffusionと同様の拡散モデル(diffuser model)では、音声合成や音楽の生成、そして文章から分子構造を生成するといった領域にまで発展してきた。
この間、わずか2カ月である。確かに「世界変革」は起きた。そして今も起き続けている。これからどんな発展を遂げて行くのか、今後の記事で追っていきたい。
筆者プロフィール:清水 亮
新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。2005年、IPA(情報処理推進機構)より「天才プログラマー/スーパークリエイタ」として認定。株式会社ゼルペム所属AIスペシャリスト。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。
関連記事
- AI研究者兼プログラマーが「AI Programmer」について社長に聞いてみた
突如としてネット上に出現した「AI Programmer」なるサービスがバズっているとのことで、ITmedia NEWS編集部から依頼を受けた筆者は、早速うわさのサービスAI Programmerを使ってみることにした。 - 今、最も話題の画像生成AIサービス 1位は?
この数カ月で急速に注目を集め出した画像生成AIサービス。どの画像生成AIサービスがメディアに取り上げられているか。 - 「とんでもなくハイクオリティー」 話題の画像AI「Novel AI」でひたすら二次元美少女と美少年を生成してみた
画像生成AI「NovelAI Diffusion」が注目を集めている。有料会員しか利用できないにもかかわらず、Twitterではすでに「二次元美少女に強い」「とにかくハズレなくとんでもないハイクオリティーの画像がバンバン出てくる」などと話題に。同サービスの性能を試すべく、二次元の美少女・美少年をひたすら生成してみた。 - 大ウケした「Midjourney」と炎上した「mimic」の大きな違い “イラスト生成AI”はどこに向かう?
8月29日に登場した「mimic」がSNS上で議論を巻き起こした。画像生成AIは「Midjourney」や「Stable Diffusion」などに一躍注目が集まっているが、こうした各種画像生成AIとmimicとの違いは何か。 - 画像生成AI「Stable Diffusion」がオープンソース化 商用利用もOK
AIスタートアップ企業の英Stability AIは、画像生成AI「Stable Diffusion」をオープンソース化した。AI技術者向けコミュニティサイト「HuggingFace」でコードやドキュメントを公開した他、同AIを試せるデモサイトなども公開している。
Copyright © ITmedia, Inc. All Rights Reserved.