OpenAIが開発、動画生成AI「Sora」の衝撃 エンタメコンテンツはどう変わる?(1/3 ページ)

» 2024年02月27日 07時00分 公開

 2023年のIT業界のメイントピックといえば「生成AI」でした。

 ビジネス向けには対話型AI「ChatGPT」、クリエイティブ向けには画像生成AIの「Midjourney」(ミッドジャーニー)や「Stable Deffusion」(ステイブル・ディフュージョン)など、多くのプラットフォームやツールが話題になりました。直近では、OpenAIが動画生成AI「Sora」を発表し、クオリティーの高さに注目を集めています。

 これらの技術革新によって、コンテンツ作りやエンタメビジネスは今後、どう変化していくのでしょうか。SNSコンテンツやキャラクター、Webtoon、Web3などのエンタメビジネスを国内外で手掛けるMinto(東京都港区)代表取締役の水野和寛が解説します。

OpenAIが発表した動画生成AI「Sora」によって作られた、東京で歩いている女性(同社Webサイトより)

水野 和寛(みずのかづひろ)/ Kazuhiro Mizuno

photo

株式会社Minto代表取締役。

一般社団法人ライセンシングインターナショナルジャパン理事。

前職で国内最大級のデコメやゲーム等の事業を牽引後、株式会社クオン設立。キャラクター・スタンプで世界60億超DL。2021年にSNS漫画で国内最大級のwwwaapと経営統合し、株式会社Mintoに。 統合後新たに立ち上げたWeb3、Webtoon、メタバース領域の事業も成長中。


画像、動画、音楽……進化が著しいコンテンツ生成AIサービス

 コンテンツ制作を変革する技術として、さまざまな生成AIが登場していますが、まずは画像コンテンツ関連から紹介していきます。

画像生成AI「Midjourney」「Stable Diffusion」の実力

 Midjourneyは、写真表現に優れた代表的な画像生成AIで、22年7月にオープンベータ化されてから、驚異的なスピードで進化しています。23年12月には、V6がリリースされ、より短いプロンプトで作成者の意図したものに近付くようになり、高解像度の画像が生成できるようになりました。文字入れの機能なども追加され、高精細な画像の中の商品名などを文字指定できるようになりました(ロゴ制作などが可能)。

 双璧をなす代表格の画像生成AI、Stable Diffusion XLは、ソフトウェア開発プラットフォームのGitHubでオープンソースとして公開されており、自らのローカルPCにインストールして環境を構築し、さまざまなカスタマイズができるのが特徴です。

 自らカスタマイズできるため、Stable Diffusionを活用したサービス、アプリケーション、コンテンツも多数生まれています。とはいえ、ローカルPCへ環境構築することの難易度は高く、Webサイトを通じて利用する場合は、Hugging Face、Dream Studio、Mageなどのサイト経由でも利用可能です。

OpenAIが発表 動画生成AI「Sora」の衝撃

 画像の生成AIに加えて、24年は動画の生成AIにも注目が集まりそうです。

 OpenAIが2月16日に発表した動画生成AI「Sora」は、テキストの指示から現実的で想像力豊かなシーンを作成できるAIモデルと同社は説明しています。現時点では一般公開されておらず、一部の制作者向けの限定公開中ですが、サンプルコンテンツとして挙げられているText to Videoの動画は、今までの動画生成AIを一瞬で凌駕してしまうクオリティーです。

 また、ChatGPT(DALL-E3)で生成された画像をアニメーション化しているサンプル(Image-to-Video)や、すでにある動画の前後の時間を拡張した新しい動画(Video to Video)のサンプルも公開されており、こちらも衝撃的です。

Soraはすでにある動画の前後の時間を拡張した新しい動画(Video to Video)を作成できる

 一般公開していない理由はさまざまあると言われていますが、そのひとつとしてクオリティーが高すぎて、現実の動画なのか、生成AIによって作られれた動画なのかが区別できない可能性があり、現在社会問題化しているフェイク動画を簡単に作れてしまうからです。

 同社では、生成AIモデルを敵対的にテストする「レッドチーム」と協力し、一般公開する前に重要な安全措置(電子透かしなど)を講じると説明しています。

 また、限定的な公開ではありますが、すでにアーティスト、デザイナー、映画クリエイターへアクセス権が渡されているので、一般公開に合わせて想像もつかないレベルのクリエイティブコンテンツが出てくるのは間違いないでしょう。

 ということで、Soraが動画生成AIを全てひっくり返してしまった感はあるのですが、その他の動画生成AIについてもいつくか見てみましょう。

 動画生成AIを活用して、すでにクリエイターがコンテンツを発表しているものもあります。パラパラマンガ風のアニメ動画を生成できる「Kaiber.ai」は、その特徴的な動画のクオリティーの面白さから、米国のロックバンドLinkin Park(リンキン・パーク)のMV「Lost」の制作に活用されています。

 また「Pika」は、テキスト(プロンプト)から動画を作るだけでなく、提供した静止画像を動画化することもできるAIで、リアルな実写風動画を作ることができます。

 その他にも、Stable Diffusionと同じように自分のローカルPC環境で環境構築してカスタマイズできる「Stable Video」、動画編集ツールとして19年から提供されていた「Runway」(生成AI機能を搭載したバージョンは、Runway Gen-2)など、それぞれのツールには特徴があります。動画生成AIは、画像生成AIに比べると生成にかかる時間や設定の難しさがあるため、使う目的によってツールを選択していく必要はあるかと思います。

音楽生成AIもハイクオリティー

 音楽生成AIとしては、23年9月に公開された「Suno AI」が話題です。音楽ジャンルやスタイルのプロンプトを入力するだけで、ボーカル入りの楽曲が簡単に出来上がります。歌詞を自分で書くこともでき、あっという間にオリジナルの楽曲が作れます。楽曲のクオリティーが高く、歌詞も足りない箇所は楽曲に合わせて自動で補完。1回当たりに生成される曲の長さは1分程度ですが、連続して生成する機能があり、3回ほどつなげば3〜4分程度の楽曲になります。ユーザーによって生成された楽曲を聴いてみると、AIとは思えないクオリティーの楽曲が数多く、びっくりしますね。

 このように、画像・動画・音楽コンテンツ制作において、さまざまな生成AIツールやサービスを活用することで、続々と新しいコンテンツが生み出されています。次は、それらの事例について見ていきましょう。

       1|2|3 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.