米OpenAIは12月9日、テキストからビデオを生成するAIモデルをChatGPT PlusおよびProユーザー向けに公開したと発表した。このリリースにより、同社はマルチモーダルAI技術の分野での取り組みをさらに拡大する。
Microsoftが支援する同社は、2022年11月にChatGPTを発表し、生成AIブームの火付け役となった。今回のリリースは、MetaやAlphabetのGoogle、さらにはStability AIのStable Video Diffusionが提供する同様のテキストからビデオ生成ツールをターゲットにするものだ。
このAIモデル「Sora」は2024年2月に初めて発表されたが、研究プレビュー段階では安全性テスターに限定して提供されていた。現在は、追加料金なしでChatGPT PlusおよびProユーザー向けに「Sora Turbo」として利用可能となった。
「さまざまなタイプのユーザー向けにカスタマイズされた価格プランを、2025年初めに提供する予定だ」と同社はブログ投稿で述べている。
ユーザーは最大1080pの解像度、最長20秒のビデオを、ワイドスクリーン、縦型、または正方形のアスペクト比で生成することが可能となる。
OpenAIによると、Soraは現在のところ、EU諸国、スイス、英国では利用できないが、ChatGPTが利用可能な他の地域ではアクセス可能だという。
また、同社は、子どもの性的虐待素材や性的ディープフェイクなどの有害な悪用を防ぐため、Soraでのこれらのコンテンツの生成やアップロードを禁止するとしている。
「公開当初は、人物を使用したアップロードが制限されるが、ディープフェイクの抑制機能を改良しながら、より多くのユーザーに機能を展開する予定だ」と述べている。
【編集部注】「Sora」は11日午前10時30分現在「アクセスが集中している」としてアカウント作成を一時停止している。OpenAIのサム・アルトマンCEOはXに「Soraの需要を大幅に過小評価していた」と投稿。アクセスできるようになるには「少し時間を要しそうだ」としている。
日産の低迷は「人災」 なぜ米国にHVを投入しなかったのか
Copyright © Thomson Reuters
Special
PR注目記事ランキング