記者がSoraで生成した動画がこちら(加入しているのはProプラン)。いずれも不自然な点はあるが、短いプロンプトでも極端な破綻が少ないのにはちょっと驚く。ちなみに、プロンプトは日本語でも入力できた。
ただしいくつか動画を生成するうち、得意不得意も見えてきた。Soraは写実風やCGっぽい質感は比較的得意だが、日本のアニメっぽい動画は不得手な様子。雰囲気を問わず、長い映像になるにつれ、一貫性がなくなる傾向も見られた。
特定個人の名前やキャラクター名は入力可能だが、出力動画にはほとんど反映されないようになっていた。例えば「イーロン・マスク」と入力しても、本人に似た人物は出てこない。そしてアダルト表現は入力を受け付けず生成できなかった。いずれもディープフェイクや著作権侵害などを警戒した仕様だろう。
一方で、銃・剣など武器の映る映像は入力できたりできなかったりした。例えば「刀を持ったサムライ」は入力できなかったが「銃を持った黒ずくめの男」は生成できた。
生成に掛かる時間は、1080p/長さ5秒の場合で3〜5分ほど。なお、記者が使った10日正午ごろの時点では、1080pの動画は最大10秒までの動画しか生成できず、最長である20秒の動画は720pか480pでないと出力できなかった。
Soraは画像から動画を生成することも可能だ。素材のアップロードに当たっては、同意のない人物・18歳未満の人物を含むデータや、暴力などを含むデータをアップロードしないことなどが求められる。
自分の写真を使った動画もいくつか生成してみた(動画1:05以降)が、被写体が自分なのあってか、これはちょっと不自然すぎると感じた。指の本数がおかしかったり、突然知らない人物が出てきたり、いきなり顔が別人に変わったりと、破綻が目立つ。
愛犬や私物の写真も入れてみたが、同様だ。ただ、夜景の写真を入力し、定点カメラ映像を作らせてみると、それっぽいものができることもあった。
取りあえず数十ほど動画を生成してみた感想としては「すごいけどこんなもんか」だ。得意分野については「Dream Machine」「Runway Gen-3」など、先に一般提供が始まっていた競合サービスに勝る気もするが、長いと破綻しやすい点などはあまり変わらない。
ジャンルにもよるが、現時点では映像のクオリティーもAIっぽさが抜けないので、恐らく“ポン出し”ではおもちゃ止まりな気もする。もちろん、まだ試していない各機能や、他サービスとの併用で解決する課題も多々あるだろうが。
ただ、あくまでそれは現時点の話。最初期の「Midjourney」から現在の画像生成AIのクオリティーは予想できなかったし、ChatGPTの進化も著しかった。Soraに限った話ではないが、今後動画生成AIが進化することで、人々が得られるメリットとリスクはどちらも大きいだろう。その可能性は感じたし、記者としては「そうなった未来、事実関係の確認が大変になるかもしれないな……」と不安にもなるサービスだった。
動画生成AI「Sora」ついに登場──OpenAIが提供 最大20秒の動画作成可能 ディープフェイク対策にも慎重
月額3万円を払っていても「家に帰れ」? 動画生成AI「Sora」アクセス集中、早く使いたい人たちを突き放す
月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみたCopyright © ITmedia, Inc. All Rights Reserved.
Special
PR