広報・告知がここまで変わる Sora2で“伝わる動画”を簡単生成する方法(1/2 ページ)
OpenAIが提供している動画生成サービス「Sora」の新バージョン(Sora2)が限定公開された。今回は、従来のSoraとの違いを含めて紹介する。
著者プロフィール:川口弘行(かわぐち・ひろゆき)
川口弘行合同会社代表社員。芝浦工業大学大学院博士(後期)課程修了。博士(工学)。2009年高知県CIO補佐官に着任して以来、省庁、地方自治体のデジタル化に関わる。
2016年、佐賀県情報企画監として在任中に開発したファイル無害化システム「サニタイザー」が全国の自治体に採用され、任期満了後に事業化、約700団体で使用されている。
2023年、公共機関の調達事務を生成型AIで支援するサービス「プロキュアテック」を開始。公共機関の調達事務をデジタル、アナログの両輪でサポートしている。
現在は、全国のいくつかの自治体のCIO補佐官、アドバイザーとして活動中。総務省地域情報化アドバイザー。公式Webサイト:川口弘行合同会社、公式X:@kawaguchi_com
こんにちは。「全国の自治体が抱える潜在的な課題を解決すべく、職員が自ら動けるような環境をデジタル技術で整備していく」ことを目指している川口弘行です。
つい先日、米OpenAIが提供している動画生成サービス「Sora」の新バージョン(Sora2)が限定公開され、筆者の周囲でも話題となっています。現時点ではSora2の利用は有償ユーザーに対する招待制となっていますが、近いうちに一般利用者も使えるようになるでしょう。
筆者も招待コードをもらうことができたので、早速、使ってみることにしました。
OpenAIのサム・アルトマンCEOも「これまでのSoraがGPT1だとすると、今回のSora2はGPT3.5に相当するぐらいの進化」と発言していました。筆者個人もその品質には非常に期待していましたが、実際はその期待をはるかに超える性能でした。今回は従来のSoraとの違いや、Sora2を告知・広報などの業務に活用するヒントをご紹介します。
Sora2で何が変わった? 驚きの動画精度
Sora2では、前バージョンと比較していくつかの大きな改善点が見られました。
まず、動画生成の精度と自然さが大幅に向上しています。
OpenAIの言葉を借りれば「物理シミュレーションモデルの機能改善」なのですが、従来のSoraの場合、プロンプトを忠実に実行しようとするあまり、物体を変形させたり、現実を歪めたりしてしまうことがありました。
例えば、SoraとSora2で同じプロンプトを入力してみた結果が次の通りです。
※英語であることや文章の長さは気にしないでください。ディテールを細かく設定する目的で指示しているだけなので、Sora2との機能を比較するだけならば、もっと簡単なプロンプトでもよいはずです。
【プロンプト】
This hyper-realistic black-and-white photograph captures a young Japanese female pianist. A waist-high mid-shot shows her playing an upright piano, but the angle, lighting, background, and clothing placement remain unchanged. The piano piece is epic, with a tempo of 89 BPM. She wears a well-tailored blazer, buttoned vest, scarf, and beret, all in monochrome tones. A dramatic ceiling spotlight creates strong contrast and deep shadows against the dark background. Her face has a symmetrical V-shape, and her expressive, bright eyes are framed by her natural black hair, carefully styled beneath her beret. Soft highlights and gentle shadow falloff create a joyful, confident expression. Shot with a digital full-frame camera and a 50mm lens, the vivid texture of the fabric and the smooth gradations of tone in her skin and clothing are highlighted. 4K high-resolution, studio shot, minimalist composition.
一目瞭然ですが、Soraではピアノと演奏者を同時に見せようとして、明らかにおかしな向きでピアノを弾いています。一方、Sora2では違和感なくピアノを弾いている様子が動画になっています。
プロンプト一つで「セリフ入り動画」がそのまま完成
さらにSora2では、動画だけでなく音声が一緒に生成されるようになりました。効果音やBGMだけでなく、写っている人物が話す言葉も生成されます。日本語も対応しているようです。
驚いたのは、この音声は動画上の唇の動きとも一致しています(リップシンクといいます)。他社の動画生成サービスでは、リップシンクができるものもあるのですが、あらかじめ音声を用意しておいて、動画生成の際に唇の動きをあわせるようにするものでした。
一方、Sora2では最初からプロンプトで「◯◯というセリフを言って」と指示すると、そのとおりの音声付き動画が生成されるようになりました。
また、私たちは日頃からテレビや動画配信サービスなどで、非常に洗練した動画表現を見ているので、あまり気付かないのかもしれませんが、細かなカット割り、キャプション文字表示、効果音など、視聴者に対してストレスを与えることなく、意識に届きやすいような編集を加えた動画も自動的に生成してくれます。
例えば、次のようなプロンプトを与えてみます。
【プロンプト】
高校生向けのスキンケアクリームの広告を作って。「恋に部活に大忙し」な高校生がニキビに悩んでいるが、このスキンケアでバッチリ、みたいなもの。アップテンポな元気の出るBGMや出演者の元気なセリフも加えて。 今ならクリームを買うと素敵なチャームがプレゼント、というキャンペーンもやってます。
これで生成された動画は以下から見ることができます。
本当にプロンプトはこれだけです。筆者の感性では「つるんっ スキなし!」は絶対に出てきません。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
異動は「異業種への転職レベル」、現場は疲弊 自治体職員の働き方はどこへ向かう?
今回は、Yahoo!ニュースを通じて寄せられた筆者の記事に対するコメントに答えるかたちで、自治体職員の働き方について改めて考えてみたい。
なぜ「BPR」「RPA」では限界なのか? 自治体DXを“職員主導”で進めるAIエージェント活用術
今回は、自治体のCIO補佐官としてDX支援を手掛ける筆者が、AIエージェントを実際に活用して自治体業務を効率化する具体的なケースを紹介する。
「志はある。でも……」 自治体職員の意欲が育たないのはなぜ? デジタル化以前に取り組むべきこと
人手不足、待遇格差、報われにくさ……。それでもなお「社会を変えられる仕事」と信じて行政の職に就く人たちは、日々どんな現実と向き合い、どうやってモチベーションを維持しているのか。
デジタル人材を入れたのに、なぜ失敗? 自治体DXに潜む「構造的ミスマッチ」とは
今回は、自治体のCIO補佐官として複数自治体で活動する筆者の実感をもとに、「なぜ高度専門人材を登用しても変革が起きないのか」を問い直す。
DXが進まない自治体、職員の行動を阻むものとは……? Deep Researchが出した答えは
人は、35歳を過ぎてから登場した技術を「不自然で受け入れがたいもの」と感じる――。ダグラス・アダムスが示した法則は事実か。Deep Researchが出力した結果とは。半分お遊びで使ってみたDeep Researchは、自治体業務にも十分生かせそうだ。


