自治体DX最前線

広報・告知がここまで変わる Sora2で“伝わる動画”を簡単生成する方法(1/2 ページ)

» 2025年10月08日 07時00分 公開
[川口弘行ITmedia]

著者プロフィール:川口弘行(かわぐち・ひろゆき)

photo

川口弘行合同会社代表社員。芝浦工業大学大学院博士(後期)課程修了。博士(工学)。2009年高知県CIO補佐官に着任して以来、省庁、地方自治体のデジタル化に関わる。

2016年、佐賀県情報企画監として在任中に開発したファイル無害化システム「サニタイザー」が全国の自治体に採用され、任期満了後に事業化、約700団体で使用されている。

2023年、公共機関の調達事務を生成型AIで支援するサービス「プロキュアテック」を開始。公共機関の調達事務をデジタル、アナログの両輪でサポートしている。

現在は、全国のいくつかの自治体のCIO補佐官、アドバイザーとして活動中。総務省地域情報化アドバイザー。公式Webサイト:川口弘行合同会社、公式X:@kawaguchi_com


 こんにちは。「全国の自治体が抱える潜在的な課題を解決すべく、職員が自ら動けるような環境をデジタル技術で整備していく」ことを目指している川口弘行です。

 つい先日、米OpenAIが提供している動画生成サービス「Sora」の新バージョン(Sora2)が限定公開され、筆者の周囲でも話題となっています。現時点ではSora2の利用は有償ユーザーに対する招待制となっていますが、近いうちに一般利用者も使えるようになるでしょう。

 筆者も招待コードをもらうことができたので、早速、使ってみることにしました。

 OpenAIのサム・アルトマンCEOも「これまでのSoraがGPT1だとすると、今回のSora2はGPT3.5に相当するぐらいの進化」と発言していました。筆者個人もその品質には非常に期待していましたが、実際はその期待をはるかに超える性能でした。今回は従来のSoraとの違いや、Sora2を告知・広報などの業務に活用するヒントをご紹介します。

Sora2で作った動画CM。従来のSoraとの違いは?

Sora2で何が変わった? 驚きの動画精度

 Sora2では、前バージョンと比較していくつかの大きな改善点が見られました。

 まず、動画生成の精度と自然さが大幅に向上しています。

 OpenAIの言葉を借りれば「物理シミュレーションモデルの機能改善」なのですが、従来のSoraの場合、プロンプトを忠実に実行しようとするあまり、物体を変形させたり、現実を歪めたりしてしまうことがありました。

 例えば、SoraとSora2で同じプロンプトを入力してみた結果が次の通りです。

※英語であることや文章の長さは気にしないでください。ディテールを細かく設定する目的で指示しているだけなので、Sora2との機能を比較するだけならば、もっと簡単なプロンプトでもよいはずです。

プロンプト

This hyper-realistic black-and-white photograph captures a young Japanese female pianist. A waist-high mid-shot shows her playing an upright piano, but the angle, lighting, background, and clothing placement remain unchanged. The piano piece is epic, with a tempo of 89 BPM. She wears a well-tailored blazer, buttoned vest, scarf, and beret, all in monochrome tones. A dramatic ceiling spotlight creates strong contrast and deep shadows against the dark background. Her face has a symmetrical V-shape, and her expressive, bright eyes are framed by her natural black hair, carefully styled beneath her beret. Soft highlights and gentle shadow falloff create a joyful, confident expression. Shot with a digital full-frame camera and a 50mm lens, the vivid texture of the fabric and the smooth gradations of tone in her skin and clothing are highlighted. 4K high-resolution, studio shot, minimalist composition.

SoraとSora2の比較

 一目瞭然ですが、Soraではピアノと演奏者を同時に見せようとして、明らかにおかしな向きでピアノを弾いています。一方、Sora2では違和感なくピアノを弾いている様子が動画になっています。

プロンプト一つで「セリフ入り動画」がそのまま完成

 さらにSora2では、動画だけでなく音声が一緒に生成されるようになりました。効果音やBGMだけでなく、写っている人物が話す言葉も生成されます。日本語も対応しているようです。

 驚いたのは、この音声は動画上の唇の動きとも一致しています(リップシンクといいます)。他社の動画生成サービスでは、リップシンクができるものもあるのですが、あらかじめ音声を用意しておいて、動画生成の際に唇の動きをあわせるようにするものでした。

 一方、Sora2では最初からプロンプトで「◯◯というセリフを言って」と指示すると、そのとおりの音声付き動画が生成されるようになりました。

 また、私たちは日頃からテレビや動画配信サービスなどで、非常に洗練した動画表現を見ているので、あまり気付かないのかもしれませんが、細かなカット割り、キャプション文字表示、効果音など、視聴者に対してストレスを与えることなく、意識に届きやすいような編集を加えた動画も自動的に生成してくれます。

 例えば、次のようなプロンプトを与えてみます。

プロンプト

高校生向けのスキンケアクリームの広告を作って。「恋に部活に大忙し」な高校生がニキビに悩んでいるが、このスキンケアでバッチリ、みたいなもの。アップテンポな元気の出るBGMや出演者の元気なセリフも加えて。 今ならクリームを買うと素敵なチャームがプレゼント、というキャンペーンもやってます。

 これで生成された動画は以下から見ることができます。

 本当にプロンプトはこれだけです。筆者の感性では「つるんっ スキなし!」は絶対に出てきません。

       1|2 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

SaaS最新情報 by ITセレクトPR
あなたにおすすめの記事PR