OpenAI、Soraで「超知能の開発目指す」　どういう意味なのか？（2/2 ページ）

OpenAIが発表した動画生成AI「Sora」が話題だ。同社はSoraで「超知能の開発目指す」としているが、どういう意味なのか？　Soraの画期性を交えて解説する。

[湯川鶴章、エクサウィザーズ AI新聞編集長] PC用表示関連情報

LINE

Hatena

前のページへ | 　　　　　　

Soraの価値は物理法則に則ったシミュレーター

　Soraをショートムービーを簡単に作れるおもちゃのようなツールのように思っている人が多いかもしれない。事実Soraが一般公開されれば、ちょうど今多くの人が画像生成AIを使っていろいろな静止画を作って遊んでいるように、ショートムービーを作って遊ぶということが流行るかもしれない。

　しかしSoraの本当の価値は、Soraが自ら物理法則を身につけたシミュレーターになったということにある。

　これまでも物理法則に則ったシミュレーターはあった。自動運転車のAIの学習には物理法則に則ったコンピューターシミュレーターが使われたし、ロボットのAIの学習にはNVIDIAのシミュレーターが有名だ。

　ただこれまでのシミュレーターは物理法則があらかじめプログラミングされていた。プログラマーに教え込まれていたわけだ。

　ところがSoraは、大量のデータを学習することで物理法則を自ら学んでいった。教え込まなくても自ら学習するので、物体の細部の動きまで自然な形で表現できるのだ。

　例えばOpenAIが紹介している例に、コーヒーカップの中で動き回る2隻の海賊船の動画がある。海賊船が動き回ることで起こるコーヒーカップの中での波の立ち方や茶色の泡などが自然な形で表現されている。事前に計算式を教え込むことができないようなこうした架空の物体の動きでさえも、自然な形で表現できるようになっているのだ。

　OpenAIのリサーチペーパーによると、AIモデルを大きくして大量のデータで学習させたからこそ、物理法則を自然に学習できたのだという。

　とはいうもののSoraの描写はまだ完璧ではない。例えば、コップがひっくり返って中の飲み物がこぼれ出る動画があるが、コップが割れたわけではないのに、割れたときのようなこぼれ方になっている。こうした不自然な描写は、今後モデルを大規模にすることで、かなり軽減されていくのだと思う。

　では完璧な物理シミュレーターが完成すれば、何がいいのだろう。

　例えば自動運転車やロボットの学習に利用できる。悪天候で視界が限定された状況で崖っぷちのカーブを自動運転車が回る際に、時速何キロで走ればいいのか。実際の自動車を何台も大破させなくても、シミュレーターの中で答えが出るだろう。

　ガードマンロボットに空手を教えるのにも、シミュレーターの時間経過を数倍の速さにして何百体ものロボットで学びを共有するようにすれば、10年かかって身に付けることができるような黒帯の技が、わずか3週間で身に付けられるかもしれない。

　Soraは生成AIによって生成された大量の合成データを学習データにしたので、急速に進化したという説が有力だ。Sora自体が合成データを大量に生成できるシミュレーターになるのであれば、さらにいろいろなAIの進化に貢献できるようになるだろう。

　今のAIは、インターネット上や書籍の中にある人間が書いた文章をベースに世界の在り方を学習している。つまりAIはどこまでいっても人間が学んだ世界の在り方を超えることができないわけだ。しかしシミュレーターであればAI自らがいろいろな体験をすることで世界の在り方を直接学習することができる。人間に頼ることなく知恵を増やすことができる。つまり知能で人間を超えることができるわけだ。

　人間の知っていることは何でも知っている汎用人工知能（AGI）は今後数年以内に実現するという意見が増えているが、完璧なシミュレーターができれば人間を超える超知能（ASI）さえ可能になる。

　そうしたAIを開発するためのシミュレーターを作ることができる道筋が見えた。それが今回のSoraの最大の価値なのだと思う。

　その証拠にSoraを紹介するOpenAIのリサーチレポートのタイトルは「世界シミュレーターとしての動画生成モデル（Video generation models as world simulators）」。

　そしてレポートの最後は次の一文で締めくくられている。

　「AIモデルの規模を大きくしていくことで、その能力がさらに拡充され、現実世界とデジタル世界、そしてその中で生きる人間や動物、物体をシミュレーションできる高度な技術の開発へつながっていくだろう。我々は、Soraがそうした技術への明るい道筋を示してくれたと信じている（We believe the capabilities Sora has today demonstrate that continued scaling of video models is a promising path towards the development of capable simulators of the physical and digital world, and the objects, animals and people that live within them）」

本記事はエクサウィザーズのAI新聞「OpenAIがSoraで目指す超知能への道」（2024年2月20日掲載）を、ITmedia ビジネスオンライン編集部で一部編集の上、転載したものです。

著者プロフィール

湯川鶴章

AIスタートアップのエクサウィザーズ AI新聞編集長。米カリフォルニア州立大学サンフランシスコ校経済学部卒業。サンフランシスコの地元紙記者を経て、時事通信社米国法人に入社。シリコンバレーの黎明期から米国のハイテク産業を中心に取材を続ける。通算20年間の米国生活を終え2000年5月に帰国。時事通信編集委員を経て2010年独立。17年12月から現職。主な著書に『人工知能、ロボット、人の心。』（15年）、『次世代マーケティングプラットフォーム』（07年）、『ネットは新聞を殺すのか』（03年）などがある。

OpenAI、Soraで「超知能の開発目指す」 どういう意味なのか？（2/2 ページ）

Soraの価値は物理法則に則ったシミュレーター

著者プロフィール

関連記事

OpenAI、Soraで「超知能の開発目指す」　どういう意味なのか？（2/2 ページ）