OpenAI、Soraで「超知能の開発目指す」 どういう意味なのか?(2/2 ページ)
OpenAIが発表した動画生成AI「Sora」が話題だ。同社はSoraで「超知能の開発目指す」としているが、どういう意味なのか? Soraの画期性を交えて解説する。
Soraの価値は物理法則に則ったシミュレーター
Soraをショートムービーを簡単に作れるおもちゃのようなツールのように思っている人が多いかもしれない。事実Soraが一般公開されれば、ちょうど今多くの人が画像生成AIを使っていろいろな静止画を作って遊んでいるように、ショートムービーを作って遊ぶということが流行るかもしれない。
しかしSoraの本当の価値は、Soraが自ら物理法則を身につけたシミュレーターになったということにある。
これまでも物理法則に則ったシミュレーターはあった。自動運転車のAIの学習には物理法則に則ったコンピューターシミュレーターが使われたし、ロボットのAIの学習にはNVIDIAのシミュレーターが有名だ。
ただこれまでのシミュレーターは物理法則があらかじめプログラミングされていた。プログラマーに教え込まれていたわけだ。
ところがSoraは、大量のデータを学習することで物理法則を自ら学んでいった。教え込まなくても自ら学習するので、物体の細部の動きまで自然な形で表現できるのだ。
例えばOpenAIが紹介している例に、コーヒーカップの中で動き回る2隻の海賊船の動画がある。海賊船が動き回ることで起こるコーヒーカップの中での波の立ち方や茶色の泡などが自然な形で表現されている。事前に計算式を教え込むことができないようなこうした架空の物体の動きでさえも、自然な形で表現できるようになっているのだ。
OpenAIのリサーチペーパーによると、AIモデルを大きくして大量のデータで学習させたからこそ、物理法則を自然に学習できたのだという。
とはいうもののSoraの描写はまだ完璧ではない。例えば、コップがひっくり返って中の飲み物がこぼれ出る動画があるが、コップが割れたわけではないのに、割れたときのようなこぼれ方になっている。
*** 一部省略されたコンテンツがあります。PC版でご覧ください。 ***
OpenAI「Video generation models as world simulators」より引用
こうした不自然な描写は、今後モデルを大規模にすることで、かなり軽減されていくのだと思う。
では完璧な物理シミュレーターが完成すれば、何がいいのだろう。
例えば自動運転車やロボットの学習に利用できる。悪天候で視界が限定された状況で崖っぷちのカーブを自動運転車が回る際に、時速何キロで走ればいいのか。実際の自動車を何台も大破させなくても、シミュレーターの中で答えが出るだろう。
ガードマンロボットに空手を教えるのにも、シミュレーターの時間経過を数倍の速さにして何百体ものロボットで学びを共有するようにすれば、10年かかって身に付けることができるような黒帯の技が、わずか3週間で身に付けられるかもしれない。
Soraは生成AIによって生成された大量の合成データを学習データにしたので、急速に進化したという説が有力だ。Sora自体が合成データを大量に生成できるシミュレーターになるのであれば、さらにいろいろなAIの進化に貢献できるようになるだろう。
今のAIは、インターネット上や書籍の中にある人間が書いた文章をベースに世界の在り方を学習している。つまりAIはどこまでいっても人間が学んだ世界の在り方を超えることができないわけだ。しかしシミュレーターであればAI自らがいろいろな体験をすることで世界の在り方を直接学習することができる。人間に頼ることなく知恵を増やすことができる。つまり知能で人間を超えることができるわけだ。
人間の知っていることは何でも知っている汎用人工知能(AGI)は今後数年以内に実現するという意見が増えているが、完璧なシミュレーターができれば人間を超える超知能(ASI)さえ可能になる。
そうしたAIを開発するためのシミュレーターを作ることができる道筋が見えた。それが今回のSoraの最大の価値なのだと思う。
その証拠にSoraを紹介するOpenAIのリサーチレポートのタイトルは「世界シミュレーターとしての動画生成モデル(Video generation models as world simulators)」。
そしてレポートの最後は次の一文で締めくくられている。
「AIモデルの規模を大きくしていくことで、その能力がさらに拡充され、現実世界とデジタル世界、そしてその中で生きる人間や動物、物体をシミュレーションできる高度な技術の開発へつながっていくだろう。我々は、Soraがそうした技術への明るい道筋を示してくれたと信じている(We believe the capabilities Sora has today demonstrate that continued scaling of video models is a promising path towards the development of capable simulators of the physical and digital world, and the objects, animals and people that live within them)」
本記事はエクサウィザーズのAI新聞「OpenAIがSoraで目指す超知能への道」(2024年2月20日掲載)を、ITmedia ビジネスオンライン編集部で一部編集の上、転載したものです。
関連記事
- 収益が指数関数的に急上昇する「AIぐるぐるモデル」とは?
AI時代の価値創造の方法では、収益は逓増する。規模が大きくなればなるほど、指数関数的にもうかるようになる。その仕組みとは? - チャット型AIがマスメディアより影響力を持つ時代に
チャット型AIが、マスメディアやソーシャルメディアよりも、影響力を持つようになるのだと思う。 - NVIDIAが独り勝ち AI業界「2023年の勢力図」を整理する
AIは大きくなるほど性能が向上する傾向にある。この傾向が理由で、AIの巨大化が今もなお続いている。そしてその結果としてAI業界のいろいろなレイヤーで激しい競争が繰り広げられ、業界勢力図の流動的な状態が続いている。どのレイヤーにどのようなプレイヤーがいて、勢力図はどう変化していっているのか。 - ChatGPT、Bard、Poe……「AIアプリ」ランキング 業種別の便利アプリも解説
米シリコンバレーの著名ベンチャーキャピタル「Andreesen Horowitz」が「How are Consumers Using Generative AI(消費者はどのように生成AIを使っているのか)」というレポートを発表。アプリレイヤーの動きを解説している。
© エクサウィザーズ AI新聞