米Meta(旧Facebook)は2月23日(現地時間)、「Building for the metaverse with AI」(AIによるメタバース構築)と題するオンラインプレゼンテーションを公開し、メタバース構築のために取り組んでいる複数のAIプロジェクトについて説明した。
マーク・ザッカーバーグCEOは、メタバース構築にはハードウェアからソフトウェアまで、あらゆる範囲で進歩が必要だが、鍵になるのはAIだと主張した。ユーザーが仮想世界と物理世界の間をスムースに移動し、仮想世界をリアルに感じるためには、ユーザーとAIの間の「より豊かで深いコミュニケーションが必要」だと同氏は語った。
そうしたコミュニケーションを可能にするためのエンドツーエンドのニューラルモデル「Project CAIRaoke」を発表した。公開されたYouTube動画を見ると、音声で何でも相談できる会話エージェントというかAIアシスタントのようなもののようだ。
「Builder Bot」は、音声で世界を構築するためのbot。デモ動画では、アバターになったザッカーバーグ氏が「海岸に行こう」と言うと景色が海岸に変わり、「雲を足そう」「あそこに島を作ろう」などと言うことで環境を構築していく様子が紹介されている。
こうしたサービスに必要な技術の1つとしてザッカーバーグ氏は「真のマルチモーダルAI」を挙げた。マルチモーダルAIとは、大まかには、音声や画像、動画など、多様な種類の情報を利用して総合的な判断を行うAI。
MetaではマルチモーダルAI開発のアプローチとしてself-supervised learning(自己教師あり学習)を採用した。
メタバースでは世界中の人々が使う言葉や文化を超えて交流できなければならず、そのためにたとえオンラインでほとんど使われていない国語を話す人々も疎外してはならないとザッカーバーグ氏。そのための中間ステップとして、現在のように英語を介さずに数百の言語感で直接翻訳できるオープンソースのAIモデルを構築した。
1つは、学習データが少なくてもすべての言語を学習できる「No Language Left Behind」、もう1つはリアルタイム音声翻訳システム「Universal Speech Translator」だ。
これらの取り組みについて、具体的な実現時期などについては言及されていない。
ザッカーバーグ氏は「ほとんどのIT企業はテクノロジーと対話するための技術開発に重点を置いているが、われわれは人と人とが交流するためのテクノロジーを構築している」とアピール。安全で最高レベルのプライバシーを提供するAIテクノロジーを構築していくと語った。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR