また、人間は一瞬一瞬をすぐに忘れてしまいますよね。すぐに忘れないと、脳の容量がすぐいっぱいになってしまうため、重要でないものは圧縮してしまうわけです。一方、強い感情を覚えた瞬間は忘れず、音声や映像などマルチモーダルな形で覚えています。例えば、3歳の子供が誕生日で喜んでいたとしたら、その記憶は残しておきたいと思いますね。このようなマルチモーダルなデータこそ、長期記憶なのです。
ポイントになるのが感情の強さのレベルで、これを指標化します。人のコミュニケーションというのは文字だけではなく、感情もあります。「あなたが好き」と「あなた好きかな?」では全く違う話になりますよね。そのため声のトーンや顔の表情などを重要で、指標化すればとても役に立つのです。
例えば、会話や対話、交渉で有効に活用できます。交渉を有利に進めるには、相手の感情を読まなければいけません。そうしないと失敗してしまいます。そういった感情のトリガーを持った長期記憶について、私は10年前に特許を申請したのです。これはすぐに役立ちそうですよね?
サム そうですね。私もAIは感情表現ができると思っています。チャットbotのようなメッセージではなく、例えば感情を理解するアバターや映像、それらは私たちを魅了すると思います。併せて、社会的なガードレールも必要になるでしょう。現状ではわれわれもそれを開発したいし、すごくエキサイティングに思います。そのうち、ジョニーがターミナルデバイスを作ってくれそうですよね。
(関連記事:孫正義×OpenAIアルトマン氏対談に一言だけ登場した謎の人物「ジョニー」とは ITギークなら知ってるあの人)
孫 もしこれが実現するなら、コールセンターやカスタマーサポートのように待ち時間もとても重要になります。瞬時に応答することが求められるでしょう。ここについてはどうですか?
サム 以前はそこを心配していたこともあったのですが、もしわれわれの製品の音声入力モードを使ってもらうと分かりますが、ほとんど本当の人間と喋っているのと変わりません。それぐらい返答・返信が早い。この問題も十分解決できると思います。
孫 すぐに返事がきますよね。AIモデル「o3-mini」なんかは本当に「わお!」という感じで。レイテンシでいうと、100mm/秒ぐらいですかね?
サム そのような感じですね。
孫 だから遅延はほとんどない。 人間とやりとりとしているのと同じような感じだと思います。AIモデルは米国でトレーニングされるので、日本で展開するなら「Stargate Japan」などの形で進んでいくと思いますが、日本でもリアルタイムにレスポンスしていくことには自信があると?
サム そうですね。使う人のより近いところで、遅延の少ないAIモデルを実行する必要がありますね。しかし特に思考の分野では、米国からでもAIモデルを実行させることはできるかもしれません。一部のユースケースでは、エッジAIとして用意する必要があるかとは思います。
孫 例えばセキュリティや安全保障、個人情報の問題などは、ローカルの方がいいということですね。
サム そうですね。AIモデルは世界中で展開をしていこうと思っています。
Copyright © ITmedia, Inc. All Rights Reserved.