生成AIがシュールな笑いを獲得する日は来るのか編集部コラム

言語生成AIの開発競争が続く中、イーロン・マスク氏率いるxAIが「ユーモアの分かるAI」を発表したとの報道を知り、人間の対話、社会の在り方などをあらためて考えてみました。

» 2023年11月10日 08時00分 公開
[荒 民雄ITmedia]

この記事は会員限定です。会員登録すると全てご覧いただけます。

 TeslaやSpaceXなどの設立者として知られるイーロン・マスク氏が立ち上げたAI(人工知能)スタートアップ企業xAIが独自の言語生成AI「Grok」を発表しました。330億パラメータを持つ生成AIモデル「Grok-1」が使われているとされています。xAIのWebサイトでは「ダグラス・アダムスのSF小説『銀河ヒッチハイク・ガイド』(the Hitchhiker’s Guide to the Galaxy)をモデルにしている」と紹介されています。

Grokを紹介するxAIのWebサイト(出典:xAIのWebサイト、本稿執筆時点)

 ユーモアに富んでおり、他のAIシステムが拒否するような難しい問題にも回答する、ということですが、『銀河ヒッチハイク・ガイド』に登場するスーパーコンピュータは、「人生、宇宙、全ての答えは?」という問いに「42」と「わけの分からない結果」を返すものでした。長い間計算し続けた世界最高峰のコンピューターが導き出した答えが、なんとも凡庸な数字だったことが、ばかばかし過ぎて「面白い」というものです。「普通なら」科学の粋を結集したコンピューターならさぞかしもっともらしい回答をするだろうと想像していたら、まったく違う結果だったというわけです。Googleの検索エンジンでもこれを面白がり、検索窓でこの問いを「ググる」と「42」と応えるようになっています。

シュールな笑いはグローバルなサービスに実装可能なのか

 Grokの特徴として「他のAIシステムが回答を拒否するような内容に対しても応える」「ユーモアがある」と紹介されています。他のAIシステムが回答を拒否するような問い合わせというのはおそらく、暴力的、差別的、反社会的な質問などを想定しているのでしょう。実際にこうした社会に良い影響を与えないと思われる問には「答えられません」と返答するようにプログラムされた「生真面目なAI」が現在の主流です。

grokを含む主要な言語生成AIのベンチマーク結果。Grokは4ヵ月書けて初期モデルを構築し、その後、2ヵ月ほどのトレーニングを経てGPT-3を上回るパフォーマンスになったとしている(出典:xAIのWebサイト)

 対話型AIにおいて、ちょっとした冗談を投げかけたときに生真面目に「答えられません」と返されると、たしかに面白みはありません。Grokは「もっとよい質問の仕方」をサジェストすることも視野に入れているそうですから、くすっと笑ってしまうような皮肉を交えた提案をしてくるかもしれません。頭の回転が速くユーモアのセンスがある人と会話が楽しむような対話を目指しているのでしょうか。ひどく下品な問い合わせも拒絶せずに品の良いジョークを返す、といった形で対話を成立させることを重視している可能性もあります。「X」におけるコミュニケーションを重視するならばそういう方向性もあり得なくはないでしょう。

 ただし、この「ユーモア」は文化背景に大きく依存するものです。

 「笑い」に関する研究は古くからあり、現在も哲学や脳神経科学、心理学などの分野で研究が続いているようでが、多くは、ある社会において常識とされる共通認識を前提に、その予測を逸脱した思いがけない状況に直面したときなどに起こるものと考えられているようです。

シュール系コントとスタンドアップコメディーの「空気」を読めるか

 日本では漫才などの「お笑い」が盛んです。シュール系のコントも人気ですが、「シュールなコント」といったときに、そもそも共通認識として「何がシュールか」が、ある程度分からなければ成立しないのがお笑いの難しいところです。米国などではスタンドアップコメディーが人気ですが、日本語の文化圏にいるものからすると、人気コメディアンのトーク内容は「どぎつい」「差別的」と感じることも少なくありません。逆に日本の漫才やコントが前提とする共通認識にも少なからず無意識の差別的、暴力的表現が含まれていることもあります。逆に、漫才における「ツッコミ」の「ドツキ」は、われわれならば笑って済ませられますが、他の文化圏では非難される可能性が高いものです。

 AIにユーモアのセンスを持たせるとなると、この共通認識のズレを使ったユーモアをどこまできめ細かく実装できるかが鍵を握ることになるでしょう。xAIは「あらゆる背景や政治的見解を持つ人々にとって役立つ AI ツールを設計することが重要」であり「法律に従うこと」を重視すると表明しています。

 今のところ、xAIはGrokを一般公開する計画を示しておらず、一部のX(Twitter)ユーザーに開放する方針です(国や地域の制限はないようです)。xAIはGrokについて「ユーモアのセンスがない人は使わない方がいい」としていますが「ユーモアのセンス」ほど定量的に評価しにくいものはありません。

 ユーモアがさらに難しいのは、一度確定した「面白さ」が時々刻々と変化する点にもあります。例えば、20年前のバラエティ番組をいま見てみると当時大笑いをして見ていた私たちであっても、ときに不快な気分になることがあるように、「時代の空気」の中でしか笑いは感じられません。xAIはXにおけるリアルタイムの情報もGrokの学習に取り入れる方針のようですから、ユーザー属性ごとの「空気」を取得する方法を発見する可能性もあります。

 最近の生成AIは言語の違いによるコミュニケーションギャップを簡単に超えられるようになってきました。各国、地域の「知識」に基づく回答を出力できますが、AIは文化や時代の空気をどこまで回収できるでしょうか。ジョークを交えたウソか本当か分からないない話は魅力的ですし、親しみを感じることもあるでしょうが、人間が相互の関係性を加味して感じる「しゃれにならない」という感情をAIはどう分析、評価するのでしょうか。

 ユーモアのあるAIがこの問いにどう答えるのかは気になるところです。微妙に空気を読まないズレた回答が出たら、それはそれで面白いのでアリかもしれません。

Copyright © ITmedia, Inc. All Rights Reserved.