ITmedia NEWS > AI+ >
ニュース
» 2018年06月04日 06時00分 公開

これからのAIの話をしよう(言語編・後編):AIコピーライターの衝撃 広告代理店は今後どうなる? (3/4)

[松本健太郎,ITmedia]

―― でも、面白いのもありますね。「ノーベル文学賞が受賞 鋭い感性持とう」。文学という単語から「鋭い感性持とう」というフレーズが引っ張られたのでしょうか。ただ、ノーベル文学賞が主語になっているのはおかしいですし、今のレベルだったら仕事を奪われる直接的な脅威とまでは言えなさそうです。

狩野 過去10年分の見出しと記事を学習データにしています。過去の見出しを踏襲しつつ、今風にアレンジされたような結果になっているのではと思います。

―― 現状の人工知能がセミプロちょっと手前だったとして、一気にその壁を突き破るには何が必要ですか。山本さんがおっしゃるような「鋭い感性」(前回記事)を育み、知性や知識を蓄積するための多様なデータでしょうか。

狩野 そうではないと思います。学習だけで済ませようとするなら、ものすごい量のデータが必要になるでしょう。主語と述語の組み合わせ、それぞれの語彙数などを考慮すると数が膨大過ぎますね。文章特有の構造を理解して知恵を入れないといけなくて、必ずしもデータ量だけで解決できる問題ではないかと。

 もう1つ、AIが作ったおかしな見出しをみてみましょう。「北の井伊さんら描く 北の今川さん発表」。これは、2017年に放映されたNHKの大河ドラマ「おんな城主 直虎」の主人公・井伊直虎のことを表しているのですが、その舞台である浜松市北区の「北」を抽出してしまった。マスメディアでは北朝鮮のことを「北」と表現することがあるが、今回のケースはこれに当てはまらない。その違いを教えるのが難しい。

対談

正解がない領域は「人間が正解」

―― AI特有の「ぶっ飛びさ」がメリットになることも、デメリットになることもある。

狩野 人間特有の言語の特徴があって、機械的な生成だけを目的にしてしまうと、人間にあらざる言語になってしまいます。人間の仕組みを理解してからシステムにフィードバックしなければいけません。

 一般の方は、100万、1億という膨大なデータがあれば可能なのではと思うこともあるかもしれませんが、データ量だけで解決できない場合もたくさんあります。

―― 人工知能研究は、まず人間を知ることから始まるのでしょうか。

狩野 研究の目的によります。囲碁や将棋のAIは、決められたルール内で勝つことを目的とするのなら、必ずしも人間を模倣しなくてもいいはずです。この場合は大量のデータがあれば圧倒的に人工知能が強い。

 一方で、世の中には明確な正解がなく、人間が「正解」を決めている領域があります。(目の前にあるお茶のペットボトルを見ながら)これをどう認識するか。ペットボトル、お茶、玉露入りのお茶、どう表現してもいいので絶対の正解はないですよね。

 曖昧なものに対して正解を定義するのは人間です。(画像物体認識や音声認識などの)そうした領域は人が神様の世界といえます。

 そして、何が良いかという答えが無い領域があります。その最たるものが今回紹介したキャッチコピーなどの文生成です。正解が作れないから、そもそも学習が難しい。これはまだまだ、大学などで基礎研究として長い目で取り組むべき問題でしょう。

人とAI 人工知能は目的により本質が異なる

 対話も正解がない領域です。チャットbotと呼ばれていますが、これはまだまだ難しい。それを評価するために、人狼というゲームのAI研究(参考記事:人狼知能の研究)に取り組んでいます。(投票する、処刑するなど人狼ならではの)ルールがあるので案外いけるんです。自由会話なのが難しいですが。

―― 人狼面白いですよね。だまし合い、裏を読み、推理するのがスリリングです。言葉をそのまま受け止めるのではなくて、その裏にある意味や背景を考えている。

狩野 それができないと人間じゃない、ということでしょう。特に話し言葉はすごく曖昧な表現になるので、処理するのは非常に難しい。でも、その程度の曖昧さを内包した会話ができない人にキャッチコピーが作れるのかって話ですよね。

Copyright © ITmedia, Inc. All Rights Reserved.