ChatGPTなどの生成AIに自分の写真をアップロードし、「ジブリ風に変換してほしい」とリクエストする使い方がSNSで広がっている。このような行為を「写真をAIに学習させている」と表現する人もいる。しかし、このプロセス自体は技術的には“参照”に近い──というのが専門家の見方だ。
AI研究企業Laboro.aiの椎橋徹夫CEOによれば、こうした誤解の背景には「AIが新しいデータをいつ、どのように学習するのか」が曖昧に理解されている現状があるという。「学習」や参照、そしてAIを巡る議論で頻出する「推論」という言葉は、一体それぞれどう違うのか。
──AI技術における「学習」について、詳しく教えてください
椎橋CEO:機械学習において「学習」と「推論」という言葉は長く使われてきましたが、改めてその本質を問い直す良い機会だと思います。
例えば、ジブリ風に自分の写真を変換するAIサービスでは、「AIに(自分の)画像を覚えさせた」と感じて「学習」という言葉が使われがちです。しかし実際には、AIは画像を内部に取り込んでいるわけではなく、一時的に情報を読み取って変換に使っているだけです。これは“参照”であり「学習」ではありません。
整理すると、学習とは、AIの内部パラメータ(ニューラルネットの重み)が更新され、新しい情報がモデルの中に知識として取り込まれるプロセスです。これは事前に大量のデータを使って行われ、モデルの土台をつくる段階になります。
一方で、参照はユーザーが入力したプロンプト(指示や質問、画像など)を、その場限りで一時的に読み取る行為です。プロンプトに含まれる情報は、モデル内部に記憶されたり蓄積されたりはせず、出力を生成するために一時的に使われるだけです。
そして推論は、こうしたプロンプトに対して、すでに学習済みの知識をもとに応答を生成するプロセスです。AIが応答する際、プロンプトを読み取り、内部の知識を引き出して結果を出す──それが推論です。
つまり「プロンプト=一時的な参照情報」「学習=事前に知識として取り込まれた情報」「推論=その両方を使って答えを出す処理」と理解すると、三者の違いがより明確になるでしょう。
人間に置き換えれば、「学習」は経験を記憶として蓄積することであり、“参照”は外部のメモを読み返すような行為です。ChatGPTもまた、モデル内に記憶を持っているわけではなく、外部に保存された情報を高速に参照しているに過ぎません。
つまり、ジブリ風変換のケースでは、AIはすでに学習済みの「ジブリ画風」を用い、ユーザーの画像を一時的に参照してマッチング処理を行っているのです。ユーザーの画像が学習されるわけではありません。
「学習」と「参照」は、技術的にも言語的にも異なる行為です。学習は「取り込む」こと、参照は「その場で見る」こと。混同しやすいこの違いを、改めて明確にしておく必要があります。
──AIが「記憶しているように見える」のはなぜですか? 人間の記憶とどこが違うのでしょうか
椎橋CEO:この違いは、AIが情報を記憶として保持できるかどうかに関わる根本的な構造の差であり、学習と参照を分ける最も重要なポイントです。
人間が何かを覚えるとき、脳内のシナプス結合の重みが変化し、それが記憶となります。生物は日々こうした重みの更新を通じて知識を蓄積しています。ところが、ChatGPTのようなAIはこのような意味での記憶を持ちません。
ChatGPTは、一見すると以前の会話を覚えているように見えますが、実際にはモデルの中に記憶があるわけではなく、外部に保存された会話履歴を毎回高速で参照しているにすぎません。人間でいえば、短期記憶に障害がある人がメモを見返すことで記憶を補っている状態に似ています。
ただし、ChatGPTの情報処理速度は極めて高く、膨大な履歴を瞬時に読み取れるため、ユーザーには「記憶している」ように映ります。この「参照」と「記憶」の違いを理解することが、AIの構造や限界を正しく捉える上で非常に重要です。
なお、ChatGPTなどのサービスの中には、投稿された情報をAIの改善に使う可能性があると明示しているものもある。その場合、アップロードした瞬間ではなくとも、「学習」に使われる可能性はある点に注意は必要だろう。
Copyright © ITmedia, Inc. All Rights Reserved.