――画像生成の場合、「学習」と「参照」の違いによって生成結果に差は出るのでしょうか?
椎橋CEO:例えば「自分の写真をジブリ風に変換する」処理では、AIは写真を参照し、事前に学習されたジブリの画風を適用しています。画風は抽象化された知識であり、AIは過去にジブリ作品からその特徴を抽出し、別の画像に応用できるようになっています。
このように、学習とは抽象的な特徴を知識として取り込み、再利用できる状態にすること。参照はその場で情報を読み取るにすぎません。
――では未知の画風には対応できないのでしょうか?
椎橋CEO:学習データに含まれていない新しい画風の場合、AIは参照された画風に似た過去の学習内容をもとに、最も近いパターンを当てはめようとします。ただし、既存のスタイルと全く異なる画風にはうまく対応できません。これは文章でも同じです。
――例えば「村上春樹風」はできても、「私の文体で」は難しいということですね
椎橋CEO:その通りです。ユーザーが文体のサンプルを提示しても、AIはそれを直接学習するわけではなく、既存の学習内容から類似パターンを探して適用します。そのため、個人特有の細かな文体までは再現できません。
要するに、学習は知識の抽象化と蓄積を伴い、参照はその都度の照会にすぎない。この違いが、AIの汎用性や対応力に大きく関わってきます。
「学習」と「推論」というAI技術の基本概念の違いを探ってきたが、この違いは単なる技術用語の問題ではなく、現在のAI技術の可能性と限界を理解する手掛かりにもなっている。
椎橋CEOが説明したように、今のAIは「推論」フェーズではパラメータが固定されている。ユーザーが入力した情報は参照されるだけで、AIの知識構造に組み込まれることはない。これがユーザーの直感と異なり、混乱を招く原因の一つだろう。
一方、昨今話題になっている「AIエージェント」では、一時的な記憶機能の重要性が高まっている。
AIエージェントとは、一度の命令内容を達成するために複数のアクションを自律的に組み立てて実行するようなAIのこと。業務の大幅な効率化が期待できるとして、主にコーディングなどの分野で注目を浴びている。
椎橋CEOによれば、現状では過去の会話履歴を外部に保存し参照する形で疑似的な記憶を実現しているが、本来は人間のように情報を「学習」しながら知識を更新できる仕組みが望ましいという。
「将来的には推論しながらも同時にパラメータを更新できるAIが理想ですが、何を覚えて何を忘れるかをコントロールするのは非常に難しい課題です」(椎橋CEO)
一般的に、AIは忘れることなく膨大な情報を保持できる点で人間より優れていると考えられがちだ。しかし今回の技術解説を通じて「忘れる」という機能の重要性も見えてきた。忘却と学習のバランスをどう取るかも、今後AIが乗り越える壁になるのかもしれない。
生成AIでGPUがいらなくなる? 業界を揺るがす「1ビットLLM」とは何か、識者に聞いた
孫正義×サム・アルトマン発表会の要点を分かりやすく解説します 孫氏が見せた“夢”を現実的に解釈
AI検索「Perplexity」に企業版、日本で提供へ Webの“リアタイ情報”と社内データを組み合わせて回答
NVIDIA製GPUの数十倍速い? 次々に出てくる「AI専用チップ」とは何者か 識者に聞く高速化の仕組み
Xの最新AI「Grok 3」爆速レビュー ChatGPTとの能力差や“ネットの話題把握力”をチェックCopyright © ITmedia, Inc. All Rights Reserved.