「ChatGPT、画像をジブリ風にして」──この瞬間、AIは写真を学習してる? 専門家に聞いた(2/2 ページ)
ChatGPTなどの生成AIに自分の写真をアップロードし、「ジブリ風に変換してほしい」とリクエストする使い方がSNSで広がっている。このような行為を「写真をAIに学習させている」と表現する人もいる。しかし、このプロセス自体は技術的には“参照”に近い──というのが専門家の見方だ。
画像生成における学習と参照の実際
――画像生成の場合、「学習」と「参照」の違いによって生成結果に差は出るのでしょうか?
椎橋CEO:例えば「自分の写真をジブリ風に変換する」処理では、AIは写真を参照し、事前に学習されたジブリの画風を適用しています。画風は抽象化された知識であり、AIは過去にジブリ作品からその特徴を抽出し、別の画像に応用できるようになっています。
このように、学習とは抽象的な特徴を知識として取り込み、再利用できる状態にすること。参照はその場で情報を読み取るにすぎません。
――では未知の画風には対応できないのでしょうか?
椎橋CEO:学習データに含まれていない新しい画風の場合、AIは参照された画風に似た過去の学習内容をもとに、最も近いパターンを当てはめようとします。ただし、既存のスタイルと全く異なる画風にはうまく対応できません。これは文章でも同じです。
――例えば「村上春樹風」はできても、「私の文体で」は難しいということですね
椎橋CEO:その通りです。ユーザーが文体のサンプルを提示しても、AIはそれを直接学習するわけではなく、既存の学習内容から類似パターンを探して適用します。そのため、個人特有の細かな文体までは再現できません。
要するに、学習は知識の抽象化と蓄積を伴い、参照はその都度の照会にすぎない。この違いが、AIの汎用性や対応力に大きく関わってきます。
「学習」と「推論」の違いから見えるAIの今後
「学習」と「推論」というAI技術の基本概念の違いを探ってきたが、この違いは単なる技術用語の問題ではなく、現在のAI技術の可能性と限界を理解する手掛かりにもなっている。
椎橋CEOが説明したように、今のAIは「推論」フェーズではパラメータが固定されている。ユーザーが入力した情報は参照されるだけで、AIの知識構造に組み込まれることはない。これがユーザーの直感と異なり、混乱を招く原因の一つだろう。
一方、昨今話題になっている「AIエージェント」では、一時的な記憶機能の重要性が高まっている。
AIエージェントとは、一度の命令内容を達成するために複数のアクションを自律的に組み立てて実行するようなAIのこと。業務の大幅な効率化が期待できるとして、主にコーディングなどの分野で注目を浴びている。
椎橋CEOによれば、現状では過去の会話履歴を外部に保存し参照する形で疑似的な記憶を実現しているが、本来は人間のように情報を「学習」しながら知識を更新できる仕組みが望ましいという。
「将来的には推論しながらも同時にパラメータを更新できるAIが理想ですが、何を覚えて何を忘れるかをコントロールするのは非常に難しい課題です」(椎橋CEO)
一般的に、AIは忘れることなく膨大な情報を保持できる点で人間より優れていると考えられがちだ。しかし今回の技術解説を通じて「忘れる」という機能の重要性も見えてきた。忘却と学習のバランスをどう取るかも、今後AIが乗り越える壁になるのかもしれない。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
生成AIでGPUがいらなくなる? 業界を揺るがす「1ビットLLM」とは何か、識者に聞いた
米Microsoftの研究チームが発表した「BitNet」、通称「1bit LLM」と呼ばれる論文が波紋を呼んでいる。これまで必須だと思われていたGPUが不要で、CPUでもLLMが動作することを示唆している。そもそも“1bit”とは何が1bitなのか、どうして1bitになるとGPUが不要になるのか、AIソリューションの開発・提供を行うLaboro.AIの椎橋徹夫CEOに聞いた。
孫正義×サム・アルトマン発表会の要点を分かりやすく解説します 孫氏が見せた“夢”を現実的に解釈
ソフトバンクの孫正義氏とOpenAIのサム・アルトマン氏が東京でのイベントで登壇。英ArmのCEOの姿も。イベントの要点を、現地参加した編集長が解説する。
AI検索「Perplexity」に企業版、日本で提供へ Webの“リアタイ情報”と社内データを組み合わせて回答
米Perplexityは、企業向けAI検索サービス「Enterprise Pro」を日本で提供を始めると発表した。Web上のリアルタイム情報と企業内のデータを組み合わせたAI検索に対応するという。
NVIDIA製GPUの数十倍速い? 次々に出てくる「AI専用チップ」とは何者か 識者に聞く高速化の仕組み
スタートアップ企業Etchedが発表した「Sohu」が、AI業界に新たな波紋を投げかけている。トランスフォーマーモデルに特化したこのAI専用チップは、NVIDIAのH100 GPUと比較して20倍高速かつ低コストで動作すると主張しているからだ。
Xの最新AI「Grok 3」爆速レビュー ChatGPTとの能力差や“ネットの話題把握力”をチェック
イーロン・マスク氏率いる米AI企業xAIが2月18日に公開した、チャットAIアシスタント「Grok」の最新モデル「Grok 3」。有料プラン契約者向けに順次提供が始まっており、記者も一部機能のβ版を手元で使える状況になったので、軽く触ってみた感想を伝える。