メディア
ITmedia AI+ >

「ChatGPT、画像をジブリ風にして」──この瞬間、AIは写真を学習してる? 専門家に聞いた(2/2 ページ)

» 2025年04月17日 08時00分 公開
[斎藤健二ITmedia]
前のページへ 1|2       

画像生成における学習と参照の実際

――画像生成の場合、「学習」と「参照」の違いによって生成結果に差は出るのでしょうか?

椎橋CEO:例えば「自分の写真をジブリ風に変換する」処理では、AIは写真を参照し、事前に学習されたジブリの画風を適用しています。画風は抽象化された知識であり、AIは過去にジブリ作品からその特徴を抽出し、別の画像に応用できるようになっています。

 このように、学習とは抽象的な特徴を知識として取り込み、再利用できる状態にすること。参照はその場で情報を読み取るにすぎません。

――では未知の画風には対応できないのでしょうか?

椎橋CEO:学習データに含まれていない新しい画風の場合、AIは参照された画風に似た過去の学習内容をもとに、最も近いパターンを当てはめようとします。ただし、既存のスタイルと全く異なる画風にはうまく対応できません。これは文章でも同じです。

――例えば「村上春樹風」はできても、「私の文体で」は難しいということですね

椎橋CEO:その通りです。ユーザーが文体のサンプルを提示しても、AIはそれを直接学習するわけではなく、既存の学習内容から類似パターンを探して適用します。そのため、個人特有の細かな文体までは再現できません。

 要するに、学習は知識の抽象化と蓄積を伴い、参照はその都度の照会にすぎない。この違いが、AIの汎用性や対応力に大きく関わってきます。

「学習」と「推論」の違いから見えるAIの今後

 「学習」と「推論」というAI技術の基本概念の違いを探ってきたが、この違いは単なる技術用語の問題ではなく、現在のAI技術の可能性と限界を理解する手掛かりにもなっている。

 椎橋CEOが説明したように、今のAIは「推論」フェーズではパラメータが固定されている。ユーザーが入力した情報は参照されるだけで、AIの知識構造に組み込まれることはない。これがユーザーの直感と異なり、混乱を招く原因の一つだろう。

 一方、昨今話題になっている「AIエージェント」では、一時的な記憶機能の重要性が高まっている。

 AIエージェントとは、一度の命令内容を達成するために複数のアクションを自律的に組み立てて実行するようなAIのこと。業務の大幅な効率化が期待できるとして、主にコーディングなどの分野で注目を浴びている。

 椎橋CEOによれば、現状では過去の会話履歴を外部に保存し参照する形で疑似的な記憶を実現しているが、本来は人間のように情報を「学習」しながら知識を更新できる仕組みが望ましいという。

 「将来的には推論しながらも同時にパラメータを更新できるAIが理想ですが、何を覚えて何を忘れるかをコントロールするのは非常に難しい課題です」(椎橋CEO)

 一般的に、AIは忘れることなく膨大な情報を保持できる点で人間より優れていると考えられがちだ。しかし今回の技術解説を通じて「忘れる」という機能の重要性も見えてきた。忘却と学習のバランスをどう取るかも、今後AIが乗り越える壁になるのかもしれない。

前のページへ 1|2       

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ