カメラの原点とされている「カメラ オブスキュラ」は、ラテン語で「暗い部屋」という意味である。文字通り暗い部屋の壁の1点にピンホールを開けると、反対側に風景が映る。10世紀ぐらいまでは太陽や建物を安全に観察するものであったが、16世紀にレオナルド・ダ・ビンチが登場すると、投影された像をなぞって絵画を制作する道具へと進化した。もちろん手書きなので、そこに描かれる線は、数多くの実線の中から描き手によって取捨選択されたものであり、「見たまま」ではない。
それが1839年、フランスのルイ・ジャック・マンデ・ダゲールが、銀メッキした銅板に光を感光させる方法を発明したことから、あるがままの状態が固定できるという、記録システムとしての写真が歩みを始める。
写真がそこからアートの領域に入るまで、50年ぐらいかかっている。最初は感光版を利用した多重合成であったり、写真に加筆することで絵画のような画面を構成する「ピクトリアリズム」といった手法が流行した。
だがこのようなスタイルは、「写真の本質を見失った」として批判されるようになる。20世紀初頭には、ドイツを中心に写真の客観性を重視した「新即物主義運動」が起こり、またバウハウスを中心にフォトコラージュやモンタージュという手法が発展した。
映ったものは「真実」かもしれないが、それを切り取って配置することで、別の意味を持たせるようになった。シュル・レアリズムの巨人であるサルバドール・ダリの作品にも、作品中に写真を張り込んだものがいくつかある。
このような歴史を振り返ると、写真がアート化するほど、「映ったものの真実性」はあまり重要ではないということが見えてくる。近年もInstagram躍進の原動力となった「映え写真」は、フィルターなどによって加工されることで、アート化された。美顔フィルターで顔のディテールを消し、色味やコントラストをいじり倒した写真は、「真実」ではない。だが、写真として認識される。
ここで冒頭の問いに戻る。「消しゴムマジック」は受け入れられたのに、「超解像ズームPro」にはなぜ抵抗を感じるのか。
これは「消しゴムマジック」の用途が、より完全な状態に仕上げるために使用されることが多い点にある。この機能は、不要なものを消すことがメインの用途である。つまり、消す前は、不完全なのだ。
例えば、いい風景なのに観光客が映り込んでいて邪魔、といった写真から観光客を消すとする。消した跡には、AIが考えた想像の風景のパーツが埋め込まれる。
観光客が消えたことで、風景はより理想的なものになる。だが実際には、その時間に無人の風景を撮ることは物理的に不可能なのであり、事実としての風景とは違う。
それでも多くの人が、観光客を消したあとの写真の方を好むだろう。人は無意識のうちに、ノイズ(不要なもの)のない理想的な状態を想像する。想像するということは、脳内ではノイズがない状態を作り上げているわけだ。
そしてそれに近い状態のものが提供されるのであれば、当然そちらのほうが好まれる。真実であるかどうかは問われない。つまり、アートとして受け入れていると考えられる。
一方「超解像ズームPro」では、何が起こっているのか。光学5倍をデジタル的に20倍に拡大した画像は、ピクセルがそのまま拡大されるわけではない。ピクセル間を補完するデジタルアルゴリズムが働くため、1つ1つのピクセルが分解され、再構築される。その時に発生する「崩れ」が、ノイズであったり、ぼやけて見える原因である。
「超解像ズームPro」は、そのぼやけた画像から何が映っているか、あるいは何が映っているべきかを想定し、そのイメージへ置き換える。置き換えは、すでに学習したイメージが参照される。
今のところ、このAIによるイメージの置き換えとして苦手とされるものが、文字情報だ。文字は特定の形状が一定の意味を持つという記号である。ラテン文字を源泉とする表音文字言語圏では、使われる記号がかなり少ないため、想像するにしても当たりが出やすい。
一方漢字に代表される表意文字言語圏では、似たような形の文字がゴマンとあり、想像したとしても当たりにくい。このため、「超解像ズームPro」を使って補正した画像には、多くの漢字の誤りが認められる。
例えば以下の画像は、遠くにいるライフセーバーを「超解像ズームPro」で補正したものである。下に置いてある看板の文字は、なんとなくそれっぽい文字にはなっているが、意味をなさない。
物理的に近づいて撮影し、拡大を行わずに撮影した画像が以下である。AIが補完した文字と、全然違う。
「超解像ズームPro」の問題は、それが望遠の補正であるという点にある。望遠の魅力、あるいは意味といってもいいと思うが、それは序段にも述べたように、「見えないものが見える」ことである。そこには、真実を探求するという目的が垣間見える。
この欲求に対して「超解像ズームPro」は、真実を提供できない。そこには、「アートだから」という文脈が入り込む余地がない。「いや実際どうなの?」が解決されていないなら、写真の基本的な役割を果たしていないだろう、という苛立ちが発生する。
特に文字情報は、曖昧さが許されない。正しくなければ意味がない図形であるがゆえに、特に目立ちやすい。では、この文字情報を「消しゴムマジック」で消してしまったらどうなるのか。実際に消してみたのが次の画像である。
なんとなく、これはこれでアリのような気がする。おそらく、「不確かな情報」というノイズが取り除かれたことで、理想的な状態に近づいたからだろう。つまり我々の脳が、ここからはアートの領域に入ったよと言っている。
多くの人が「超解像ズームPro」に抱いている不安は、正しくないことがはっきりわかる情報が付加されるからだ。つまり、何者かが自分を「騙そうとしている」と感じるからである。
だが、正誤がはっきりしないなら、騙されているかどうかは重要ではなくなる。ただその境目は、人によって変動することがある。画像の中で置き換えられた部分が、一般とは違った知識を持つ人によっては「そこ大事だろう」というポイントかもしれないのだ。例えば上記の写真において、「旗色の意味を示す表示を行うことは法令で定められている」という事実があれば(本当にそうなのかは知らない)、看板を消してしまうことは見過ごせない誤りだ。
人間は、時には探求的であったり、時には芸術的であったりといった様々なマインドセットを瞬時に切り替えながら生きている。写真が事実のみを写すものではないということは、すでに我々はアートの文脈で受け入れている。その一方で、真実の探求という目的であるはずの高倍率ズームに、見ただけではわからないフィクションが混入するという事態が、我々を混乱させる。つまり望遠+「超解像ズームPro」の実装形態は、人間のマインドとして、方向性が合わないのである。
例えばこの機能が、低解像度の画像を拡大した際の荒れやぼやけを解消するというものであれば、まだ受け入れやすい。実際AIを使ってHDから4Kへのアップコンバートをやるという方法論は、AWSなどのクラウド事業者が実用化しようとしている。
まだこの機能を使って騙されたという事実は発生していないが、少なくともAIを使った画像なのかどうかは、作成した人間しかわからないのが困るところだ。
だがそこはよくしたところで、Pixel 10シリーズからは、撮影した写真およびAIで処理した画像に対して、コンテンツクレデンシャル情報が付加されるようになった。コンテンツクレデンシャルに関しては、以前も記事にしているので、詳しくはそちらを参照してほしい。
平たく言えば、写真の出自をメタデータに埋め込むことで、オリジナルからどのような変更を加えたのかの履歴がわかるという仕組みだ。今回作成した画像を、コンテンツクレデンシャルの検査サイトで調べてみると、「超解像ズームPro」で処理した画像には、「このコンテンツは部分的にAIで編集されています。」という表記がある。
ああ、こいつは信用できないな、とわかる。コンテンツクレデンシャルに対応しない画像編集ツールを使って保存し直すと、情報が取れてしまうという弱点はあるが、単純な撮って出しの場合は一発でわかる。
いやそれじゃダメじゃないかと思われるかもしれないが、そもそも現代の画像合成技術を持った人間が本気になって画像を作ったら、「常識」で判断する以外はもやは技術的には誰も見分けられないところまで来ている。「技術的にわかること」にこだわってもキリがない。
常識で「そんなことあるわけないだろ」が判断できる能力を、情報リテラシーという。これまでは詐欺サイトなどに対して有効とされてきた情報リテラシーだが、今後は写真に対しても、この考え方を導入しなければ仕方がないだろう。
Google、「Pixel 10」シリーズ発表──新SoC「Tensor G5」でAI機能が大幅進化、初のQi2対応
Google、「Pixel 10 Pro Fold」発表──薄さより“10年使える堅牢性”を重視
ほぼすべての「Googleフォト」ユーザー、「消しゴムマジック」などのAI編集が可能に
Googleの新AI検索機能「かこって検索」、Pixel 8/8 Proでも利用可能に
Google、Pixel端末で「顔写真加工」を初期設定無効に メンタルへの配慮でCopyright © ITmedia, Inc. All Rights Reserved.
Special
PR