撮影した写真の“外側”を生成AIが描く「Photo Expansion」は、その代表例といえる。元になる写真をベースに、生成AIが写真を拡張する。処理は、オンデバイスで10秒強。写真をズームアウトするだけで簡単に周囲を生成できるUI(ユーザーインタフェース)も、非常に直感的。ユーザー側が生成AIであることを意識せず、スマホの画像編集アプリを扱う感覚で操作できる。
プロンプトの入力といった、生成AIを継続利用する上でのハードルを取り払い、画像編集を拡張するという見せ方が面白い。Googleの「Pixel 8/8 Pro」に採用された「編集マジック」にアプローチは近いが、生成AIをスマホの一般的な機能に溶け込ませていた。Snapdragon 8 Gen 2までのプロセッサでも同様のことはできたが、クラウドの処理能力を使ったり、より時間がかかったりしていた。この処理が10秒程度で完結するのは、Snapdragon 8 Gen 3の処理能力があってこそといえる。
実際、Qualcommは画像生成AIのStable DiffusionをAndroidスマホに最適化し、2月にスペイン・バルセロナで開催されたMWC Barcelona 2023でメディアなどにその様子を披露していた。ただし、当時のプロセッサはSnapdragon 8 Gen 2。画像1枚を生成するのに、十数秒ほどかかり、ゆっくりとモザイクのようなノイズから画像が現れた。これに対し、Snapdragon 8 Gen 3では、画像の生成にかかる時間が1秒未満に短縮されている。NPUの処理能力は2倍だが、アプリケーションレイヤーでの差は10倍にも上る。
チャットbotも、生成AIを生かした分かりやすい実用例だ。AndroidにはGoogleアシスタントが搭載されているが、あの機能は情報をクラウドから取得している。一方で、オンデバイスAIは、その名の通り、端末上で処理が完結する。先に述べた通り、Snapdragon 8 Gen 3はMetaの大規模言語モデル(LLM)のLlama 2を動作させることが可能。ネットにユーザーが話した声や内容がアップロードされないため、プライバシーが守られるのと同時に、処理も速くなる。
コンピュテーショナルフォトグラフィーとして撮影にもAIの処理が取り込まれているが、Snapdragon 8 Gen 3ほど性能が上がれば、動画にもこれを適用しやすくなる。デモを行った「Vlogger's View」は、インカメラで撮った自分の動画をリアルタイムで切り抜きつつ、アウトカメラの背景に合成する機能。画面を分割したり、枠の中の一部にインカメラの動画を合成したりするような機能はあるが、被写体を切り抜いて背景となじませる点が新しい。
動画では、「Night Vision」もSnapdragon 8 Gen 3の処理能力を生かした機能といえる。これは、いわゆる夜景モードの動画版。ほぼ真っ暗な場所で撮った動画をリアルタイムに処理し、まるで暗視カメラのように明るい映像を記録できる。近い機能はOPPOが独自の画像処理チップを搭載して実現していたが、Snapdragon 8 Gen 3では、これをワンチップで行えるようになっている。
Copyright © ITmedia, Inc. All Rights Reserved.