速報
Apple、UCSBと共同でマルチモーダルLLM採用のテキストベースの画像編集「MGIE」発表
AppleとUCSBの研究者らは、マルチモーダル大規模言語モデル(MLLM)によるテキストベースの画像編集ツール「MGIE」を発表した。Hugging Faceでデモを試すこともできる。
米Appleと米カリフォルニア大学サンタバーバラ校(UCSB)の研究者らは2月5日(現地時間)、マルチモーダル大規模言語モデル(MLLM)によるテキストベースの画像編集についての論文を発表し、その実装である「MGIE」(MLLM-Guided Image Editing)のコードをGitHubで公開した。また、Hugging Faceで試すこともできる。
MGIEは、テキストプロンプトで画像のトリミングやサイズ変更、フィルターの追加などの編集操作を行えるツール。画像全体の編集だけでなく、部分的な変更も可能だ。例えば、ピザの画像を「もっとヘルシーに」と命じるとミニトマトを追加したり、写真内のPCのディスプレイの画面を差し替えたりできる。
Hugging Faceのデモでは、編集したい画像をドロップして英語で命令を入力すると、結果が表示される。短い命令を、MGIEがより詳しい命令に変えてから実行する。本稿執筆現在、負荷が高くなっているからか、かなり時間がかかった(約13分)。
Appleはこれまで、iPhoneへのAI機能追加などは行ってきたが、生成AIツールのリリースなどはしていない。ティム・クックCEOは直近の業績発表で「今年後半にAI分野で進行中の取り組みの詳細を共有できる」と語った。
関連記事
- Apple、5四半期ぶりの増収 「年内にAIの取り組みの詳細を共有する」とクックCEO
Appleの10月〜12月期の決算は、増収増益だった。増収は5四半期ぶり。クックCEOは「AIの取り組みの詳細を年内に共有する」と語った。 - Apple、iPhone上でのLLM実行を可能にする手法の論文を発表
Appleは「LLM in a flash:Efficient Large Language Model Inference with Limited Memory」という論文を発表した。メモリ容量が限られた端末上でLLMを実行するための革新的な手法を編み出したとしている。 - AI一色にはならなかったWWDCでAppleが発表したAI関連まとめ
AppleのWWDC 2023では、「生成AI」というバズワードはほぼ使われなかった。とはいえ、MRヘッドセットの「Persona」など幾つかの“機械学習”採用技術が発表された。本稿ではそれを簡単にまとめた。 - Appleは「何年も前から生成AIを研究している」 クックCEOが米CNBCのインタビューで語る
米Appleが発表した2023年度第3四半期決算に関して、米CNBCがティム・クックCEOへのインタビューを実施。そこで、Appleは何年も前から生成系AIに取り組んできたと語ったと伝えている。
関連リンク
Copyright © ITmedia, Inc. All Rights Reserved.