「生成AIの出力は直しにくい」をどう克服? Canvaが仕掛ける“編集できる画像生成AI”の衝撃:本田雅一のクロスオーバーデジタル(2/3 ページ)
Canvaが、自社の生成AIの新バージョン「Canva AI 2.0」を発表した。そのプレス向け技術でもを通して、同社が意図する「ゲームチェンジ」を解説する。
ファインチューンで「20倍安く、5倍速く」
Canvaの自社AIモデルが持つもう1つの特徴は、コスト効率の高さだ。
コーヘン氏は、スタイル変換や「Design-Aware Creation(デザインを意識した創作)」や「Image-to-Video(静止画からの動画生成)」いった機能について、同等の先進モデルに対して「20倍安く、5倍速い処理速度」を実現していると主張する。
その実装手法は明快だ。新しい機能を投入するとき、Canvaはまずサードパーティー(OpenAI/Anthropic/Google)製のフロンティアモデルを使ってサービスを開始する。フロンティアモデルは強力である一方で汎用的であり、デザイン領域に特化していないため、コストも処理時間もかかる。
ここで収集されるユーザーデータが、自社モデル開発の起点になる。特定機能における入力プロンプト、生成結果、ユーザーの編集行動、最終出力といった行動履歴を訓練データとして活用し、より小型で用途に特化したモデルとしてファインチューンを行っていく。こちらは専用モデルであるため、汎用的なフロンティアモデルが持つ広範な能力の大部分を“捨て”、デザイン特化の精度だけを残すことが可能だ。
結果として、開発が進むほどにモデルのサイズは小さくなり、推論にかかるコストも低くなり、それでいて処理は速くなる。もちろん、こうしたファインチューンの手法は目新しいものではない。
Canvaの優位性は、汎用モデルを先に使って得た編集行動を教師データとして、専用モデルを育てる反復を、自分たちが提供しているクリエイティブツールの環境内だけ回せるという点にある。
生成から編集、公開、あるいはやり直し――これら一連の行動が、全て同じプラットフォーム上で観測できる構造は、APIやモデルだけを提供するAI企業、あるいはここに分離されたデスクトップアプリに依存する他社には作れない。
デザイン品質の判定基準を社内で言語化し、ラベル付きデータセットを作成して評価モデルを訓練するオフライン評価フレームワークと組み合わせることで、訓練のフィードバックループを二重化できることが、強みにつながっているのだ。
Affinityに「Claude」を統合
Canvaのプレスデーでは、MCP(Model Context Protocol)を使った外部AIとの“深い統合”も公開された。自社のデザインツール「Affinity」と、Anthropic製の生成AIツール「Claude(クロード)」の“双方向統合”だ。
- →ClaudeによるAI自動化(Affinity ヘルプセンター)
Affinityのデスクトップアプリケーションでは多種のメディアオブジェクトを編集可能だが、その各種機能を「MCPサーバ」として他のAIサービスと接続するための技術仕様が公開された。この新しいアプローチはAnthropicと共同で先行開発が進められており、Claudeのデスクトップ版に指示をすることで、Affinityの内部機能をエージェントとして自律的に操作できる。
ある意味で、Microsoftの「Visual Studio Code」とClaudeの連携と同じことをデザインの世界でも実現しようとしているのだ。
プレスデーのデモンストレーションでまず披露されたのが、数百レイヤーで構成された複雑なイラストレーションファイルへの自動命名処理だ。
多数のレイヤーを作って作業を行っていると「Group 47」「Layer Copy 3」といった無名のレイヤーが大量に発生する。他のデザイナーやクライアントにファイルを渡す前に、これらのレイヤーへの命名作業は欠かせないが、手作業だと数時間を要する。
そこでデモでは、Claudeにレイヤーの内容を理解して命名することを依頼すると、オブジェクトを“意味的に”理解した上で、「Foreground tree(前面の木)」「Hero character outline(主役のアウトライン)」といった具体的な名前を一括付与する様子を見ることができた。画像認識とAffinityのファイル構造の同時理解を必要とする処理で、汎用画像認識モデルとファイル操作APIの単純な組み合わせではできないものだ。
次に、企業内で使う想定で「自社の『ブランドガイドライン』に違反しないように、複数の画像に『非破壊フィルター』を一括適用する」という興味深いデモンストレーションを見ることができた。
数十ページの配布資料に対して、Claudeが指定されたブランドルールを読み取り、各ページに適切なフィルターを適用する。ここで重要なポイントは、ClaudeがAffinityの非破壊編集のワークフローを理解していたことだ。元のピクセルには触れずに、フィルターをアジャストメントレイヤーとして上に積む形で適用していた。
最も先鋭的だったのは、Claudeが本来Affinityには“存在しない”UIパネル"を動的に生成したデモンストレーションである。具体的には、パターンの生成パラメーターを操作するスライダー付きインタフェースを、AIがその場でコードとして書き出し、Affinityの機能として呼び出せる形にしたのだ。
ツールに本来存在しない機能すら、AIが必要に応じて動的に拡張する――機能リストでツールを比較すること自体の意味を薄くしてしまう可能性を示唆する実装だった。
これらのデモンストレーションが示したのは、フロンティアAIとのMCP接続が単なる「外部からツールを呼び出す」レベルを超えて、プロツールの内部ワークフローを理解したAIエージェントが、ツール自体を拡張する段階に達しているということだ。
デスクトップアプリケーションをMCPサーバとして公開するという実装パターンは、今後さまざまなライバルによって模倣されることになるかもしれない。デスクトップアプリの方が、ローカルファイルアクセス、GPUを使う重いレンダリング処理、リアルタイム編集といった、クラウドには逃がすことが難しい機能を、クラウドAIに付加できるようになるからだ。
この手法が広がれば、「Adobe Premiere」「Autodesk」「Cubase」はもちろん、「Logic Pro」を始めとするDAW(Digital Audio Workstation)アプリ、「Fusion 360」を始めとするCADアプリまで、MCPサーバとして外部エージェントから呼び出される設計へ向かう可能性も見えてくる。
Canvaが示したのは、その“ひな形”の1つと言えるだろう。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
MicrosoftとOpenAIの「独占契約終了」が意味するもの──AI覇権を巡る両社のしたたかな戦略
MicrosoftとOpenAIが、両社間で結ばれている提携契約の見直しを発表した。最大の焦点は、これまでMicrosoft Azureに限定されていたOpenAIの技術が、AWSなど他社クラウドへも提供可能になる「独占契約の終了」だ。AI市場の勢力図を塗り替えるであろう最新事情をひもとく。
「雲」から降りてきたAIは「パーソナル」な存在になれるのか――開催から1カ月経過した「CES 2026」を振り返る
米ネバダ州ラスベガスで開催された「CES 2026」は、PCの新製品が多めだったのだが、従来と比べるとAI推し、とりわけ「パーソナルAI」の存在感が強まっている。
危機の演出? それとも本当の“焦り”? OpenAI「コード・レッド」の内実
OpenAIが「GPT-5.2」を発表する前に、同社が社内に「コード・レッド(緊急事態)」を宣言したという報道があった。これは、一体どういうことだったのか――よく見てみると、ある意味でのゲームチェンジを狙ったものだということが分かる。
どの機能も実装してほしい――「Adobe MAX 2025」で披露されたAI機能が見せる“近未来”
Adobeの年次イベント「Adobe MAX」で一番人気のセッションが、研究中/開発中の機能を披露する「Sneaks」だ。ここで紹介された機能をかいつまんで紹介しよう。
文章は“AIと共に”執筆する時代に――「Claude 4」を活用することで変わりつつある執筆術
執筆の補助に生成AIを活用する――何度か試行してみたものの、しっくりこなかった。しかし、Anthropicの生成AI「Claude 4」と出会い、ついにAIと“共に執筆する”ための道筋を見つけたかもしれない。

