「生成AIの出力は直しにくい」をどう克服? Canvaが仕掛ける“編集できる画像生成AI”の衝撃本田雅一のクロスオーバーデジタル(2/3 ページ)

» 2026年05月05日 12時00分 公開
[本田雅一ITmedia]

ファインチューンで「20倍安く、5倍速く」

 Canvaの自社AIモデルが持つもう1つの特徴は、コスト効率の高さだ。

 コーヘン氏は、スタイル変換や「Design-Aware Creation(デザインを意識した創作)」や「Image-to-Video(静止画からの動画生成)」いった機能について、同等の先進モデルに対して「20倍安く、5倍速い処理速度」を実現していると主張する。

 その実装手法は明快だ。新しい機能を投入するとき、Canvaはまずサードパーティー(OpenAI/Anthropic/Google)製のフロンティアモデルを使ってサービスを開始する。フロンティアモデルは強力である一方で汎用的であり、デザイン領域に特化していないため、コストも処理時間もかかる。

 ここで収集されるユーザーデータが、自社モデル開発の起点になる。特定機能における入力プロンプト、生成結果、ユーザーの編集行動、最終出力といった行動履歴を訓練データとして活用し、より小型で用途に特化したモデルとしてファインチューンを行っていく。こちらは専用モデルであるため、汎用的なフロンティアモデルが持つ広範な能力の大部分を“捨て”、デザイン特化の精度だけを残すことが可能だ。

 結果として、開発が進むほどにモデルのサイズは小さくなり、推論にかかるコストも低くなり、それでいて処理は速くなる。もちろん、こうしたファインチューンの手法は目新しいものではない。

 Canvaの優位性は、汎用モデルを先に使って得た編集行動を教師データとして、専用モデルを育てる反復を、自分たちが提供しているクリエイティブツールの環境内だけ回せるという点にある。

 生成から編集、公開、あるいはやり直し――これら一連の行動が、全て同じプラットフォーム上で観測できる構造は、APIやモデルだけを提供するAI企業、あるいはここに分離されたデスクトップアプリに依存する他社には作れない。

 デザイン品質の判定基準を社内で言語化し、ラベル付きデータセットを作成して評価モデルを訓練するオフライン評価フレームワークと組み合わせることで、訓練のフィードバックループを二重化できることが、強みにつながっているのだ。

OpenAI Canva AIの「Magic Studio」は、OpenAIのAPIを使って開発された(参考記事

Affinityに「Claude」を統合

 Canvaのプレスデーでは、MCP(Model Context Protocol)を使った外部AIとの“深い統合”も公開された。自社のデザインツール「Affinity」と、Anthropic製の生成AIツール「Claude(クロード)」の“双方向統合”だ。

 Affinityのデスクトップアプリケーションでは多種のメディアオブジェクトを編集可能だが、その各種機能を「MCPサーバ」として他のAIサービスと接続するための技術仕様が公開された。この新しいアプローチはAnthropicと共同で先行開発が進められており、Claudeのデスクトップ版に指示をすることで、Affinityの内部機能をエージェントとして自律的に操作できる。

 ある意味で、Microsoftの「Visual Studio Code」とClaudeの連携と同じことをデザインの世界でも実現しようとしているのだ。

Affinity Claudeとの連携を含むAffinityの新機能は、4月16日付で公開されたブログにまとめられている

 プレスデーのデモンストレーションでまず披露されたのが、数百レイヤーで構成された複雑なイラストレーションファイルへの自動命名処理だ。

 多数のレイヤーを作って作業を行っていると「Group 47」「Layer Copy 3」といった無名のレイヤーが大量に発生する。他のデザイナーやクライアントにファイルを渡す前に、これらのレイヤーへの命名作業は欠かせないが、手作業だと数時間を要する。

 そこでデモでは、Claudeにレイヤーの内容を理解して命名することを依頼すると、オブジェクトを“意味的に”理解した上で、「Foreground tree(前面の木)」「Hero character outline(主役のアウトライン)」といった具体的な名前を一括付与する様子を見ることができた。画像認識とAffinityのファイル構造の同時理解を必要とする処理で、汎用画像認識モデルとファイル操作APIの単純な組み合わせではできないものだ。

Affinityで開いている画像のレイヤーをClaudeを使って自動命名するデモンストレーション

 次に、企業内で使う想定で「自社の『ブランドガイドライン』に違反しないように、複数の画像に『非破壊フィルター』を一括適用する」という興味深いデモンストレーションを見ることができた。

 数十ページの配布資料に対して、Claudeが指定されたブランドルールを読み取り、各ページに適切なフィルターを適用する。ここで重要なポイントは、ClaudeがAffinityの非破壊編集のワークフローを理解していたことだ。元のピクセルには触れずに、フィルターをアジャストメントレイヤーとして上に積む形で適用していた。

 最も先鋭的だったのは、Claudeが本来Affinityには“存在しない”UIパネル"を動的に生成したデモンストレーションである。具体的には、パターンの生成パラメーターを操作するスライダー付きインタフェースを、AIがその場でコードとして書き出し、Affinityの機能として呼び出せる形にしたのだ。

 ツールに本来存在しない機能すら、AIが必要に応じて動的に拡張する――機能リストでツールを比較すること自体の意味を薄くしてしまう可能性を示唆する実装だった。

 これらのデモンストレーションが示したのは、フロンティアAIとのMCP接続が単なる「外部からツールを呼び出す」レベルを超えて、プロツールの内部ワークフローを理解したAIエージェントが、ツール自体を拡張する段階に達しているということだ。

 デスクトップアプリケーションをMCPサーバとして公開するという実装パターンは、今後さまざまなライバルによって模倣されることになるかもしれない。デスクトップアプリの方が、ローカルファイルアクセス、GPUを使う重いレンダリング処理、リアルタイム編集といった、クラウドには逃がすことが難しい機能を、クラウドAIに付加できるようになるからだ。

 この手法が広がれば、「Adobe Premiere」「Autodesk」「Cubase」はもちろん、「Logic Pro」を始めとするDAW(Digital Audio Workstation)アプリ、「Fusion 360」を始めとするCADアプリまで、MCPサーバとして外部エージェントから呼び出される設計へ向かう可能性も見えてくる。

 Canvaが示したのは、その“ひな形”の1つと言えるだろう。

Copyright © ITmedia, Inc. All Rights Reserved.

アクセストップ10

2026年05月05日 更新
  1. 実売2万円切りで3年保証! フルサイズのHDMIも備えたMSI「PRO MP165 E6」の実力 (2026年05月04日)
  2. OpenAIが「GPT-5.5」を発表/GeminiのチャットでWordやExcel、PDFファイルなどを生成可能に (2026年05月03日)
  3. 16型で約1.2kgの衝撃 ASUS「Zenbook SORA 16」はSnapdragon X2 Elite搭載で“大画面モバイル”の理想形へ (2026年05月04日)
  4. バッテリー最大30日&64GBのストレージ! 究極のタフネスウォッチ「Amazfit T-Rex Ultra 2」は+3万円の価値があるか (2026年05月01日)
  5. Fractal Designの新型ピラーレスケースや3.3万円の「豪鬼」コラボレバーレスアケコンまで――GWのアキバ新製品まとめ (2026年05月04日)
  6. 無刻印モデルが2万円! Amazon GWセールでPFUが「HHKB」シリーズを特別価格で放出中 (2026年05月02日)
  7. Windows 11の不満解消へ Microsoftの最優先プロジェクト「Windows K2」とは何か (2026年04月28日)
  8. 思い出のビデオテープをPCなしでデジタル化できる「サンワダイレクト 400-MEDI034」が21%オフの2万5920円に (2026年04月30日)
  9. 4月30日発売の「Amazon Fire TV Stick HD(2026)」の特徴は? 購入時に注意すべきポイントをチェック! (2026年04月29日)
  10. 大容量HDDは品薄前夜「見つけたら即買い」の危機? 連休狙い目の「MSI×AMD×Apacer」スペシャルパックを追う (2026年05月02日)
最新トピックスPR

過去記事カレンダー

2026年