論文の図を生成するAI「PaperBanana」 Googleなどが開発 ブラウザ上で試せるジェネレーターも公開中:Innovative Tech(AI+)
北京大学とGoogle Cloud AI Researchに所属する研究者らは、学術論文における図や統計プロットを自動生成するフレームワークを開発した研究報告を発表した。
Innovative Tech(AI+):
2019年の開始以来、多様な最新論文を取り上げている連載「Innovative Tech」。ここではその“AI編”として、人工知能に特化し、世界中の興味深い論文を独自視点で厳選、解説する。執筆は研究論文メディア「Seamless」(シームレス)を主宰し、日課として数多くの論文に目を通す山下氏が担当。イラストや漫画は、同メディア所属のアーティスト・おね氏が手掛けている。X: @shiropen2
北京大学とGoogle Cloud AI Researchに所属する研究者らが発表した論文「PaperBanana: Automating Academic Illustration for AI Scientists」は、学術論文における図や統計プロットを自動生成するフレームワークを開発した研究報告だ。ジェネレーターも公開されており、Webブラウザ上で手法の説明文や図のキャプションなどを入力し、生成することができる。
PaperBananaは、モデルアーキテクチャ図や複雑なフローチャートなどのダイヤグラム生成、人間が作成した図や手書きイラストなどを洗練されたダイヤグラムへの変換、統計プロットの生成を可能にする。
PaperBananaは、複数の専門エージェント(Retriever・Planner・Stylist・Visualizer・Critic)が連携することで図表を生成する。
まずRetrieverが過去の論文から類似の図表スタイルを検索し、Plannerがその参考例を手掛かりにしながら論文本文から論理構造を抽出して詳細なテキスト記述を作成。次にStylistが学術ガイドラインに合わせた配色やフォント、レイアウトなどの調整を行い、Visualizerが画像生成モデル(Nano-Banana-Proなど)を用いて図をレンダリングする。
最後にCriticが元の論文内容と生成された図を照らし合わせ、論理的な誤りや視覚的な不備を指摘し、繰り返し修正を行うことで、最終的に出版可能な品質まで図の精度を高める。
PaperBananaの有効性を検証するため、研究チームは機械学習分野の技術会議「NeurIPS 2025」の出版物から抽出した292件のテストケースを含むベンチマーク「PaperBananaBench」を構築。実験の結果、PaperBananaは既存のベースライン手法と比較して、忠実性、簡潔性、可読性、審美性の全ての評価指標において上回るスコアを記録した。
Source and Image Credits: Zhu, Dawei, et al. “PaperBanana: Automating Academic Illustration for AI Scientists.” arXiv preprint arXiv:2601.23265(2026).
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
Google、“歩ける”世界を生成する「Project Genie」を米国で試験公開 「Genie 3」と「Nano Banana Pro」を統合
Googleは、テキストや画像から対話型の仮想世界を生成・探索できるプロトタイプ「Project Genie」を米国の特定ユーザー向けに公開した。汎用ワールドモデル「Genie 3」を基盤とし、ユーザーの操作に応じて環境がリアルタイムで描画され続けるのが特徴。探索できるのは最大60秒間。
Google、ChromeブラウザもGemini3に サイドパネルUIでNano Bananaも統合
Googleは、「Gemini 3」を搭載する「Chrome」ブラウザの大規模更新を発表した。常駐型サイドパネルを導入し、画像編集ツール「Nano Banana」の統合によりWeb上の画像を直接加工できるようにする。まずは、米国のWindows、macOS、Chromebook Plusユーザー向けに提供を開始した。
Googleの画像生成AI「Nano Banana」、名前の由来は? 公式が明かす
米Googleは、画像生成AI「Nano Banana」の名前の由来を公式ブログで明かした。
有料版「Gemini」にお手ごろプラン GoogleのAIサブスク「Plus」日本でも提供開始 月額1200円
米Googleが個人向けのAIサブスクリプション「Google AI Plus」の提供を日本でも開始した。「Gemini」の上位モデルや「Nano Banana Pro」といった生成AIサービスの利用回数を追加する他、200GBのクラウドストレージを提供する。
OpenAI、「ChatGPT Images 1.5」公開 生成速度4倍で「Nano Banana」に対抗
OpenAIは、画像生成AIの新版「ChatGPT Images 1.5」を発表した。生成速度が最大4倍高速化し、指示追従性や写真編集能力、高密度なテキスト描画性能が大幅に向上。サイドバーには専用の「画像」メニューが追加され、直感的な操作が可能になった。無料版を含む全ユーザーに順次展開され、API利用料も従来より20%安価になる。


