2019年の開始以来、多様な最新論文を取り上げている連載「Innovative Tech」。ここではその“AI編”として、人工知能に特化し、世界中の興味深い論文を独自視点で厳選、解説する。執筆は研究論文メディア「Seamless」(シームレス)を主宰し、日課として数多くの論文に目を通す山下氏が担当。イラストや漫画は、同メディア所属のアーティスト・おね氏が手掛けている。X: @shiropen2
北京大学とGoogle Cloud AI Researchに所属する研究者らが発表した論文「PaperBanana: Automating Academic Illustration for AI Scientists」は、学術論文における図や統計プロットを自動生成するフレームワークを開発した研究報告だ。ジェネレーターも公開されており、Webブラウザ上で手法の説明文や図のキャプションなどを入力し、生成することができる。
PaperBananaは、モデルアーキテクチャ図や複雑なフローチャートなどのダイヤグラム生成、人間が作成した図や手書きイラストなどを洗練されたダイヤグラムへの変換、統計プロットの生成を可能にする。
PaperBananaは、複数の専門エージェント(Retriever・Planner・Stylist・Visualizer・Critic)が連携することで図表を生成する。
まずRetrieverが過去の論文から類似の図表スタイルを検索し、Plannerがその参考例を手掛かりにしながら論文本文から論理構造を抽出して詳細なテキスト記述を作成。次にStylistが学術ガイドラインに合わせた配色やフォント、レイアウトなどの調整を行い、Visualizerが画像生成モデル(Nano-Banana-Proなど)を用いて図をレンダリングする。
最後にCriticが元の論文内容と生成された図を照らし合わせ、論理的な誤りや視覚的な不備を指摘し、繰り返し修正を行うことで、最終的に出版可能な品質まで図の精度を高める。
PaperBananaの有効性を検証するため、研究チームは機械学習分野の技術会議「NeurIPS 2025」の出版物から抽出した292件のテストケースを含むベンチマーク「PaperBananaBench」を構築。実験の結果、PaperBananaは既存のベースライン手法と比較して、忠実性、簡潔性、可読性、審美性の全ての評価指標において上回るスコアを記録した。
Source and Image Credits: Zhu, Dawei, et al. “PaperBanana: Automating Academic Illustration for AI Scientists.” arXiv preprint arXiv:2601.23265(2026).
Google、“歩ける”世界を生成する「Project Genie」を米国で試験公開 「Genie 3」と「Nano Banana Pro」を統合
Google、ChromeブラウザもGemini3に サイドパネルUIでNano Bananaも統合
Googleの画像生成AI「Nano Banana」、名前の由来は? 公式が明かす
有料版「Gemini」にお手ごろプラン GoogleのAIサブスク「Plus」日本でも提供開始 月額1200円
OpenAI、「ChatGPT Images 1.5」公開 生成速度4倍で「Nano Banana」に対抗Copyright © ITmedia, Inc. All Rights Reserved.