メディア
ITmedia AI+ >

論文の図を生成するAI「PaperBanana」 Googleなどが開発 ブラウザ上で試せるジェネレーターも公開中Innovative Tech(AI+)

» 2026年02月12日 12時00分 公開

Innovative Tech(AI+):

2019年の開始以来、多様な最新論文を取り上げている連載「Innovative Tech」。ここではその“AI編”として、人工知能に特化し、世界中の興味深い論文を独自視点で厳選、解説する。執筆は研究論文メディア「Seamless」(シームレス)を主宰し、日課として数多くの論文に目を通す山下氏が担当。イラストや漫画は、同メディア所属のアーティスト・おね氏が手掛けている。X: @shiropen2

 北京大学とGoogle Cloud AI Researchに所属する研究者らが発表した論文「PaperBanana: Automating Academic Illustration for AI Scientists」は、学術論文における図や統計プロットを自動生成するフレームワークを開発した研究報告だ。ジェネレーターも公開されており、Webブラウザ上で手法の説明文や図のキャプションなどを入力し、生成することができる。

PaperBananaのトップ画面

 PaperBananaは、モデルアーキテクチャ図や複雑なフローチャートなどのダイヤグラム生成、人間が作成した図や手書きイラストなどを洗練されたダイヤグラムへの変換、統計プロットの生成を可能にする。

提供された資料に基づき、論文の図表生成を自動化するフレームワーク

 PaperBananaは、複数の専門エージェント(Retriever・Planner・Stylist・Visualizer・Critic)が連携することで図表を生成する。

 まずRetrieverが過去の論文から類似の図表スタイルを検索し、Plannerがその参考例を手掛かりにしながら論文本文から論理構造を抽出して詳細なテキスト記述を作成。次にStylistが学術ガイドラインに合わせた配色やフォント、レイアウトなどの調整を行い、Visualizerが画像生成モデル(Nano-Banana-Proなど)を用いて図をレンダリングする。

 最後にCriticが元の論文内容と生成された図を照らし合わせ、論理的な誤りや視覚的な不備を指摘し、繰り返し修正を行うことで、最終的に出版可能な品質まで図の精度を高める。

5つの専門エージェントを連携させている

 PaperBananaの有効性を検証するため、研究チームは機械学習分野の技術会議「NeurIPS 2025」の出版物から抽出した292件のテストケースを含むベンチマーク「PaperBananaBench」を構築。実験の結果、PaperBananaは既存のベースライン手法と比較して、忠実性、簡潔性、可読性、審美性の全ての評価指標において上回るスコアを記録した。

Source and Image Credits: Zhu, Dawei, et al. “PaperBanana: Automating Academic Illustration for AI Scientists.” arXiv preprint arXiv:2601.23265(2026).



Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ