SciFig 里能同时用 GPT Image 2 和 Nano Banana Pro 吗？

能。两款都是文字生图和图生图工具里的一等公民选项。生成前在模型选择器切换；SciFig 上两款定价相同，因为底层都通过同一份 Kie.ai 上游合约接入。具体每次生成消耗的积分见定价页面。

哪款大批量使用更划算？

SciFig 上两款每次生成消耗的积分一样——成本不是差异点，"输出是否合适你的图类型"才是。如果你每月批量做 200+ 张图，省钱靠"一次到位、不用反复重试的模型"，而不是"API 调用稍便宜的模型"。

两款都能直接输出 SVG / 矢量吗？

都不能。两款都是栅格输出（默认 PNG，可选 JPEG）。要拿到出版级矢量图，先生成栅格图，再丢进矢量画布 Vector Canvas ，由它追踪并转换成可编辑 SVG。这套两步流程对两款模型同样适用。

GPT Image 2 跟普通版 Nano Banana（非 Pro）怎么比？

本次评测专门聚焦两款旗舰对决，因为这是研究者最常问的问题。如果你做"快速出图、速度优先于细节"，更小型的 Nano Banana 模型也是合理选择，SciFig 同样支持。

两款能直接读 PDF 论文作为输入吗？

不能直接读。SciFig 的 PDF 转图工具会处理这一步——从论文里提取相关图描述当作提示词，再喂给 GPT Image 2 或 Nano Banana Pro 中的一款。"选哪款"在那一步生效。

两款生成的图能投 Nature / Cell / Science 吗？

期刊政策正在快速演变——2026 年的简短答案是"可以，但要披露"。多数顶刊要求在 methods 部分声明使用 AI 辅助生图。详细规范我们在 AI 生图能投期刊吗：2026 政策指南里跟踪。

想看完整 24 张图并复测某条提示词，去哪？

可复制提示词的完整图库：GPT Image 2 输出在 /inspiration?model=gpt image 2 ，Nano Banana Pro 输出在 /inspiration?model=nano banana pro 。点任意图查看原始提示词；复制粘贴到文字生图自己复测。

为什么选这份评测，不直接看 OpenAI 或 Google 的官方示例？

两家的官方图库都是为了 flatter 模型而精挑的样本。我们用的是真实研究生写给插图师的那种提示词——长、有立场、塞满学科术语、明确指定标签和配色。这才是科研工作真正的考试题，也是两款模型差距能看清楚的考试题。

GPT Image 2 vs Nano Banana Pro：10 个学科 24 张图实测对比（2026）

Name: SciFig
Author: SciFig

我们用 GPT Image 2（OpenAI 旗舰）和 Nano Banana Pro（谷歌 Gemini 3 顶配）在 10 个学科 / 12 个提示词 / 24 张图 上做了一次彻底盲测——从 CRISPR-Cas9 切割机制到 Transformer 架构，从大气环流的 Hadley 环流到莫比乌斯环拓扑。每张图都按 6 个维度打分：提示词文字保真度、指令遵循度、学科准确性、出版级感、可读性、审美。12 个提示词原文 + 24 张原图全部公开，欢迎复测。这是我们已知的 2026 年最详尽的科研 AI 生图旗舰对决。

概览：GPT Image 2 与 Nano Banana Pro

两款都是 2026 年初其母公司发布的旗舰图像生成模型。SciFig 通过 Kie.ai 同时接入了这两款，所以一个账号就能在文字生图工具里一键切换。

属性	GPT Image 2	Nano Banana Pro
母公司	OpenAI	Google（Gemini 3）
模式	文字生图、图生图	文字生图、图生图
比例	auto / 1:1 / 9:16 / 16:9 / 4:3 / 3:4	1:1 / 2:3 / 3:2 / 3:4 / 4:3 / 4:5 / 5:4 / 9:16 / 16:9 / 21:9 / auto
分辨率	1K / 2K / 4K	1K / 2K / 4K
风格预设	无（由提示词驱动）	无（由提示词驱动）
SciFig 入口	`/models/gpt-image-2`	`/models/nano-banana-pro`

为了公平对比，本次评测两款模型都锁定 16:9 比例 / 2K 分辨率。提示词长度 1,100–1,800 字符，模拟一名研究生向插图师交代的科研图详细需求——每个受体、每个激酶、每个过渡态都明确写出来。

GPT Image 2：OpenAI 的"细节控"旗舰

GPT Image 2 继承了 OpenAI 文本模型对长提示词的偏执。实际表现是：模型把提示词里的每个细节都当成 checklist，努力让每个元素都出现在最终图里。

优势

提示词文字保真度 24 张图均值 99.2%——一个 1,500 字符的提示词里点名的每个元素，几乎都能落到最终输出里。
化学符号规范 是它的隐藏护城河：在 SN2 反应测试中，它正确画出了过渡态的双匕首符号 ‡、标注了 R 和 S 立体配置、把五配位碳和三个三角面氢正确呈现、附带完整能量图（含 Ea 标注）、并且自带四色图例（亲核试剂 / 离去基团 / 碳 / 氢）。
数学公式、坐标轴、比例尺 一致出现：黑洞图里有 Rs = 2GM/c²、莫比乌斯环图里给出完整参数方程 x(u,v) = (1+v/2·cos(u/2))·cos(u)、杨氏双缝实验里有 d·sin(θ) = m·λ 加路径差三角形。

测试：SN2 取代反应机理

GPT Image 2 渲染的 SN2 取代反应机理：含双匕首过渡态、五配位碳、R-S 立体化学、能量图 inset、四色元素图例

GPT Image 2 —— 化学规范全部到位：过渡态 ‡、R/S 立体标注、五配位碳含三个三角面氢、含 Ea 的能量图、配色图例（亲核试剂 / 离去基团 / 碳 / 氢）。

Nano Banana Pro 渲染的 SN2 反应机理：可识别但缺关键化学规范如双匕首和 R-S 立体化学和元素图例

Nano Banana Pro —— 能识别为 SN2，但双匕首、R/S 立体标注、"五配位"标签、四色元素图例都缺。输出干净易读，只是化学规范上不够"经审稿"。

测试：杨氏双缝干涉

GPT Image 2 渲染的杨氏双缝干涉实验：含 Huygens 球面波前、路径差三角形 inset、距离 L 标注的观察屏、完整公式 d sin theta 等于 m lambda

GPT Image 2 —— 完整物理教科书呈现：单色光源、Huygens 圆形波前、路径差几何 inset、明暗条纹标注 m = 0, ±1, ±2、位置公式 y_m = mλL/d、显式区分"亮纹（相长）/ 暗纹（相消）"。

Nano Banana Pro 渲染的杨氏双缝干涉实验：含 Huygens 波前和公式但漏掉部分标注

Nano Banana Pro —— 几何和 Huygens 构造正确（路径差三角形用淡橙色高亮，视觉漂亮），但屏距 L、明暗条纹分类、位置公式都从图里丢了。

局限

信息密度 有时会变成视觉拥挤。我们的 CRISPR 测试中，提示词命中率 95%，但可读性只打了 5 分制的 3 分——所有标签都出现了，只是密集到难以一眼扫读。
缺少 3D 层叠效果：架构图（如 Transformer）渲染偏平面，Add & Norm 块是 2D，没有 Nano Banana Pro 输出里那种"层堆叠"的 3D 视觉提示。

最适合的科研场景

期刊投稿——每个标签、公式、图例都必须经得住同行评议
化学论文——需要立体化学、过渡态、反应机理细节
抽象数学（拓扑、流形）——概念准确性高于视觉冲击
长提示词工作流（>1,000 字符）——配合掌握科研 AI 提示词里推荐的提示词框架，效果更佳

提示

Cell 级期刊投稿的最佳路径：GPT Image 2 生成详图 → 矢量画布 Vector Canvas 收尾——细节进，发表级 SVG 出。

看 AI 科研配图生成实战

看研究者如何用自然语言描述，生成可用于发表的科研配图。

探索该工具

Nano Banana Pro：谷歌的"BioRender 风"旗舰

Nano Banana Pro 是 Google Gemini 3 系列里图像合成能力最强的模型。如果说 GPT Image 2 倾向"按规格生产"，那 Nano Banana Pro 倾向"按构图归纳"——它的输出感觉像一名资深插图师把提示词浓缩成了一张干净的编辑级配图。

优势

可读性 24 张图均值 4.67 / 5，对手 GPT Image 2 是 4.25。差距很稳定：每张图留白更多，标签更大，视觉堆叠更少。
审美精致度 在 BioRender 风科研插图美学上几乎是天花板。微服务架构图里它精准还原了 Kafka topic、sidecar 模式、observability 栈，并主动给 async 事件加了"Order Created" / "Payment Processed" 这类业务标签——把静态架构变成了一张近乎"会讲故事"的图。
层堆叠可视化 真的更好。Transformer 测试中它把 Encoder Stack (Nx) 和 Decoder Stack (Nx) 渲染成视觉上层层叠加的块，配合明确的 K、V、Q 跨注意力箭头从 encoder 指向 decoder——结构直觉感比 GPT Image 2 强一个档。
流程类图 受益于它常用的双 panel 设计：光刻工艺测试中它给 6 个步骤每个都画了"上排详细视图 + 下排简化截面"，这正是 IEEE 半导体工艺教科书的呈现方式。

测试：微服务系统架构

GPT Image 2 渲染的微服务架构图：含 Istio Service Mesh、API Gateway、多语言数据库、含分区的 Kafka、可观测性栈，且标注 Kong Envoy Keycloak 等具体厂商

GPT Image 2 —— 一份厂商信息丰富的技术参考：API Gateway 标 "Kong / Envoy"、Auth 标 "Keycloak"、Istio Service Mesh 显式包裹 5 个服务并配 Envoy sidecar、Kafka 含 4 个 partition、可观测性栈拆 Loki / Prometheus / Jaeger 并附侧边图例。

Nano Banana Pro 渲染的微服务架构图：含 Order Created Payment Processed 等业务事件标签展示异步事件流

Nano Banana Pro —— 主动加了一层叙事感：消息队列不只是标 "Kafka Topics"，而是把流过它的实际业务事件（Order Created、Order Updated、Payment Processed、Update Inventory、Send Notification）都标了出来。架构从静态图变成"会讲故事"的图。

测试：半导体光刻工艺

GPT Image 2 渲染的光刻工艺：6 个水平 panel 展示 Spin Coat Soft Bake UV Exposure Post Bake Development Etching 流程，含 photomask UV Source 和 developer

GPT Image 2 —— 单排 6-panel 流程，所有步骤层堆叠保持一致（Si / SiO₂ / 光刻胶）。紧凑清晰，但每步只有一个截面视角。

Nano Banana Pro 渲染的光刻工艺：6 个双 panel 列每个步骤上方详细视图下方简化截面

Nano Banana Pro —— 同样 6 个步骤，但每步都画成双 panel：上面详图、下面简化截面。这正是 IEEE 教科书呈现光刻的方式。soft bake 时还加了水蒸气符号、显式标注 "exposed regions (more soluble)"——细节让这张成为整场评测分数最高的工程类图（19/20）。

局限

提示词文字保真度 24 张均值 86.1%——比 GPT Image 2 落后约 13 个百分点。表现为：长提示词里它倾向丢掉可选标签、颜色图例、显式数值标注。
化学规范 是它最弱的领域。SN2 测试里它漏掉了过渡态双匕首、漏掉了 R/S 立体化学、漏掉了四色元素图例、也没标"五配位过渡态"——而 GPT Image 2 全部都画了。
抽象 3D 拓扑可能失败。莫比乌斯环测试是最戏剧性的例子：Nano Banana Pro 把主图渲染成了一个普通的可定向圆柱（无半扭转），把真正的 Möbius 环放在了一个小 inset 里——这是足以误导学生的概念错误。GPT Image 2 第一次就画对了。

测试：莫比乌斯环拓扑（值得一看的失败案例）

GPT Image 2 渲染的莫比乌斯环：3D 渲染含可见的半扭转、红色蚂蚁标注 start 和 after 180 度展示单侧性、完整参数方程、可定向圆柱 inset 用于对比

GPT Image 2 —— 一个可信的 3D 莫比乌斯环，半扭转清晰可见。红色蚂蚁在 "start" 和 "after 180°" 两个位置展示单侧性；边界用单条连续曲线。圆柱在角落小图作对比，标注 "two distinct edges" + "two-sided surface"。得分：20/20。

Nano Banana Pro 渲染错误：主图是普通圆柱无半扭转、真正的莫比乌斯环只在角落小图

Nano Banana Pro —— 主图是普通可定向圆柱，不是莫比乌斯环。真正的 Möbius 环缩到角落 inset 里。这是足以误导任何看图学生的概念错误。得分：11/20——我们第二大单题分差。

最适合的科研场景

会议海报、幻灯片、教学材料——可读性比标注密度更重要
生物机制图（信号通路、机制示意图）——BioRender 风的简洁本来就是这类图的体裁规范
ML / CS 架构图——层堆叠和数据流箭头是关键
流程工作流——双 panel 的"详图 + 简图"配合理解

12 对横向对决：10 学科 24 张图

进表格之前，先看本场盲测唯一打平的案例——两款旗舰都打到了 Nature 封面级：

测试：板块构造剖面图（唯一平手）

GPT Image 2 渲染的板块构造：三种边界并排含地幔对流环和岩石圈软流圈区分及深度坐标 National Geographic 风

GPT Image 2 —— 三种板块边界并排，立体感强，岩石圈/软流圈温度梯度明确，地幔对流环显式画出。National Geographic / USGS 风。得分：19/20。

Nano Banana Pro 渲染的板块构造：含热泉生态群落硫化物烟囱及板片脱水带等专业标注且标签等距分布

Nano Banana Pro —— 三种边界科学准确度持平，且额外加分：热泉周围生态细节（mineral-rich plumes、sulfide chimneys、biological communities）+ 显式标注 "Slab Dehydration Zone"。标签留白更整齐。得分：19/20。

12 个提示词 × 10 个学科 × 2 模型 = 24 张图，每张都用同一套 6 维度打分。下面是完整结果。主观分采用 1–5 制，主观总分是 4 个主观维度之和（满分 20）。

提示词	学科	GPT Image 2 命中率	NBP 命中率	GPT Image 2 主观分	NBP 主观分	胜出方
EGFR / RAS / MAPK 信号	生物医学	100%	80%	19	18	GPT Image 2
CRISPR-Cas9 切割	生物医学	95%	98%	15	18	Nano Banana Pro
Transformer 架构	CS	100%	95%	16	18	Nano Banana Pro
微服务架构	CS	100%	85%	19	18	GPT Image 2
SN2 取代反应	化学	100%	70%	20	15	GPT Image 2（决定性）
杨氏双缝干涉	物理	100%	75%	19	18	GPT Image 2
半导体光刻流程	工程	95%	100%	17	19	Nano Banana Pro
板块构造剖面	地学	100%	95%	19	19	平手
莫比乌斯环拓扑	数学	100%	80%	20	11	GPT Image 2（NBP 渲染错误）
黑洞吸积盘	天文	100%	80%	19	18	GPT Image 2
北温带森林食物网	生态	100%	90%	19	18	GPT Image 2
海马体 / LTP	神经	100%	85%	19	18	GPT Image 2

胜负：GPT Image 2 胜 8 场（含 2 场决定性）；Nano Banana Pro 胜 3 场；1 平。

聚合层面，提示词命中率 (99.2% vs 86.1%) 是最关键的数字——它告诉你提示词越长，GPT Image 2 命中所有要求的元素越稳定。但 主观总分 (89/100 vs 88/100) 几乎打平——一旦两款模型都命中了要求的元素，最终图的"好坏"就只是风格差异。

完整 24 张图配上原始提示词，可以在这两个集合页浏览：/inspiration?model=gpt-image-2 和 /inspiration?model=nano-banana-pro。每一张都能点开复制提示词，扔回文字生图自己复测。

立即生成科研配图

用自然语言描述你的配图需求——几分钟内得到发表级插图。

免费试用

5 个可外推的发现

发现 1：长提示词命中率是 GPT Image 2 的招牌优势

平均提示词长度 1,400 字符 vs 命中率差距 13.1 个百分点——这个图样很稳定：提示词越长越具体，Nano Banana Pro 漏掉的元素就越多。这不是小差距：12 个提示词均值，GPT Image 2 命中 99.2%，Nano Banana Pro 86.1%。

如果你写极简提示词（"画一张细胞信号通路图"），差距会缩小。如果你写 SciFig 提示词框架推荐的那种丰富、完整、明确指定的提示词，差距是真实且可复现的。

测试：北温带森林食物网（一个长 prompt 命中率基准）

GPT Image 2 渲染的森林食物网：4 个营养级、阳光能量输入、物种插画、分解者独立分栏、能量传递百分比图例展示 10 percent 法则

GPT Image 2 —— 1,600 字符提示词里点名的物种全部命中：橡树、枫树、蕨类、草、野花、苔藓（生产者）；白尾鹿、雪兔、松鼠、田鼠、毛毛虫、蜜蜂、叶甲（食草动物）；红狐、大角鸮、束带蛇、莺、鼩鼱（中级捕食者）；灰狼、红尾鹰、黑熊（顶级）。分解者在右侧独立栏里含 bracket fungi / earthworms / bacteria。能量传递图例（100% → 10% → 1% → 0.1%）完整。

Nano Banana Pro 渲染的森林食物网：4 个营养级和物种插画及有机物质回归箭头但缺能量传递百分比图例

Nano Banana Pro —— 同样 4 个营养级、同样 kcal/m²/year 标注，所有物种可识别。但 bracket fungi / bacteria 区分丢了、能量传递百分比图例丢了，只标了 "earthworm"。大方向都抓到，教科书级脚注没全。

发现 2：化学符号规范是 GPT Image 2 的隐藏护城河

SN2 机制测试产生了我们最大的单题分差（20 vs 15）。GPT Image 2 渲染了所有标准化学规范——双匕首、部分键、R/S 立体化学、五配位几何、能量图、彩色元素图例。Nano Banana Pro 输出能看出是 SN2 机制，但漏了双匕首、漏了立体化学标注、也没画图例。

对于要投到 JACS、Angewandte Chemie 或 Organic Letters 的化学论文，这种细节是同行评议会抓的。做化学就选 GPT Image 2。

发现 3：抽象 3D 拓扑可能让 Nano Banana Pro 翻车

莫比乌斯环测试出了本次评测最意外的结果。提示词要求一张 3D 渲染的莫比乌斯环——主体显示半扭转，再加一个小 inset 对比普通圆柱。GPT Image 2 完全按要求画了。Nano Banana Pro 反过来了：主图变成了一个普通圆柱（无任何扭转），真正的 Möbius 环只出现在一个小角落 inset 里。

这不是风格偏好——这是可能误导学生的概念错误。做抽象数学就选 GPT Image 2。 不放心时同时跑两款再目视比对。

发现 4：BioRender 风简洁感是 Nano Banana Pro 的主场

它胜出的 3 场（CRISPR-Cas9、Transformer、光刻）有共同点：提示词奖励"简化"。CRISPR 是 4 步机制——Nano Banana Pro 干净的 step-by-step 视图战胜了 GPT Image 2 的密集版本。Transformer 是结构图——Nano Banana Pro 的层堆叠渲染抓到了架构直觉。

如果你做的是会议演讲幻灯片，每张图只有 30 秒注意力，Nano Banana Pro 往往是更好的默认选项。

测试：CRISPR-Cas9 切割机制（NBP 的 BioRender 风胜出）

GPT Image 2 渲染的 CRISPR-Cas9 切割机制：4 步序列含详细 Cas9 蛋白渲染 HNH RuvC 核酸酶域 PAM NGG 序列和 NHEJ HDR 修复路径

GPT Image 2 —— 要求的元素全部命中：Cas9 含 HNH 和 RuvC 域、sgRNA 含 20-nt 互补序列、PAM (5'-NGG-3') 高亮、R-loop 形成、blunt 双链断裂"PAM 上游 3 nt"、含 NHEJ + HDR 两条修复路径。得分：15/20——可读性扣分，因为所有标签都挤在密集 3D 渲染里。

Nano Banana Pro 渲染的 CRISPR-Cas9 切割机制：4 个简洁 BioRender 风步骤含简化 Cas9 卡通和清晰 NHEJ HDR 修复路径可视化

Nano Banana Pro —— 同样 4 步结构、同样科学准确度，但 BioRender 风的扁平插画留白多得多。每步只有一个焦点元素。NHEJ 的 "indels for gene knockout" 分支（红色断裂）和 HDR 的 "donor template insertion" 分支（绿色对勾）视觉上极清晰。得分：18/20——体裁规范胜出。

发现 5：信息密度 vs 可读性的"经典 trade-off"才是最深刻的发现

24 张图均分暴露了两个稳定 profile：

GPT Image 2：命中率高（99.2%）、出版级感强（4.58）、可读性偏低（4.25）
Nano Banana Pro：命中率较低（86.1%）、出版级感较弱（3.92）、可读性高（4.67）、审美最高（4.83）

两种都是合理的图设计哲学——只是对应不同用途。GPT Image 2 是为期刊文章里嵌在文字旁的那种图设计的。Nano Banana Pro 是为会议厅里 4 米外要靠自己讲清楚的那种图设计的。

测试：海马体记忆通路 + LTP（trade-off 一图道尽）

GPT Image 2 渲染的海马体三突触环路：含详细解剖 EC DG CA3 CA1 subiculum 颜色编码 perforant path mossy fibers Schaffer collaterals 和 LTP 机制 zoom 含 NMDA AMPA 受体 Mg2+ 阻断 Ca2+ 流入 CaMKII 和静息电位 -70 mV

GPT Image 2 —— 标题"Hippocampal Trisynaptic Circuit"、左侧解剖含 EC Layer II / V-VI 输入输出层特异性、4 步环路编号（Perforant Path → Mossy Fibers → Schaffer Collaterals → Output Path）、右侧 zoom LTP 机制含明确 "Resting Membrane Potential ~ -70 mV"、4 条 bullet 分子机制说明、角落颜色图例。信息密度顶峰。

Nano Banana Pro 渲染的海马体记忆通路：清晰 BioRender 风解剖区域明确划分 LTP 机制 zoom 展示 baseline 和 LTP induction 两态及 synapse 增强 spine 增大结果

Nano Banana Pro —— 同解剖、同环路、同 LTP 机制。但每个区域更大，标签更松散，眼睛有时间跟数据流走。锥体神经元胞体 + 顶端树突显式视觉表达。trade-off 是 EC 层特异性（Layer II vs V-VI）和 -70 mV 静息电位都丢了。结果：同样的内容，不同的阅读体验。

决策框架：到底该选哪个

默认推荐：GPT Image 2。 12 个提示词跨 10 学科盲测，GPT Image 2 胜 8 场、平 1 场、仅输 3 场。命中率 99.2% vs 86.1%，化学符号规范（20 vs 15）和抽象拓扑（20 vs 11）两场决定性碾压——而这两个领域恰是真实论文里"选错代价最高"的场景。NBP 赢的 3 场都是风格可读性（CRISPR / Transformer / 光刻），不是科学准确度。对大多数研究者，GPT Image 2 是最安全的默认选项；只有当编辑级精致度比符号严谨更重要时（演讲幻灯片 / 海报 / 社交媒体）才选 Nano Banana Pro。

边缘场景按下面这棵决策树挑模型——不同的科研产出对应不同的最优旗舰。先按你图的最终去处（期刊投稿 / 会议演讲 / 网络博客社交 / 不确定）选一级分支，再按你图的具体类型（化学 / 数学 / 生物 / CS / 流程 / 解剖）钻到二级规则。

期刊投稿（Cell / Nature / Science / PNAS）
- 化学 / 立体化学 / 反应机理 → GPT Image 2（决定性）
- 抽象数学 / 拓扑 / 流形 → GPT Image 2（NBP 可能在概念上失败）
- 长、密、标签丰富的提示词 → GPT Image 2
- BioRender 风的生物机制图体裁 → Nano Banana Pro 也可接受、有时更佳
幻灯片 / 会议海报 / 教学材料
- 默认 → Nano Banana Pro（可读性 + 审美优势）
- ML / CS 架构 → Nano Banana Pro（层堆叠视觉更强）
- 多步流程 → Nano Banana Pro（双 panel 设计）
博客或社交媒体配图
- 默认 → Nano Banana Pro（更干净，更扛滚动浏览）
封面级图（高端期刊封面、National Geographic 风）
- 两个都行；去图库浏览类似输出，按审美匹配挑选
不确定
- SciFig 同时支持两款——直接两个都生成，并排对比挑赢的。这本来就是真人插图师的工作方式。

如果你想看这两款怎么和整个 AI 科研插图工具生态对比，请看 2026 年 10 大科研插图工具（我们的 P3 支柱长文）。

关于评测方法

本次评测共 12 个科研提示词、覆盖 10 个学科，全部锁定 16:9 比例 + 2K 分辨率，通过 Kie.ai API 直连（这正是 SciFig 生产环境的同一供应商）。每个提示词 1,100–1,800 字符，写得跟一名研究生向真人插图师交代任务一样详细——受体、激酶、方程、命名结构域、配色偏好都明确指定。每张图按 6 个维度打分：2 个客观（命中率、指令遵循度）+ 4 个主观（学科准确性、出版级感、可读性、审美）+ 配评分理由——所以外部读者可以独立复审打分逻辑。

两款模型在同一天、同一参数下测试。完整提示词集、24 张原图、按 rubric 打分的全表都发布在 /inspiration?model=gpt-image-2 和 /inspiration?model=nano-banana-pro。如果你复测某条提示词得到不同结果，欢迎告诉我们——这种评测方法只有靠社区验证才会越来越可靠。

这不是终极结论，但是 2026 年第一份系统性、跨 10 学科的科研旗舰对决。配套姊妹篇 GPT Image 2 vs Nano Banana Pro：科研生图谁更强（2026）把这些发现转化成"今天该开哪款？"的快速决策指南。如果你只想要结论不想看数据表，下一步读它。

GPT Image 2 vs Nano Banana Pro：10 个学科 24 张图实测对比（2026）

概览：GPT Image 2 与 Nano Banana Pro

GPT Image 2：OpenAI 的"细节控"旗舰

优势

局限

最适合的科研场景

Nano Banana Pro：谷歌的"BioRender 风"旗舰

优势

局限

最适合的科研场景

12 对横向对决：10 学科 24 张图

5 个可外推的发现

发现 1：长提示词命中率是 GPT Image 2 的招牌优势

发现 2：化学符号规范是 GPT Image 2 的隐藏护城河

发现 3：抽象 3D 拓扑可能让 Nano Banana Pro 翻车

发现 4：BioRender 风简洁感是 Nano Banana Pro 的主场

发现 5：信息密度 vs 可读性的"经典 trade-off"才是最深刻的发现

决策框架：到底该选哪个

关于评测方法

常见问题

与本文相关的 SciFig 资源

继续阅读

GPT Image 2 vs Nano Banana Pro：科研生图谁更强（2026 决策指南）

SciFig vs BioRender：生成式 AI 还是图标库？

AI 科研插图工具怎么选（2026）

几分钟生成发表级科研插图