GPT Image 2 vs Nano Banana Pro: ¿Cuál gana?
Comparación cara a cara entre GPT Image 2 y Nano Banana Pro para generación de figuras científicas — calidad, velocidad y costo.
La verdadera pregunta detrás de "¿Cuál es mejor?"
Antes de los hallazgos, la chuleta de para qué está construido cada buque insignia:
| Aspecto | GPT Image 2 | Nano Banana Pro |
|---|---|---|
| Matriz | OpenAI | Google (Gemini 3) |
| Construido para | Figuras detalladas con specs estrictas | Figuras estilo editorial con foco en composición |
| Gana en | Rigor químico, fórmulas matemáticas, topología abstracta, fidelidad en prompts largos | Legibilidad, refinamiento estético, diagramas estructurales (CS / proceso / mecanismo) |
| Pierde en | La densidad de información puede saturar | La fidelidad cae 13 pt en specs complejas; raros errores conceptuales de renderizado |
| Por defecto para | Envío a revistas | Diapositivas / pósteres / web |
| En SciFig | /models/gpt-image-2 | /models/nano-banana-pro |
Tres hallazgos decisivos (y por qué probablemente se aplican a ti)
Extrajimos tres hallazgos del benchmark de 24 figuras que deberían cambiar a qué modelo recurres por defecto. Son decisivos en el sentido de que la brecha de puntuación es lo bastante grande como para que una moneda al aire fuera errónea.
Hallazgo 1: Los artículos de química deberían usar GPT Image 2 (sin discusión)
‡ en el estado de transición, etiquetó las configuraciones estereoquímicas R y S en reactivo y producto, renderizó el carbono pentacoordinado con tres hidrógenos planos en el plano trigonal, incluyó un diagrama de energía completo recuadrado con Ea etiquetado y añadió una leyenda de cuatro colores identificando nucleófilo / grupo saliente / carbono / hidrógeno.
GPT Image 2: cada convención química estándar renderizada. Puntuación 20/20.

Nano Banana Pro: mecanismo reconocible pero faltan la doble daga, la estereoquímica R/S y la leyenda de color por elemento. Puntuación 15/20: nuestra mayor brecha en un solo prompt.
Hallazgo 2: La topología 3D abstracta puede romper a Nano Banana Pro
Este fue el resultado individual más sorprendente de nuestro benchmark. El prompt pedía una cinta de Möbius renderizada en 3D con medio giro, junto a un pequeño recuadro comparándola con un cilindro orientable normal. GPT Image 2 entregó exactamente eso: una cinta de Möbius 3D creíble en la figura principal, un pequeño cilindro en la esquina etiquetado «cilindro orientable, dos bordes distintos, superficie de dos caras», más la ecuación paramétrica completa renderizada como bloque matemático.

GPT Image 2: cinta de Möbius 3D creíble con el medio giro claramente visible. El cilindro está en el recuadro de la esquina, exactamente como pedía el prompt.

Nano Banana Pro: la figura principal es un cilindro plano, no una cinta de Möbius. La cinta de Möbius real está reducida a un diminuto recuadro de esquina. Fallo conceptual de renderizado.
Hallazgo 3: Las diapositivas de congreso y los pósteres deberían recurrir por defecto a Nano Banana Pro
El caso más claro fue la figura del proceso de fotolitografía: Nano Banana Pro hizo una elección de composición creativa que no le habíamos pedido, dividiendo cada uno de los 6 pasos del proceso en un panel de «vista detallada» arriba y un panel de «sección transversal simplificada» abajo, exactamente la forma en que los libros de texto del IEEE presentan los procesos semiconductores. El resultado fue la figura de ingeniería con mayor puntuación del benchmark (19/20).

GPT Image 2: secuencia de 6 paneles en una sola fila, compacta y clara. Puntuación 17/20.

Nano Banana Pro: los mismos 6 pasos pero cada uno renderizado como doble panel: vista detallada arriba, sección transversal simplificada abajo. Así es como los libros de texto del IEEE presentan en realidad la fotolitografía. Puntuación 19/20: nuestra figura de ingeniería con mayor puntuación.
Vea la generación de figuras científicas con IA en acción
Observe cómo los investigadores crean figuras científicas listas para publicar a partir de descripciones de texto.
Explorar la herramientaUn marco de decisión adaptado a tu salida
Si tu salida va a una revista revisada por pares
- Artículos de química, bioquímica, química orgánica → GPT Image 2 (decisivo, ver Hallazgo 1)
- Física o matemáticas aplicadas con fórmulas, ejes, barras de escala → GPT Image 2 (fidelidad en prompts largos)
- Topología, variedades, geometría abstracta → GPT Image 2 (NBP puede fallar conceptualmente, ver Hallazgo 2)
- Biología celular, vías de señalización, mecanismos moleculares → cualquiera, pero el estilo BioRender de NBP es a veces preferido por los editores de Nature Methods y Cell Reports Methods
- Clínica / anatomía → cualquiera; consulta nuestra galería de ejemplos para salidas comparables y elige por encaje visual
Si tu salida va a un congreso o charla
- Presentación de una charla de 10 minutos → Nano Banana Pro (Hallazgo 3)
- Póster de congreso (tamaño A0 / A1) → Nano Banana Pro a menos que la figura sea crítica en detalle (en cuyo caso GPT Image 2 + limpieza manual en Vector Canvas)
- Reunión de laboratorio / journal club → Nano Banana Pro para claridad, luego itera
Si tu salida va a la web
- Cabecera de Twitter / LinkedIn / blog → Nano Banana Pro (más limpia en miniaturas pequeñas)
- Página principal del laboratorio universitario → Nano Banana Pro
- Imagen de portada de propuesta de subvención → GPT Image 2 si el revisor de la agencia es técnico; Nano Banana Pro si el revisor es de audiencia más amplia
Si no estás seguro
Cree figuras científicas ahora
Describa su figura científica en lenguaje natural — obtenga ilustraciones listas para publicar en minutos.
Probar gratisCinco descubrimientos contraintuitivos
Estos son los hallazgos de nuestro benchmark que contradijeron lo que esperábamos de entrada.
1. El modelo más nuevo y vistoso no es automáticamente mejor
De entrada, esperábamos que GPT Image 2 dominara todo porque es el lanzamiento más nuevo. No lo hizo. Nano Banana Pro ganó de forma rotunda en tres prompts (CRISPR-Cas9, arquitectura Transformer, fotolitografía), y las victorias no estuvieron reñidas. La lección: no asumas que el modelo con el marketing más ruidoso gana en el tipo de figura que realmente necesitas.

GPT Image 2: cada componente etiquetado con alta precisión («Two Linear Layers + ReLU», «Keys, Values from Encoder Output, Query from decoder», codificación posicional «sinusoidal»). Bloques planos 2D. Puntuación 16/20.

Nano Banana Pro: los mismos componentes, pero el codificador/decodificador se renderizan como bloques apilados visualmente en capas (el apilado Nx), las flechas cross-attention K/V/Q trazan del codificador al decodificador explícitamente y la Position Encoding incluso recibe un diminuto icono de forma de onda. La intuición estructural gana aquí. Puntuación 18/20.
2. La fidelidad en prompts largos es una brecha de 13 puntos, no pequeña

GPT Image 2: cascada de señalización completa con intercambio explícito GDP→GTP, etiquetado en dos pasos (1: unión de EGF, 2: dimerización + autofosforilación), los tres factores de transcripción (ELK1 / c-Fos / c-Jun), regiones promotoras (SRE / AP-1 Site), genes diana específicos (Cyclin D1, c-Myc) y una leyenda de color de seis categorías. 100% de fidelidad al prompt.

Nano Banana Pro: misma exactitud científica en la cascada, con un buen detalle anatómico (Complejo del Poro Nuclear mostrado explícitamente), pero faltan la leyenda de color, la clasificación de promotor SRE/AP-1 Site, los genes diana específicos (Cyclin D1, c-Myc) y la anotación del Dominio SH2. 80% de fidelidad al prompt. La misma biología, menos notas al pie.
3. El modelo que «sigue mejor las instrucciones» no es necesariamente el modelo que «se ve mejor»
La mayor puntuación de fidelidad de GPT Image 2 no se traduce en figuras universalmente mejor vistas. Puntuaciones estéticas medias: 4,75 (GPT) vs 4,83 (NBP). Nano Banana Pro superó ligeramente a GPT Image 2 en calidad visual a pesar de aterrizar menos elementos solicitados, porque lo que sí aterrizó se renderizó con más cuidado.
4. Nano Banana Pro puede alucinar el concepto equivocado por completo
5. Ambos modelos pueden producir figuras con calidad de portada de Nature
Nuestra prueba de tectónica de placas puntuó 19/20 para ambos modelos. Los diagramas de sección transversal geológica que salieron —tres tipos de borde lado a lado, distinción litosfera/astenosfera, células de convección del manto, escala vertical de profundidad— se ven como figuras de National Geographic o de publicaciones del USGS. La elección entre los dos para figuras editoriales de gama alta tiene más que ver con preferencia estética que con brecha de capacidad. La prueba del disco de acreción del agujero negro hizo el mismo punto: ambos modelos alcanzaron calidad de imagen de portada en un prompt difícil de astrofísica.

GPT Image 2: nivel de revista de astrofísica: titulado «ROTATING KERR BLACK HOLE», cuatro límites etiquetados (Horizonte de Eventos, Esfera de Fotones 1.5 Rs, ISCO, Ergosfera), gradiente de temperatura del disco de acreción (10⁴ K → 10⁸ K) con leyenda lateral, líneas helicoidales del campo magnético atravesando el jet, flechas de frame-dragging, ejes coordenados de mano derecha, recuadro multi-vista (de frente + de canto), caja de Notas con referencia al mecanismo de Blandford-Znajek.

Nano Banana Pro: misma exactitud científica, mismo gradiente de temperatura codificado por color, espesor del disco de acreción explícitamente notado como proporcional a la temperatura. Ligeramente menos anotaciones (sin sistema de coordenadas, sin recuadro multi-vista, sin etiquetas de campo magnético), pero visualmente lo bastante impactante para aterrizar en una portada de revista. Nota el espacio negativo deliberado que rodea al sujeto: Nano Banana Pro tiende a dejar a la figura espacio para respirar en prompts de astrofísica, en contraste con el encuadre denso en información de GPT Image 2 arriba. Esto en sí mismo es una diferencia de filosofía de composición que vale la pena ver en la misma pantalla.
Cuándo generar desde ambos
Hay tres situaciones en las que ejecutar ambos modelos sobre el mismo prompt es la jugada correcta:
- Figuras de alto impacto. Figura 1 del paper, imagen de portada de propuesta de subvención, diapositiva de defensa de tesis. El coste de generar dos veces son dos rondas de créditos; el coste de elegir el modelo equivocado son días de revisiones o una subvención fallida.
- Conceptos poco familiares o abstractos. Cualquier cosa en topología, matemáticas avanzadas, física fundamental o un dominio del que no estés seguro de que cualquiera de los modelos haya visto mucho dato de entrenamiento. La verificación visual importa.
- Pruebas A/B de estilo. Cuando genuinamente no sabes si tu audiencia prefiere el estilo denso de GPT Image 2 o el editorial de Nano Banana Pro. Genera ambos, muéstraselos a un colega, elige por reacción.
Para el rutinario 80% de las figuras —especificación científica clara, sujeto común, baja ambigüedad— elige un modelo predeterminado basado en el marco de arriba y no malgastes créditos. Para el 20% donde el coste de equivocarse es alto, ejecuta ambos.
Por qué confiamos en este veredicto
Esta guía se basa en un benchmark que ejecutamos específicamente para ella: 12 prompts científicos que abarcan 10 disciplinas, generados a través de Kie.ai (el mismo proveedor de API que SciFig usa en producción), cada uno puntuado en seis dimensiones con rúbricas explícitas y razonamiento registrado. Ambos modelos se probaron el mismo día bajo parámetros idénticos: relación de aspecto 16:9, resolución 2K.
/inspiration?model=gpt-image-2 y /inspiration?model=nano-banana-pro. La matriz completa de puntuación está en el post compañero del benchmark. Si vuelves a ejecutar cualquier prompt y obtienes un resultado distinto, esa es información útil: por favor cuéntanoslo. La transparencia es intencional: las afirmaciones de marketing de OpenAI y Google son inverificables; las pruebas reproducibles cara a cara son la única forma honesta de comparar modelos insignia en 2026.Consejo



