GPT Image 2 vs Nano Banana Pro: Disciplinas probadas
Comparación en profundidad entre GPT Image 2 y Nano Banana Pro a través de química, biología, física, ingeniería y más.
GPT Image 2 y Nano Banana Pro a primera vista
| Propiedad | GPT Image 2 | Nano Banana Pro |
|---|---|---|
| Empresa matriz | OpenAI | Google (Gemini 3) |
| Variantes de modo | Texto a imagen, imagen a imagen | Texto a imagen, imagen a imagen |
| Relaciones de aspecto | auto, 1:1, 9:16, 16:9, 4:3, 3:4 | 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9, auto |
| Resoluciones | 1K, 2K, 4K | 1K, 2K, 4K |
| Pistas de estilo nativas | Ninguna (impulsado por prompt) | Ninguna (impulsado por prompt) |
| Integración SciFig | /models/gpt-image-2 | /models/nano-banana-pro |
GPT Image 2: el buque insignia de OpenAI para figuras con muchos detalles
GPT Image 2 hereda la obsesión por los prompts largos que ha definido a los modelos de texto de OpenAI desde GPT-4. En la práctica, esto significa que el modelo trata cada cláusula de tu prompt como un ítem de checklist, y se esfuerza al máximo por colocarlas todas en la figura final.
Fortalezas
- La fidelidad al prompt promedió un 99,2% en nuestras 24 figuras, lo que significa que casi todos los elementos nombrados en un prompt de 1.500 caracteres aparecieron en la salida renderizada.
- La notación química es su superpoder silencioso: en la prueba de la reacción SN2 renderizó el símbolo de doble daga
‡en el estado de transición, etiquetó las configuracionesRyS, dibujó el carbono pentacoordinado con tres hidrógenos en un plano trigonal, incluyó un diagrama de energía completo conEaetiquetado y añadió una leyenda de cuatro colores que asignaba nucleófilo / grupo saliente / carbono / hidrógeno. - Las fórmulas matemáticas, los ejes coordenados y las barras de escala aparecen de forma consistente: la figura del agujero negro incluyó
Rs = 2GM/c², la cinta de Möbius mostró la ecuación paramétrica completax(u,v) = (1+v/2·cos(u/2))·cos(u), y el experimento de la doble rendija de Young llevód·sin(θ) = m·λcon el triángulo de diferencia de camino dibujado.

GPT Image 2: cada convención química renderizada: ‡ en el estado de transición, anotación R/S, carbono pentacoordinado con tres hidrógenos en plano trigonal, diagrama de energía con Ea y una leyenda codificada por color (nucleófilo / grupo saliente / carbono / hidrógeno).

Nano Banana Pro: reconocible como SN2, pero faltan la doble daga, la anotación R/S, la etiqueta «pentacoordinado» y la leyenda de color por elemento. La salida es limpia y legible; simplemente no es lo bastante rigurosa en convenciones químicas para revisión por pares.

GPT Image 2: tratamiento completo de libro de física: fuente monocromática, construcción de Huygens con frentes de onda circulares, geometría de diferencia de camino recuadrada, patrón de franjas con m = 0, ±1, ±2 etiquetado, fórmula de posición y_m = mλL/d y una clasificación explícita «brillante constructiva» / «oscura destructiva».

Nano Banana Pro: la geometría y la construcción de Huygens son exactas (el triángulo de diferencia de camino se resalta en naranja suave, lo que es visualmente elegante), pero la distancia a la pantalla L, la clasificación constructiva/destructiva y la fórmula de posición se omiten en la figura.
Limitaciones
- La densidad de información puede desbordar hacia el desorden. Nuestro panel de prueba CRISPR puntuó 95% en fidelidad al prompt pero solo 3 de 5 en legibilidad: cada etiqueta solicitada estaba presente, solo que demasiado apretada para escanear de un vistazo.
- Sin efectos 3D de apilamiento de capas. Los diagramas de arquitectura (como el Transformer) salen planos, con bloques
Add & Normrenderizados en 2D en lugar de las pistas de repetición de capas con apariencia 3D que a veces se ven en las salidas de Nano Banana Pro.
Mejores casos de uso científico
- Envíos a revistas donde cada etiqueta, ecuación y leyenda debe sobrevivir al escrutinio de revisión por pares
- Artículos de química que requieran estereoquímica, estados de transición o diagramas de mecanismos de reacción
- Matemáticas abstractas (topología, variedades) donde la fidelidad conceptual pesa más que el impacto visual
- Flujos de trabajo de prompts largos (>1.000 caracteres): consulta nuestra guía complementaria sobre Dominar los prompts científicos con IA para estrategias de prompting que funcionan especialmente bien con este modelo
Consejo
Vea la generación de figuras científicas con IA en acción
Observe cómo los investigadores crean figuras científicas listas para publicar a partir de descripciones de texto.
Explorar la herramientaNano Banana Pro: la gama alta de Google para figuras limpias estilo BioRender
Nano Banana Pro es el modelo más fuerte de la familia Gemini 3 de Google para síntesis de imágenes. Donde GPT Image 2 se inclina por la especificación, Nano Banana Pro se inclina por la composición: sus salidas se sienten como si un ilustrador senior hubiera destilado el prompt en una figura editorial limpia.
Fortalezas
- La legibilidad promedió 4,67 sobre 5 frente al 4,25 de GPT Image 2. La diferencia es consistente: cada figura tiene más espacio para respirar, etiquetas más grandes y menos apilamiento visual.
- El refinamiento estético está en lo más alto de su clase para la estética de ilustración científica al estilo BioRender. El diagrama de arquitectura de microservicios capturó el topic de Kafka, el patrón sidecar y la pila de observabilidad con eventos de negocio anotados (
Order Created,Payment Processed), convirtiendo una arquitectura estática en un diagrama casi narrativo. - La visualización de apilamiento de capas es genuinamente mejor. En nuestra prueba Transformer renderizó el
Encoder Stack (Nx)y elDecoder Stack (Nx)como bloques apilados visualmente en capas, con flechas explícitasK,V,Qtrazando el camino de cross-attention de codificador a decodificador, un nivel de intuición estructural al que la salida de GPT Image 2 no llegó del todo. - Las figuras de flujos de proceso se benefician de una elección de diseño de doble panel que el modelo hace con frecuencia: en la prueba de fotolitografía dibujó arriba una «vista detallada» y abajo una «sección transversal simplificada» para cada uno de los seis pasos, que es como los libros de texto del IEEE presentan en realidad los procesos semiconductores.

GPT Image 2: referencia técnica rica en proveedores: API Gateway etiquetado «Kong / Envoy», Auth etiquetado «Keycloak», Istio Service Mesh envolviendo los cinco servicios con sidecars Envoy explícitos, Kafka mostrado con cuatro particiones y la pila de observabilidad dividida en Loki / Prometheus / Jaeger con una leyenda lateral.

Nano Banana Pro: añade una capa narrativa creativa: en lugar de etiquetar la cola de mensajes simplemente como «Kafka Topics», anota los eventos de negocio reales que fluyen por ella (Order Created, Order Updated, Payment Processed, Update Inventory, Send Notification). La arquitectura pasa de diagrama estático a una figura casi narrativa.

GPT Image 2: secuencia de 6 paneles en una sola fila con apilamiento de capas consistente (Si / SiO₂ / fotorresist) en todas las etapas. Compacto y claro, pero solo una vista de sección transversal por paso.

Nano Banana Pro: los mismos 6 pasos pero cada uno renderizado como doble panel: vista detallada arriba, sección transversal simplificada abajo. Así es como los libros de texto del IEEE presentan en realidad la fotolitografía. Detalles extra como símbolos de vapor de agua durante el soft-bake y etiquetas «regiones expuestas (más solubles)» hacen de esta salida la figura de ingeniería con mayor puntuación de nuestro benchmark (19/20).
Limitaciones
- La fidelidad al prompt promedió un 86,1%, unos 13 puntos porcentuales por detrás de GPT Image 2. Específicamente, tiende a omitir etiquetas opcionales, leyendas de clave de color y anotaciones numéricas explícitas cuando el prompt es largo.
- El rigor químico es su área más débil. En la prueba SN2 omitió el marcador de doble daga del estado de transición, la anotación de estereoquímica
R/S, la leyenda de cuatro colores por elemento y la etiqueta explícita «estado de transición pentacoordinado», todas cosas que GPT Image 2 incluyó. - La topología 3D abstracta puede fallar. Nuestra prueba de la cinta de Möbius es el ejemplo más llamativo: Nano Banana Pro renderizó la figura principal como un cilindro orientable plano (sin medio giro) y solo incluyó la cinta de Möbius real en un pequeño recuadro: un error conceptual lo bastante grave como para inducir a error a un estudiante. GPT Image 2 acertó al primer intento.

GPT Image 2: una cinta de Möbius 3D creíble con el medio giro claramente visible. Los marcadores de hormiga roja en «inicio» y «tras 180°» demuestran la unilateralidad; el borde se renderiza como una única curva continua. El cilindro está en el recuadro de la esquina para comparar, con anotaciones «dos bordes distintos» y «superficie de dos caras». Puntuación: 20/20.

Nano Banana Pro: la figura principal es un cilindro orientable ordinario, no una cinta de Möbius. La cinta de Möbius real está reducida a un diminuto recuadro de esquina. Es un error conceptual lo bastante grave como para inducir a error a cualquier estudiante que lea la figura. Puntuación: 11/20, nuestra segunda mayor brecha en un solo prompt.
Mejores casos de uso científico
- Pósteres de congreso, presentaciones y materiales docentes donde la legibilidad gana a la anotación densa
- Diagramas de mecanismos biológicos (vías de señalización, cartoons de mecanismos) donde la simplicidad estilo BioRender es la convención del género
- Figuras de arquitectura de ML/CS donde el apilamiento de capas y las flechas de flujo de datos importan
- Figuras de flujos de proceso donde la presentación de doble panel «detalle + simplificado» ayuda a la comprensión
Cara a cara: 10 disciplinas, 24 figuras
Antes de la tabla, esta es la única prueba que terminó en empate: ambos buques insignia alcanzaron calidad de portada de Nature en el mismo prompt:

GPT Image 2: tres tipos de borde lado a lado con fuerte profundidad volumétrica, gradiente de temperatura litosfera/astenosfera, células de convección del manto. Estilo National Geographic / USGS. Puntuación: 19/20.

Nano Banana Pro: misma exactitud científica en los tres tipos de borde, con un nivel adicional de detalle ecológico (biología de fuentes hidrotermales, chimeneas de sulfuro) y anotación explícita «Zona de Deshidratación de Losa». Espaciado de etiquetas más limpio. Puntuación: 19/20.
Ejecutamos 12 prompts en 10 disciplinas, generamos cada uno a 16:9 / 2K con ambos modelos y puntuamos cada salida. A continuación está el resultado completo. Las puntuaciones subjetivas están en escala 1-5 por dimensión; el total es la suma de cuatro dimensiones subjetivas (máximo 20).
| Prompt | Disciplina | Fidelidad GPT Image 2 | Fidelidad NBP | Total GPT Image 2 | Total NBP | Ganador |
|---|---|---|---|---|---|---|
| Señalización EGFR / RAS / MAPK | Biomédica | 100% | 80% | 19 | 18 | GPT Image 2 |
| Corte CRISPR-Cas9 | Biomédica | 95% | 98% | 15 | 18 | Nano Banana Pro |
| Arquitectura Transformer | CS | 100% | 95% | 16 | 18 | Nano Banana Pro |
| Arquitectura de microservicios | CS | 100% | 85% | 19 | 18 | GPT Image 2 |
| Sustitución SN2 | Química | 100% | 70% | 20 | 15 | GPT Image 2 (decisivo) |
| Doble rendija de Young | Física | 100% | 75% | 19 | 18 | GPT Image 2 |
| Proceso de fotolitografía | Ingeniería | 95% | 100% | 17 | 19 | Nano Banana Pro |
| Sección transversal de tectónica de placas | Ciencias de la Tierra | 100% | 95% | 19 | 19 | Empate |
| Topología de cinta de Möbius | Matemáticas | 100% | 80% | 20 | 11 | GPT Image 2 (error de renderizado de NBP) |
| Disco de acreción de agujero negro | Astronomía | 100% | 80% | 19 | 18 | GPT Image 2 |
| Red trófica de bosque | Ecología | 100% | 90% | 19 | 18 | GPT Image 2 |
| Hipocampo / LTP | Neurociencia | 100% | 85% | 19 | 18 | GPT Image 2 |
/inspiration?model=gpt-image-2 y /inspiration?model=nano-banana-pro. Cada figura en esas páginas se generó para este benchmark: puedes copiar el prompt y volver a ejecutar cualquiera de los modelos tú mismo.Cree figuras científicas ahora
Describa su figura científica en lenguaje natural — obtenga ilustraciones listas para publicar en minutos.
Probar gratisCinco hallazgos que se generalizan
1. La fidelidad en prompts largos es la ventaja distintiva de GPT Image 2
Cuando comparamos la longitud media del prompt (1.400 caracteres) frente a la brecha de fidelidad (13,1 puntos porcentuales), el patrón fue consistente: cuanto más largo y específico el prompt, más elementos tendía Nano Banana Pro a omitir. Esto no es un efecto pequeño: en 12 prompts, GPT Image 2 acertó el 99,2% de los elementos nombrados mientras que Nano Banana Pro acertó el 86,1%.

GPT Image 2: cada especie nombrada en el prompt de 1.600 caracteres aterrizó: roble, arce, helechos, hierba, flores silvestres, musgos (productores); ciervo de cola blanca, liebre americana, ardilla gris, ratón de campo, oruga, abeja, escarabajo de la hoja (herbívoros); zorro rojo, búho cornudo, culebra rayada, ave canora (curruca), musaraña (mesodepredadores); lobo gris, halcón de cola roja, oso negro (ápice). Descomponedores en una columna derecha separada con hongos en repisa / lombrices / bacterias. La leyenda de transferencia de energía (100% → 10% → 1% → 0,1%) está intacta.

Nano Banana Pro: mismos cuatro niveles tróficos, misma escala kcal/m²/año, todas las especies reconocibles. Pero omitió la distinción hongos en repisa / bacterias, omitió la leyenda de porcentaje de transferencia de energía y solo etiquetó «lombriz» en lugar de la columna completa de descomponedores. Captó las pinceladas amplias; perdió las notas al pie de calidad de libro de texto.
2. La notación química es el foso silencioso de GPT Image 2
La prueba del mecanismo SN2 produjo nuestra mayor brecha en un solo prompt (20 vs 15). GPT Image 2 renderizó cada convención química estándar: doble daga, enlaces parciales, estereoquímica R/S, geometría pentacoordinada, diagrama de energía, leyenda de elemento codificada por color. Nano Banana Pro produjo un mecanismo reconocible, pero omitió la doble daga, la anotación de estereoquímica y no dibujó la leyenda.
3. La topología 3D abstracta puede romper a Nano Banana Pro
4. La simplicidad estilo BioRender es el terreno de Nano Banana Pro
Tres de las victorias del modelo (CRISPR-Cas9, Transformer, fotolitografía) comparten un patrón común: el prompt premia la simplificación. CRISPR es un mecanismo de 4 pasos: el visual limpio paso a paso de Nano Banana Pro ganó frente a la versión más densa de GPT Image 2. Transformer es un diagrama estructural: el renderizado de capas apiladas de Nano Banana Pro capturó mejor la intuición de la arquitectura.

GPT Image 2: cada elemento solicitado está presente: Cas9 con dominios HNH y RuvC, sgRNA con secuencia objetivo complementaria de 20 nt, PAM (5'-NGG-3') resaltado, formación de R-loop, ruptura de doble cadena roma «3 nt aguas arriba del PAM» y ambas vías de reparación NHEJ y HDR. Puntuación: 15/20: la menor legibilidad lo perjudicó porque cada etiqueta está empaquetada en un renderizado 3D denso.

Nano Banana Pro: la misma estructura de 4 pasos, la misma exactitud científica, pero la ilustración plana estilo BioRender deja mucho más espacio para respirar. Cada paso tiene un único elemento focal. La rama NHEJ «indels para knockout génico» (tachado en rojo) y la rama HDR «inserción de plantilla donante para corrección génica» (marca verde) son visualmente decisivas. Puntuación: 18/20: el ganador por convención del género.
5. El compromiso entre densidad de información y legibilidad es el hallazgo más profundo
Las puntuaciones medias en 24 figuras revelan dos perfiles consistentes:
- GPT Image 2: mayor fidelidad al prompt (99,2%), mayor preparación para publicación (4,58), menor legibilidad (4,25)
- Nano Banana Pro: menor fidelidad al prompt (86,1%), menor preparación para publicación (3,92), mayor legibilidad (4,67), puntuación estética más alta (4,83)
Ambas son filosofías válidas de diseño de figuras, y se mapean a dos usos finales diferentes. GPT Image 2 está construido para la figura que vive junto a prosa densa en un artículo de revista. Nano Banana Pro está construido para la figura que tiene que comunicar por sí sola a 4 metros de distancia en un auditorio de congreso.

GPT Image 2: título «Circuito Trisináptico del Hipocampo», anatomía a la izquierda con especificidad EC Capa II / V-VI de entrada/salida, circuito de cuatro pasos numerado (Vía Perforante → Fibras Musgosas → Colaterales de Schaffer → Vía de Salida), mecanismo LTP ampliado a la derecha con «Potencial de Membrana en Reposo ~ -70 mV» explícito, cuatro explicaciones moleculares en viñetas, leyenda de color en la esquina. Densidad de información en su pico.

Nano Banana Pro: misma anatomía, mismo circuito, mismo mecanismo LTP. Pero cada región es grande, las etiquetas están espaciadas y el ojo tiene tiempo de seguir el flujo de datos. Los cuerpos celulares de neurona piramidal y las dendritas apicales reciben representación visual explícita. El compromiso es la especificidad de capa EC (Capa II vs V-VI) y el potencial de reposo de -70 mV: ambos omitidos. Resultado: el mismo contenido, distinta experiencia para el lector.
Veredicto: ¿Cuál deberías elegir?
Usa el árbol de decisión de abajo para casos límite. Distintos trabajos científicos tienen distinto modelo óptimo: empareja tu tipo de figura con uno de los cuatro destinos de salida comunes (revista revisada por pares, congreso, web o «no estoy seguro»), luego desciende a la subregla para tu disciplina o género de figura específicos.
- Envío a revista (Cell, Nature, Science, PNAS)
- Química / estereoquímica / mecanismo de reacción → GPT Image 2 (decisivo)
- Matemáticas abstractas / topología / variedades → GPT Image 2 (NBP puede fallar conceptualmente)
- Prompt largo, denso, con muchas etiquetas → GPT Image 2
- Mecanismo biológico en convención de género estilo BioRender → Nano Banana Pro es aceptable, a veces preferido
- Presentación / póster de congreso / material docente
- Por defecto → Nano Banana Pro (ventaja en legibilidad + estética)
- Arquitectura ML / CS → Nano Banana Pro (visual de apilamiento de capas más fuerte)
- Flujo de proceso con múltiples pasos → Nano Banana Pro (diseño de doble panel)
- Figura para blog o redes sociales
- Por defecto → Nano Banana Pro (más limpia, scrollea mejor)
- Figura calidad portada (portada de revista de gama alta, estilo National Geographic)
- Cualquier modelo funciona; consulta nuestra galería de ejemplos para ver salidas comparables y elegir por encaje estético
- No estás seguro
- SciFig soporta ambos: simplemente genera desde cada uno, lado a lado, y elige el ganador. Así trabaja un ilustrador humano real, después de todo.
Detrás de la metodología
Probamos 12 prompts científicos que abarcan 10 disciplinas, fijados a relación de aspecto 16:9 y resolución 2K, generados directamente a través de la API de Kie.ai (el mismo proveedor de API que alimenta el stack de producción de SciFig). Cada prompt tenía entre 1.100 y 1.800 caracteres de especificación científica detallada: receptores, quinasas, ecuaciones, dominios nombrados, preferencias de color. Calificamos cada salida en seis dimensiones: dos objetivas (fidelidad al prompt, adherencia a instrucciones) y cuatro subjetivas con rúbricas explícitas (exactitud científica, preparación para publicación, legibilidad, calidad estética). Para cada puntuación subjetiva registramos el razonamiento, de modo que la evaluación es reproducible por un lector externo.
/inspiration?model=gpt-image-2 y /inspiration?model=nano-banana-pro. Si vuelves a ejecutar cualquier prompt y obtienes un resultado distinto, queremos saberlo: así es como mejora con el tiempo este tipo de evaluación.


