¿Puedo usar GPT Image 2 y Nano Banana Pro dentro de SciFig?

Sí. Ambos modelos son opciones de primer nivel en Texto a Figura y en todas las herramientas imagen a imagen de SciFig. Cambia entre ellos en el selector de modelo antes de generar; el precio es idéntico entre los dos en SciFig porque ambos se acceden a través del mismo contrato upstream con Kie.ai. Consulta Precios para el coste en créditos de cada generación.

¿Qué modelo es más barato a escala?

En SciFig, los dos modelos cuestan el mismo número de créditos por generación, así que el coste no es el diferenciador: lo es la idoneidad de la salida para tu tipo de figura. Si procesas 200+ figuras al mes, ahorrarás más eligiendo el modelo que necesite menos revisiones, no el que tenga una llamada de API ligeramente más barata.

¿Algún modelo produce salida nativa SVG / vectorial?

No. Ambos producen imágenes rasterizadas (PNG por defecto, JPEG opcional). Para salida vectorial de calidad de publicación, genera primero la figura rasterizada y luego pásala por Vector Canvas , que traza y convierte la figura en SVG editable. Este pipeline en dos pasos funciona igual de bien con cualquiera de los modelos.

¿Cómo se compara GPT Image 2 con el Nano Banana original (no Pro)?

Centramos este benchmark en los dos buques insignia específicamente porque comparar buques insignia entre sí es la pregunta que más investigadores hacen en realidad. Para figuras rápidas del día a día donde la velocidad importa más que el detalle, los modelos Nano Banana más pequeños siguen siendo una opción razonable y también están disponibles en SciFig.

¿Pueden estos modelos leer PDFs de artículos científicos como entrada?

No directamente: ningún modelo acepta un PDF como entrada de generación. La herramienta PDF a Figura de SciFig maneja esto extrayendo la descripción de figura relevante del artículo y usándola como prompt para cualquiera de los modelos. La elección entre GPT Image 2 y Nano Banana Pro aplica a ese paso descendente.

¿Las revistas Nature, Cell o Science aceptan figuras generadas por IA con estos modelos?

Las políticas editoriales evolucionan rápido: la respuesta corta en 2026 es «sí, con divulgación». La mayoría de las revistas líderes exigen declarar la generación de figuras asistida por IA en la sección de métodos. Lo seguimos en detalle en ¿Se permiten figuras generadas por IA en las revistas? Una guía de políticas 2026 .

¿Dónde puedo ver las 24 figuras y volver a ejecutar cualquier prompt yo mismo?

La galería completa con prompts copiables está en /inspiration?model=gpt image 2 para las salidas de GPT Image 2 y en /inspiration?model=nano banana pro para las salidas de Nano Banana Pro. Haz clic en cualquier figura para ver el prompt; copia y pega en Texto a Figura para volver a ejecutar.

GPT Image 2 vs Nano Banana Pro: Disciplinas probadas

Name: SciFig
Author: SciFig

Generamos 24 figuras científicas en 10 disciplinas —desde mecanismos de corte CRISPR-Cas9 hasta arquitecturas Transformer, circulación de células de Hadley o topología de la cinta de Möbius— usando GPT Image 2 (el buque insignia de OpenAI) y Nano Banana Pro (la gama alta de Gemini 3 de Google). Cada figura se evaluó en seis dimensiones: fidelidad al prompt, adherencia a instrucciones, exactitud científica, preparación para publicación, legibilidad y calidad estética. El resultado, con los 12 prompts y las 24 salidas brutas publicados para replicación, es la prueba cara a cara más exhaustiva que conocemos sobre ilustración científica con IA en 2026.

GPT Image 2 y Nano Banana Pro a primera vista

Ambos modelos son generadores de imágenes insignia lanzados por sus respectivas matrices a comienzos de 2026. SciFig integra ambos vía Kie.ai, así que con una sola cuenta puedes alternar entre ellos con un clic en Texto a Figura.

Propiedad	GPT Image 2	Nano Banana Pro
Empresa matriz	OpenAI	Google (Gemini 3)
Variantes de modo	Texto a imagen, imagen a imagen	Texto a imagen, imagen a imagen
Relaciones de aspecto	auto, 1:1, 9:16, 16:9, 4:3, 3:4	1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9, auto
Resoluciones	1K, 2K, 4K	1K, 2K, 4K
Pistas de estilo nativas	Ninguna (impulsado por prompt)	Ninguna (impulsado por prompt)
Integración SciFig	`/models/gpt-image-2`	`/models/nano-banana-pro`

Para este benchmark fijamos ambos modelos a relación de aspecto 16:9 a resolución 2K para hacer la comparación visual justa. Los prompts tenían entre 1.100 y 1.800 caracteres cada uno, escritos para imitar a un estudiante de doctorado real informando a un ilustrador con todo el detalle científico: cada receptor, cada quinasa, cada estado de transición explicitado.

GPT Image 2: el buque insignia de OpenAI para figuras con muchos detalles

GPT Image 2 hereda la obsesión por los prompts largos que ha definido a los modelos de texto de OpenAI desde GPT-4. En la práctica, esto significa que el modelo trata cada cláusula de tu prompt como un ítem de checklist, y se esfuerza al máximo por colocarlas todas en la figura final.

Fortalezas

La fidelidad al prompt promedió un 99,2% en nuestras 24 figuras, lo que significa que casi todos los elementos nombrados en un prompt de 1.500 caracteres aparecieron en la salida renderizada.
La notación química es su superpoder silencioso: en la prueba de la reacción SN2 renderizó el símbolo de doble daga ‡ en el estado de transición, etiquetó las configuraciones R y S, dibujó el carbono pentacoordinado con tres hidrógenos en un plano trigonal, incluyó un diagrama de energía completo con Ea etiquetado y añadió una leyenda de cuatro colores que asignaba nucleófilo / grupo saliente / carbono / hidrógeno.
Las fórmulas matemáticas, los ejes coordenados y las barras de escala aparecen de forma consistente: la figura del agujero negro incluyó Rs = 2GM/c², la cinta de Möbius mostró la ecuación paramétrica completa x(u,v) = (1+v/2·cos(u/2))·cos(u), y el experimento de la doble rendija de Young llevó d·sin(θ) = m·λ con el triángulo de diferencia de camino dibujado.

Prueba: mecanismo de sustitución SN2

GPT Image 2: mecanismo de sustitución SN2 con estado de transición de doble daga, carbono pentacoordinado, estereoquímica R/S, diagrama de energía recuadrado y leyenda de cuatro colores por elemento

GPT Image 2: cada convención química renderizada: ‡ en el estado de transición, anotación R/S, carbono pentacoordinado con tres hidrógenos en plano trigonal, diagrama de energía con Ea y una leyenda codificada por color (nucleófilo / grupo saliente / carbono / hidrógeno).

Nano Banana Pro: mecanismo de sustitución SN2 reconocible pero sin doble daga, sin anotación de estereoquímica R-S y sin leyenda de color

Nano Banana Pro: reconocible como SN2, pero faltan la doble daga, la anotación R/S, la etiqueta «pentacoordinado» y la leyenda de color por elemento. La salida es limpia y legible; simplemente no es lo bastante rigurosa en convenciones químicas para revisión por pares.

Prueba: interferencia de doble rendija de Young

GPT Image 2: experimento de interferencia de doble rendija de Young con frentes de onda de Huygens, triángulo recuadrado de diferencia de camino, pantalla de observación a distancia L y ecuación completa d sen theta igual a m lambda

GPT Image 2: tratamiento completo de libro de física: fuente monocromática, construcción de Huygens con frentes de onda circulares, geometría de diferencia de camino recuadrada, patrón de franjas con m = 0, ±1, ±2 etiquetado, fórmula de posición y_m = mλL/d y una clasificación explícita «brillante constructiva» / «oscura destructiva».

Nano Banana Pro: interferencia de doble rendija de Young con frentes de onda de Huygens y ecuación pero faltan algunas etiquetas

Nano Banana Pro: la geometría y la construcción de Huygens son exactas (el triángulo de diferencia de camino se resalta en naranja suave, lo que es visualmente elegante), pero la distancia a la pantalla L, la clasificación constructiva/destructiva y la fórmula de posición se omiten en la figura.

Limitaciones

La densidad de información puede desbordar hacia el desorden. Nuestro panel de prueba CRISPR puntuó 95% en fidelidad al prompt pero solo 3 de 5 en legibilidad: cada etiqueta solicitada estaba presente, solo que demasiado apretada para escanear de un vistazo.
Sin efectos 3D de apilamiento de capas. Los diagramas de arquitectura (como el Transformer) salen planos, con bloques Add & Norm renderizados en 2D en lugar de las pistas de repetición de capas con apariencia 3D que a veces se ven en las salidas de Nano Banana Pro.

Mejores casos de uso científico

Envíos a revistas donde cada etiqueta, ecuación y leyenda debe sobrevivir al escrutinio de revisión por pares
Artículos de química que requieran estereoquímica, estados de transición o diagramas de mecanismos de reacción
Matemáticas abstractas (topología, variedades) donde la fidelidad conceptual pesa más que el impacto visual
Flujos de trabajo de prompts largos (>1.000 caracteres): consulta nuestra guía complementaria sobre Dominar los prompts científicos con IA para estrategias de prompting que funcionan especialmente bien con este modelo

Consejo

Para revistas de nivel Cell, GPT Image 2 emparejado con Vector Canvas para la limpieza final es nuestro pipeline recomendado: detalle pesado entra, SVG pulido sale.

Vea la generación de figuras científicas con IA en acción

Observe cómo los investigadores crean figuras científicas listas para publicar a partir de descripciones de texto.

Explorar la herramienta

Nano Banana Pro: la gama alta de Google para figuras limpias estilo BioRender

Nano Banana Pro es el modelo más fuerte de la familia Gemini 3 de Google para síntesis de imágenes. Donde GPT Image 2 se inclina por la especificación, Nano Banana Pro se inclina por la composición: sus salidas se sienten como si un ilustrador senior hubiera destilado el prompt en una figura editorial limpia.