Posso usare sia GPT Image 2 sia Nano Banana Pro all'interno di SciFig?

Sì. Entrambi i modelli sono opzioni di prima classe in Text to Figure e attraverso gli strumenti image to image di SciFig. Passate dall'uno all'altro nel selettore di modelli prima di generare; il prezzo è identico tra i due su SciFig perché entrambi sono accessibili attraverso lo stesso contratto upstream Kie.ai. Consultate Pricing per il costo in crediti di ogni generazione.

Quale modello è più economico da usare su larga scala?

Su SciFig, i due modelli costano lo stesso numero di crediti per generazione, quindi il costo non è il differenziatore — l'idoneità dell'output al vostro tipo di figura lo è. Se eseguite batch di 200+ figure al mese, risparmierete di più scegliendo il modello che richiede meno revisioni, non quello con una chiamata API leggermente più economica.

Uno dei due modelli produce output SVG / vettoriale nativo?

No. Entrambi producono immagini raster (PNG di default, JPEG opzionalmente). Per output vettoriale di livello da pubblicazione, generate prima la figura raster, poi fatela passare attraverso Vector Canvas , che traccia e converte la figura in SVG modificabile. Questa pipeline a due passaggi funziona altrettanto bene con uno qualsiasi dei due modelli.

Come si confronta GPT Image 2 con il Nano Banana originale (non Pro)?

Abbiamo concentrato questo benchmark sui due ammiraglia specificamente perché confrontare gli ammiraglia tra loro è la domanda che la maggior parte dei ricercatori fa effettivamente. Per figure rapide quotidiane dove la velocità conta più del dettaglio, i modelli Nano Banana più piccoli sono ancora una scelta ragionevole e sono anche disponibili in SciFig.

Questi modelli possono leggere PDF di paper scientifici come input?

Non direttamente — nessuno dei due modelli accetta un PDF come input di generazione. Lo strumento PDF to Figure di SciFig gestisce questo estraendo la descrizione della figura rilevante dal paper e usandola come prompt per uno dei due modelli. La scelta tra GPT Image 2 e Nano Banana Pro si applica a quel passaggio a valle.

Le figure generate da IA da questi modelli sono accettate da Nature, Cell o Science?

Le policy editoriali stanno evolvendo rapidamente — la risposta breve nel 2026 è "sì, con disclosure". La maggior parte delle riviste leader richiede di dichiarare la generazione di figure assistita da IA nella sezione metodi. Lo tracciamo in dettaglio in Le figure generate da IA sono permesse nelle riviste? Una guida alle policy 2026 .

Dove posso vedere tutte le 24 figure ed eseguire di nuovo qualsiasi prompt da solo?

La galleria completa con prompt copiabili è su /inspiration?model=gpt image 2 per gli output di GPT Image 2 e /inspiration?model=nano banana pro per gli output di Nano Banana Pro. Cliccate qualsiasi figura per vedere il prompt; copiate e incollate in Text to Figure per eseguire di nuovo.

GPT Image 2 vs Nano Banana Pro: Discipline testate

Name: SciFig
Author: SciFig

Abbiamo generato 24 figure scientifiche in 10 discipline — dai meccanismi di taglio CRISPR-Cas9 alle architetture Transformer, dalla circolazione delle celle di Hadley alla topologia del nastro di Möbius — usando GPT Image 2 (l'ammiraglia di OpenAI) e Nano Banana Pro (il top di gamma di Gemini 3 di Google). Ogni figura è stata valutata su sei dimensioni: fedeltà al prompt, aderenza alle istruzioni, accuratezza scientifica, prontezza alla pubblicazione, leggibilità e qualità estetica. Il risultato, con tutti i 12 prompt e i 24 output grezzi pubblicati per la replicazione, è il test testa a testa più approfondito che conosciamo per l'illustrazione scientifica con IA nel 2026.

GPT Image 2 e Nano Banana Pro a colpo d'occhio

Entrambi i modelli sono generatori di immagini di punta rilasciati dalle rispettive aziende madri all'inizio del 2026. SciFig integra entrambi tramite Kie.ai, quindi un singolo account vi permette di passare dall'uno all'altro con un clic in Text-to-Figure.

Proprietà	GPT Image 2	Nano Banana Pro
Azienda madre	OpenAI	Google (Gemini 3)
Varianti di modalità	Text-to-image, image-to-image	Text-to-image, image-to-image
Rapporti di aspetto	auto, 1:1, 9:16, 16:9, 4:3, 3:4	1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9, auto
Risoluzioni	1K, 2K, 4K	1K, 2K, 4K
Hint di stile nativi	Nessuno (guidato dal prompt)	Nessuno (guidato dal prompt)
Integrazione SciFig	`/models/gpt-image-2`	`/models/nano-banana-pro`

Per questo benchmark abbiamo bloccato entrambi i modelli su rapporto di aspetto 16:9 a risoluzione 2K per rendere equo il confronto visivo. I prompt erano di 1.100–1.800 caratteri ciascuno, scritti per simulare uno studente di dottorato reale che istruisce un illustratore con pieno dettaglio scientifico — ogni recettore, ogni chinasi, ogni stato di transizione esplicitato.

GPT Image 2: l'ammiraglia di OpenAI per figure ricche di dettagli

GPT Image 2 eredita l'ossessione per i prompt lunghi che ha definito i modelli testuali di OpenAI da GPT-4. In pratica, questo significa che il modello tratta ogni clausola del vostro prompt come voce di una checklist — e si impegna a fondo per centrarle tutte nella figura finale.

Punti di forza

La fedeltà al prompt ha raggiunto in media il 99,2% sulle nostre 24 figure, il che significa che quasi ogni elemento nominato in un prompt da 1.500 caratteri è apparso nell'output renderizzato.
La notazione chimica è il suo superpotere silenzioso: nel test della reazione SN2 ha renderizzato il simbolo del doppio dagger ‡ sullo stato di transizione, ha etichettato le configurazioni R e S, ha disegnato il carbonio pentacoordinato con tre idrogeni in un piano trigonale, ha incluso un diagramma energetico completo in inset con Ea etichettato e ha aggiunto una legenda a quattro colori che mappa nucleofilo / gruppo uscente / carbonio / idrogeno.
Formule matematiche, assi coordinati e barre di scala appaiono in modo coerente — la figura del buco nero includeva Rs = 2GM/c², il nastro di Möbius mostrava l'equazione parametrica completa x(u,v) = (1+v/2·cos(u/2))·cos(u), e l'esperimento della doppia fenditura di Young portava d·sin(θ) = m·λ con il triangolo della differenza di cammino disegnato.

Test: meccanismo di sostituzione SN2

GPT Image 2: meccanismo di sostituzione SN2 con stato di transizione a doppio dagger, carbonio pentacoordinato, stereochimica R/S, inset di diagramma energetico e legenda a quattro colori per gli elementi

GPT Image 2 — ogni convenzione chimica renderizzata: ‡ sullo stato di transizione, annotazione R/S, carbonio pentacoordinato con tre idrogeni nel piano trigonale, diagramma energetico con Ea e una legenda a colori (nucleofilo / gruppo uscente / carbonio / idrogeno).

Nano Banana Pro: meccanismo di sostituzione SN2 riconoscibile ma privo del doppio dagger, dell'annotazione di stereochimica R-S e della legenda dei colori

Nano Banana Pro — riconoscibile come SN2 ma il doppio dagger, l'annotazione R/S, l'etichetta "pentacoordinato" e la legenda dei colori degli elementi sono tutti mancanti. L'output è pulito e leggibile; semplicemente non è ferreo sulle convenzioni chimiche per la peer review.

Test: interferenza della doppia fenditura di Young

GPT Image 2: esperimento di interferenza della doppia fenditura di Young con fronti d'onda di Huygens, inset del triangolo della differenza di cammino, schermo di osservazione a distanza L ed equazione completa d sen theta uguale a m lambda

GPT Image 2 — trattamento completo da libro di testo di fisica: sorgente monocromatica, costruzione di Huygens con fronti d'onda circolari, inset di geometria della differenza di cammino, pattern delle frange con m = 0, ±1, ±2 etichettato, formula della posizione y_m = mλL/d e una classificazione esplicita "luminoso costruttivo" / "scuro distruttivo".

Nano Banana Pro: interferenza della doppia fenditura di Young con fronti d'onda di Huygens ed equazione ma con alcune etichette mancanti

Nano Banana Pro — la geometria e la costruzione di Huygens sono accurate (il triangolo della differenza di cammino è evidenziato in arancione tenue, visivamente elegante), ma la distanza dello schermo L, la classificazione costruttiva/distruttiva e la formula della posizione sono escluse dalla figura.

Limitazioni

La densità informativa può sfociare in confusione. Il nostro pannello di test CRISPR ha ottenuto il 95% sulla fedeltà al prompt ma solo 3 su 5 sulla leggibilità — ogni etichetta richiesta era presente, solo troppo compressa per essere scansionata a colpo d'occhio.
Nessun effetto di impilamento di livelli 3D. I diagrammi di architettura (come il Transformer) escono piatti, con i blocchi Add & Norm renderizzati in 2D anziché con gli indizi di ripetizione di livelli dall'aspetto 3D che a volte si vedono negli output di Nano Banana Pro.

Migliori casi d'uso scientifici

Sottomissioni a riviste in cui ogni etichetta, equazione e legenda deve sopravvivere allo scrutinio della peer review
Paper di chimica che richiedono stereochimica, stati di transizione o diagrammi di meccanismi di reazione
Matematica astratta (topologia, varietà) dove la fedeltà concettuale supera l'impatto visivo
Flussi di lavoro a prompt lungo (>1.000 caratteri) — consultate la nostra guida companion su Padroneggiare i prompt scientifici per l'IA per strategie di prompt che funzionano particolarmente bene con questo modello

Suggerimento

Per le riviste di livello Cell, GPT Image 2 abbinato a Vector Canvas per la pulizia finale è la nostra pipeline raccomandata — dettaglio pesante in ingresso, SVG rifinito in uscita.

Vedi la generazione di figure scientifiche IA in azione

Osserva come i ricercatori creano figure scientifiche pronte per la pubblicazione da descrizioni testuali.

Esplora lo strumento

Nano Banana Pro: il top di gamma di Google per figure pulite in stile BioRender

Nano Banana Pro è il modello più forte della famiglia Gemini 3 di Google per la sintesi di immagini. Mentre GPT Image 2 si concentra sulla specificazione, Nano Banana Pro si concentra sulla composizione — i suoi output sembrano distillati da un illustratore senior che ha sintetizzato il prompt in una figura editoriale pulita.