GPT Image 2 vs Nano Banana Pro: Quale vince?
Confronto diretto tra GPT Image 2 e Nano Banana Pro per la generazione di figure scientifiche — qualità, velocità e costo.
La vera domanda dietro "quale è migliore"
Prima delle scoperte, il foglio riassuntivo per cosa è costruita ogni ammiraglia:
| Aspetto | GPT Image 2 | Nano Banana Pro |
|---|---|---|
| Casa madre | OpenAI | Google (Gemini 3) |
| Costruito per | Figure dense di dettagli con specifiche rigorose | Figure in stile editoriale con focus sulla composizione |
| Vince su | Rigore chimico, formule matematiche, topologia astratta, fedeltà al prompt lungo | Leggibilità, raffinamento estetico, diagrammi strutturali (CS / processo / meccanismo) |
| Perde su | La densità informativa può creare confusione | La fedeltà al prompt lungo cala di 13 pt su specifiche complesse; rari errori di rendering concettuale |
| Default per | Sottomissione a riviste | Slide / poster / web |
| In SciFig | /models/gpt-image-2 | /models/nano-banana-pro |
Tre scoperte decisive (e perché probabilmente si applicano a voi)
Abbiamo estratto tre scoperte dal benchmark di 24 figure che dovrebbero cambiare quale modello scegliete come predefinito. Sono decisive nel senso che il gap di punteggio è abbastanza grande che lanciare una moneta sarebbe sbagliato.
Scoperta 1: i paper di chimica dovrebbero usare GPT Image 2 (nemmeno vicino)
‡ sullo stato di transizione, ha etichettato le configurazioni stereochimiche R e S su reagente e prodotto, ha renderizzato il carbonio pentacoordinato con tre idrogeni piatti nel piano trigonale, ha incluso un diagramma energetico completo in inset con Ea energia di attivazione etichettata e ha aggiunto una legenda a quattro colori che identifica nucleofilo / gruppo uscente / carbonio / idrogeno.
GPT Image 2 — ogni convenzione chimica standard renderizzata. Punteggio 20/20.

Nano Banana Pro — meccanismo riconoscibile ma il doppio dagger, la stereochimica R/S e la legenda dei colori degli elementi sono tutti mancanti. Punteggio 15/20 — il nostro più grande gap su singolo prompt.
Scoperta 2: la topologia astratta 3D può rompere Nano Banana Pro
Questo è stato il singolo risultato più sorprendente del nostro benchmark. Il prompt chiedeva un nastro di Möbius renderizzato in 3D con un mezzo-twist, accanto a un piccolo inset che lo confrontasse con un cilindro orientabile regolare. GPT Image 2 ha consegnato esattamente quello: un credibile nastro di Möbius 3D nella figura principale, un piccolo cilindro nell'angolo etichettato "cilindro orientabile, due bordi distinti, superficie bilatera", oltre all'equazione parametrica completa renderizzata come blocco matematico.

GPT Image 2 — credibile nastro di Möbius 3D con il mezzo-twist chiaramente visibile. Il cilindro è nell'inset d'angolo, esattamente come chiedeva il prompt.

Nano Banana Pro — la figura principale è un cilindro semplice, non un nastro di Möbius. Il vero nastro di Möbius è rimpicciolito in un minuscolo inset d'angolo. Fallimento di rendering concettuale.
Scoperta 3: slide e poster di conferenze dovrebbero predefinire Nano Banana Pro
Il caso più chiaro è stato la figura del processo di fotolitografia: Nano Banana Pro ha fatto una scelta compositiva creativa che non avevamo chiesto, dividendo ognuno dei 6 passaggi del processo in un pannello "vista dettagliata" sopra e un pannello "sezione trasversale semplificata" sotto — esattamente il modo in cui i libri di testo IEEE presentano i processi dei semiconduttori. Il risultato è stata la figura ingegneristica con il punteggio più alto nel benchmark (19/20).

GPT Image 2 — sequenza a singola riga di 6 pannelli, compatto e chiaro. Punteggio 17/20.

Nano Banana Pro — stessi 6 passaggi ma ognuno renderizzato come doppio pannello: vista dettagliata in alto, sezione trasversale semplificata in basso. È così che i libri di testo IEEE presentano effettivamente la fotolitografia. Punteggio 19/20 — la nostra figura ingegneristica con il punteggio più alto.
Vedi la generazione di figure scientifiche IA in azione
Osserva come i ricercatori creano figure scientifiche pronte per la pubblicazione da descrizioni testuali.
Esplora lo strumentoUn framework decisionale su misura per il vostro output
Se il vostro output è diretto a una rivista con peer review
- Paper di chimica, biochimica, chimica organica → GPT Image 2 (decisivo, vedi Scoperta 1)
- Fisica o matematica applicata con formule, assi, barre di scala → GPT Image 2 (fedeltà al prompt lungo)
- Topologia, varietà, geometria astratta → GPT Image 2 (NBP può fallire concettualmente, vedi Scoperta 2)
- Biologia cellulare, vie di segnalazione, meccanismi molecolari → uno qualsiasi, ma lo stile BioRender di NBP è talvolta preferito dagli editor di Nature Methods e Cell Reports Methods
- Clinico / anatomia → uno qualsiasi; controllate la nostra galleria esempi per output comparabili e scegliete per adattamento visivo
Se il vostro output è diretto a una conferenza o talk
- Serie di slide per un talk di 10 minuti → Nano Banana Pro (Scoperta 3)
- Poster di conferenza (formato A0 / A1) → Nano Banana Pro a meno che la figura non sia critica per il dettaglio (nel qual caso GPT Image 2 + pulizia manuale in Vector Canvas)
- Riunione di laboratorio / journal club → Nano Banana Pro per chiarezza, poi iterate
Se il vostro output va sul web
- Twitter / LinkedIn / header di blog post → Nano Banana Pro (più pulito a dimensioni di miniatura piccole)
- Homepage di laboratorio universitario → Nano Banana Pro
- Immagine di copertina di proposta di grant → GPT Image 2 se il revisore dell'agenzia è tecnico; Nano Banana Pro se il revisore è un pubblico più ampio
Se non sei sicuro
Crea figure scientifiche ora
Descrivi la tua figura scientifica in linguaggio naturale — ottieni illustrazioni pronte per la pubblicazione in pochi minuti.
Prova gratisCinque scoperte controintuitive
Queste sono le scoperte del nostro benchmark che hanno contraddetto ciò che ci aspettavamo all'inizio.
1. Il modello più nuovo e appariscente non è automaticamente migliore
All'inizio, ci aspettavamo che GPT Image 2 dominasse tutto perché è la release più recente. Non l'ha fatto. Nano Banana Pro ha vinto a tutto tondo su tre prompt (CRISPR-Cas9, architettura Transformer, fotolitografia) — e le vittorie non sono state strette. La lezione: non assumete che il modello con il marketing più rumoroso vinca sul tipo di figura di cui avete effettivamente bisogno.

GPT Image 2 — ogni componente etichettato con alta precisione ("Two Linear Layers + ReLU", "Keys, Values from Encoder Output, Query from decoder", "sinusoidale" Positional Encoding). Blocchi 2D piatti. Punteggio 16/20.

Nano Banana Pro — stessi componenti, ma encoder/decoder sono renderizzati come blocchi a livelli visivamente impilati (lo stacking Nx), le frecce K/V/Q di cross-attention tracciano da encoder a decoder esplicitamente e Position Encoding ottiene persino una piccola icona a forma d'onda. L'intuizione strutturale vince qui. Punteggio 18/20.
2. La fedeltà al prompt lungo è un gap di 13 punti, non piccolo

GPT Image 2 — cascata di segnalazione completa con scambio esplicito GDP→GTP, etichettatura a due passaggi (1: legame EGF, 2: dimerizzazione + autofosforilazione), tutti e tre i fattori di trascrizione (ELK1 / c-Fos / c-Jun), regioni promotrici (SRE / AP-1 Site), geni bersaglio specifici (Cyclin D1, c-Myc) e una legenda dei colori a sei categorie. 100% di fedeltà al prompt.

Nano Banana Pro — stessa accuratezza scientifica sulla cascata, con un bel dettaglio anatomico (Complesso del Poro Nucleare mostrato esplicitamente), ma manca la legenda dei colori, la classificazione del promotore SRE/AP-1 Site, i geni bersaglio specifici (Cyclin D1, c-Myc) e l'annotazione del Dominio SH2. 80% di fedeltà al prompt. Stessa biologia — meno note a piè di pagina.
3. Il modello che "segue meglio le istruzioni" non è necessariamente il modello che "appare meglio"
Il punteggio di fedeltà più alto di GPT Image 2 non si traduce in figure universalmente più belle. Punteggi estetici medi: 4,75 (GPT) vs 4,83 (NBP). Nano Banana Pro ha leggermente superato GPT Image 2 sulla qualità visiva nonostante centrasse meno degli elementi richiesti — perché ciò che ha centrato è stato renderizzato con più cura.
4. Nano Banana Pro può allucinare interamente il concetto sbagliato
5. Entrambi i modelli possono produrre figure di qualità da copertina di Nature
Il nostro test sulla tettonica delle placche ha ottenuto 19/20 per entrambi i modelli. I diagrammi di sezione trasversale geologica che sono usciti — tre tipi di confine fianco a fianco, distinzione litosfera/astenosfera, celle convettive del mantello, scala di profondità verticale — sembrano figure di pubblicazioni di National Geographic o USGS. La scelta tra i due per figure editoriali di alta gamma è più una questione di preferenza estetica che di gap di capacità. Il test del disco di accrescimento del buco nero ha fatto lo stesso punto — entrambi i modelli hanno raggiunto la qualità di immagine da copertina su un difficile prompt astrofisico.

GPT Image 2 — livello da rivista astrofisica: titolato "BUCO NERO ROTANTE DI KERR", quattro confini etichettati (Orizzonte degli Eventi, Sfera dei Fotoni 1.5 Rs, ISCO, Ergosfera), gradiente di temperatura del disco di accrescimento (10⁴ K → 10⁸ K) con una legenda laterale, linee di campo magnetico elicoidali che attraversano il getto, frecce di frame-dragging, assi di coordinate destrorsi, inset multi-vista (face-on + edge-on), riquadro Note con riferimento al meccanismo di Blandford-Znajek.

Nano Banana Pro — stessa accuratezza scientifica, stesso gradiente di temperatura codificato dal colore, spessore del disco di accrescimento esplicitamente notato come proporzionale alla temperatura. Leggermente meno annotazioni (nessun sistema di coordinate, nessun inset multi-vista, nessuna etichetta di campo magnetico), ma visivamente abbastanza sorprendente da finire sulla copertina di una rivista. Notate lo spazio negativo deliberato che circonda il soggetto — Nano Banana Pro tende a lasciare alla figura spazio per respirare nei prompt astrofisici, in contrasto con la cornice densa di informazioni di GPT Image 2 sopra. Questa è di per sé una differenza di filosofia compositiva che vale la pena vedere sullo stesso schermo.
Quando generare da entrambi
Ci sono tre situazioni in cui eseguire entrambi i modelli sullo stesso prompt è la mossa giusta:
- Figure ad alto rischio. Figura 1 del paper, immagine di copertina della proposta di grant, slide di difesa di tesi. Il costo di generare due volte è due cicli di crediti; il costo di scegliere il modello sbagliato è giorni di revisioni o un grant fallito.
- Concetti non familiari o astratti. Qualsiasi cosa in topologia, matematica avanzata, fisica fondamentale o un dominio per cui non siete sicuri che entrambi i modelli abbiano visto molti dati di addestramento. La verifica visiva conta.
- Test A/B di stile. Quando genuinamente non sapete se il vostro pubblico preferisce lo stile denso di GPT Image 2 o lo stile editoriale di Nano Banana Pro. Generate entrambi, mostrateli a un collega, scegliete in base alla reazione.
Per l'80% di routine delle figure — chiara specificazione scientifica, soggetto comune, bassa ambiguità — scegliete un modello predefinito basato sul framework sopra e non sprecate crediti. Per il 20% in cui il costo di sbagliare è alto, eseguite entrambi.
Perché ci fidiamo di questo verdetto
Questa guida si fonda su un benchmark che abbiamo eseguito specificamente per essa: 12 prompt scientifici che spaziano in 10 discipline, generati attraverso Kie.ai (lo stesso fornitore API che SciFig usa in produzione), ognuno valutato su sei dimensioni con rubriche esplicite e ragionamento registrato. Entrambi i modelli sono stati testati lo stesso giorno con parametri identici: rapporto di aspetto 16:9, risoluzione 2K.
/inspiration?model=gpt-image-2 e /inspiration?model=nano-banana-pro. La matrice di scoring completa è nel post benchmark companion. Se eseguite di nuovo qualsiasi prompt e ottenete un risultato diverso, è un'informazione utile — per favore, fatecelo sapere. La trasparenza è intenzionale: le affermazioni di marketing di OpenAI e Google sono inverificabili; il test riproducibile fianco a fianco è l'unico modo onesto di confrontare i modelli ammiraglia nel 2026.Suggerimento



