GPT Image 2 vs Nano Banana Pro: Discipline testate
Confronto approfondito tra GPT Image 2 e Nano Banana Pro attraverso chimica, biologia, fisica, ingegneria e altro.
GPT Image 2 e Nano Banana Pro a colpo d'occhio
| Proprietà | GPT Image 2 | Nano Banana Pro |
|---|---|---|
| Azienda madre | OpenAI | Google (Gemini 3) |
| Varianti di modalità | Text-to-image, image-to-image | Text-to-image, image-to-image |
| Rapporti di aspetto | auto, 1:1, 9:16, 16:9, 4:3, 3:4 | 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9, auto |
| Risoluzioni | 1K, 2K, 4K | 1K, 2K, 4K |
| Hint di stile nativi | Nessuno (guidato dal prompt) | Nessuno (guidato dal prompt) |
| Integrazione SciFig | /models/gpt-image-2 | /models/nano-banana-pro |
GPT Image 2: l'ammiraglia di OpenAI per figure ricche di dettagli
GPT Image 2 eredita l'ossessione per i prompt lunghi che ha definito i modelli testuali di OpenAI da GPT-4. In pratica, questo significa che il modello tratta ogni clausola del vostro prompt come voce di una checklist — e si impegna a fondo per centrarle tutte nella figura finale.
Punti di forza
- La fedeltà al prompt ha raggiunto in media il 99,2% sulle nostre 24 figure, il che significa che quasi ogni elemento nominato in un prompt da 1.500 caratteri è apparso nell'output renderizzato.
- La notazione chimica è il suo superpotere silenzioso: nel test della reazione SN2 ha renderizzato il simbolo del doppio dagger
‡sullo stato di transizione, ha etichettato le configurazioniReS, ha disegnato il carbonio pentacoordinato con tre idrogeni in un piano trigonale, ha incluso un diagramma energetico completo in inset conEaetichettato e ha aggiunto una legenda a quattro colori che mappa nucleofilo / gruppo uscente / carbonio / idrogeno. - Formule matematiche, assi coordinati e barre di scala appaiono in modo coerente — la figura del buco nero includeva
Rs = 2GM/c², il nastro di Möbius mostrava l'equazione parametrica completax(u,v) = (1+v/2·cos(u/2))·cos(u), e l'esperimento della doppia fenditura di Young portavad·sin(θ) = m·λcon il triangolo della differenza di cammino disegnato.

GPT Image 2 — ogni convenzione chimica renderizzata: ‡ sullo stato di transizione, annotazione R/S, carbonio pentacoordinato con tre idrogeni nel piano trigonale, diagramma energetico con Ea e una legenda a colori (nucleofilo / gruppo uscente / carbonio / idrogeno).

Nano Banana Pro — riconoscibile come SN2 ma il doppio dagger, l'annotazione R/S, l'etichetta "pentacoordinato" e la legenda dei colori degli elementi sono tutti mancanti. L'output è pulito e leggibile; semplicemente non è ferreo sulle convenzioni chimiche per la peer review.

GPT Image 2 — trattamento completo da libro di testo di fisica: sorgente monocromatica, costruzione di Huygens con fronti d'onda circolari, inset di geometria della differenza di cammino, pattern delle frange con m = 0, ±1, ±2 etichettato, formula della posizione y_m = mλL/d e una classificazione esplicita "luminoso costruttivo" / "scuro distruttivo".

Nano Banana Pro — la geometria e la costruzione di Huygens sono accurate (il triangolo della differenza di cammino è evidenziato in arancione tenue, visivamente elegante), ma la distanza dello schermo L, la classificazione costruttiva/distruttiva e la formula della posizione sono escluse dalla figura.
Limitazioni
- La densità informativa può sfociare in confusione. Il nostro pannello di test CRISPR ha ottenuto il 95% sulla fedeltà al prompt ma solo 3 su 5 sulla leggibilità — ogni etichetta richiesta era presente, solo troppo compressa per essere scansionata a colpo d'occhio.
- Nessun effetto di impilamento di livelli 3D. I diagrammi di architettura (come il Transformer) escono piatti, con i blocchi
Add & Normrenderizzati in 2D anziché con gli indizi di ripetizione di livelli dall'aspetto 3D che a volte si vedono negli output di Nano Banana Pro.
Migliori casi d'uso scientifici
- Sottomissioni a riviste in cui ogni etichetta, equazione e legenda deve sopravvivere allo scrutinio della peer review
- Paper di chimica che richiedono stereochimica, stati di transizione o diagrammi di meccanismi di reazione
- Matematica astratta (topologia, varietà) dove la fedeltà concettuale supera l'impatto visivo
- Flussi di lavoro a prompt lungo (>1.000 caratteri) — consultate la nostra guida companion su Padroneggiare i prompt scientifici per l'IA per strategie di prompt che funzionano particolarmente bene con questo modello
Suggerimento
Vedi la generazione di figure scientifiche IA in azione
Osserva come i ricercatori creano figure scientifiche pronte per la pubblicazione da descrizioni testuali.
Esplora lo strumentoNano Banana Pro: il top di gamma di Google per figure pulite in stile BioRender
Nano Banana Pro è il modello più forte della famiglia Gemini 3 di Google per la sintesi di immagini. Mentre GPT Image 2 si concentra sulla specificazione, Nano Banana Pro si concentra sulla composizione — i suoi output sembrano distillati da un illustratore senior che ha sintetizzato il prompt in una figura editoriale pulita.
Punti di forza
- La leggibilità ha raggiunto in media 4,67 su 5 rispetto al 4,25 di GPT Image 2. La differenza è coerente: ogni figura ha più respiro, etichette più grandi e meno impilamento visivo.
- Il raffinamento estetico è il migliore della categoria per l'estetica dell'illustrazione scientifica in stile BioRender. Il diagramma di architettura a microservizi ha catturato il topic Kafka, il pattern sidecar e lo stack di osservabilità con eventi business annotati (
Order Created,Payment Processed) — trasformando un'architettura statica in un diagramma quasi narrativo. - La visualizzazione dello stacking dei livelli è genuinamente migliore. Nel nostro test Transformer ha renderizzato l'
Encoder Stack (Nx)e ilDecoder Stack (Nx)come blocchi a livelli visivamente impilati, con frecce espliciteK,V,Qche tracciano il percorso di cross-attention dall'encoder al decoder — un livello di intuizione strutturale che l'output di GPT Image 2 non ha del tutto raggiunto. - Le figure di flusso di processo beneficiano di una scelta di design a doppio pannello che il modello fa frequentemente: nel test di fotolitografia ha disegnato una "vista dettagliata" in alto e una "sezione trasversale semplificata" in basso per ognuno dei sei passaggi, che è il modo in cui i libri di testo IEEE presentano effettivamente i processi dei semiconduttori.

GPT Image 2 — riferimento tecnico ricco di vendor: API Gateway etichettato "Kong / Envoy", Auth etichettato "Keycloak", Istio Service Mesh che avvolge tutti e cinque i servizi con sidecar Envoy espliciti, Kafka mostrato con quattro partizioni e lo stack di osservabilità diviso in Loki / Prometheus / Jaeger con una legenda laterale.

Nano Banana Pro — aggiunge un livello narrativo creativo: invece di etichettare semplicemente la coda dei messaggi "Kafka Topics", annota gli eventi business effettivi che vi scorrono attraverso (Order Created, Order Updated, Payment Processed, Update Inventory, Send Notification). L'architettura passa da diagramma statico a figura quasi narrativa.

GPT Image 2 — sequenza a singola riga di 6 pannelli con stacking di livelli coerente (Si / SiO₂ / fotoresist) in tutte le fasi. Compatto e chiaro, ma una sola vista in sezione trasversale per passaggio.

Nano Banana Pro — stessi 6 passaggi ma ognuno renderizzato come doppio pannello: vista dettagliata in alto, sezione trasversale semplificata in basso. È così che i libri di testo IEEE presentano effettivamente la fotolitografia. Dettagli bonus come simboli di vapore acqueo durante il soft-bake e etichette "regioni esposte (più solubili)" rendono questo output la figura ingegneristica con il punteggio più alto nel nostro benchmark (19/20).
Limitazioni
- La fedeltà al prompt ha raggiunto in media l'86,1% — circa 13 punti percentuali dietro GPT Image 2. Specificamente, tende a far cadere etichette opzionali, legende di chiavi colore e annotazioni numeriche esplicite quando il prompt è lungo.
- Il rigore chimico è la sua area più debole. Nel test SN2 ha omesso il marcatore di stato di transizione a doppio dagger, l'annotazione di stereochimica
R/S, la legenda a quattro colori degli elementi e l'etichetta esplicita "stato di transizione pentacoordinato" — tutte cose che GPT Image 2 ha incluso. - La topologia astratta 3D può fallire. Il nostro test del nastro di Möbius è l'esempio più sorprendente: Nano Banana Pro ha renderizzato la figura principale come un cilindro orientabile semplice (senza mezzo-twist) e ha incluso il vero nastro di Möbius solo in un piccolo inset — un errore concettuale abbastanza grave da fuorviare uno studente lettore. GPT Image 2 ha azzeccato questo al primo tentativo.

GPT Image 2 — un nastro di Möbius 3D credibile con il mezzo-twist chiaramente visibile. Marcatori formica rossa a "inizio" e "dopo 180°" dimostrano l'unilateralità; il bordo è renderizzato come una singola curva continua. Il cilindro è nell'inset d'angolo per confronto, con annotazioni "due bordi distinti" e "superficie bilatera". Punteggio: 20/20.

Nano Banana Pro — la figura principale è un cilindro orientabile ordinario, non un nastro di Möbius. Il vero nastro di Möbius è rimpicciolito in un minuscolo inset d'angolo. Questo è un errore concettuale abbastanza grave da fuorviare qualsiasi studente che legga la figura. Punteggio: 11/20 — il nostro secondo gap più grande su singolo prompt.
Migliori casi d'uso scientifici
- Poster di conferenza, slide e materiali didattici dove la leggibilità batte l'annotazione densa
- Diagrammi di meccanismi biologici (vie di segnalazione, cartoon di meccanismi) dove la semplicità in stile BioRender è la convenzione del genere
- Figure di architettura ML/CS dove lo stacking di livelli e le frecce di flusso dati contano
- Figure di flusso di processo dove la presentazione "dettaglio + semplificato" a doppio pannello aiuta la comprensione
Testa a testa: 10 discipline, 24 figure
Prima della tabella, ecco l'unico test che si è concluso in pareggio — entrambe le ammiraglie hanno raggiunto la qualità da copertina di Nature sullo stesso prompt:

GPT Image 2 — tre tipi di confine fianco a fianco con forte profondità volumetrica, gradiente di temperatura litosfera/astenosfera, celle convettive del mantello. Stile National Geographic / USGS. Punteggio: 19/20.

Nano Banana Pro — stessa accuratezza scientifica sui tre tipi di confine, con un livello bonus di dettaglio ecologico (biologia delle bocche idrotermali, camini di solfuri) e annotazione esplicita "Zona di disidratazione della slab". Spaziatura delle etichette più pulita. Punteggio: 19/20.
Abbiamo eseguito 12 prompt in 10 discipline, generato ciascuno a 16:9 / 2K con entrambi i modelli e valutato ogni output. Di seguito il risultato completo. I punteggi soggettivi sono su una scala 1–5 per dimensione; il totale è la somma di quattro dimensioni soggettive (max 20).
| Prompt | Disciplina | Fedeltà GPT Image 2 | Fedeltà NBP | Totale GPT Image 2 | Totale NBP | Vincitore |
|---|---|---|---|---|---|---|
| Segnalazione EGFR / RAS / MAPK | Biomedica | 100% | 80% | 19 | 18 | GPT Image 2 |
| Taglio CRISPR-Cas9 | Biomedica | 95% | 98% | 15 | 18 | Nano Banana Pro |
| Architettura Transformer | CS | 100% | 95% | 16 | 18 | Nano Banana Pro |
| Architettura a microservizi | CS | 100% | 85% | 19 | 18 | GPT Image 2 |
| Sostituzione SN2 | Chimica | 100% | 70% | 20 | 15 | GPT Image 2 (decisivo) |
| Doppia fenditura di Young | Fisica | 100% | 75% | 19 | 18 | GPT Image 2 |
| Processo di fotolitografia | Ingegneria | 95% | 100% | 17 | 19 | Nano Banana Pro |
| Sezione trasversale tettonica | Scienze della Terra | 100% | 95% | 19 | 19 | Pareggio |
| Topologia nastro di Möbius | Matematica | 100% | 80% | 20 | 11 | GPT Image 2 (errore di rendering NBP) |
| Disco di accrescimento di buco nero | Astronomia | 100% | 80% | 19 | 18 | GPT Image 2 |
| Rete trofica forestale | Ecologia | 100% | 90% | 19 | 18 | GPT Image 2 |
| Ippocampo / LTP | Neuroscienze | 100% | 85% | 19 | 18 | GPT Image 2 |
/inspiration?model=gpt-image-2 e /inspiration?model=nano-banana-pro. Ogni figura su quelle pagine è stata generata per questo benchmark — potete copiare il prompt ed eseguire nuovamente entrambi i modelli voi stessi.Crea figure scientifiche ora
Descrivi la tua figura scientifica in linguaggio naturale — ottieni illustrazioni pronte per la pubblicazione in pochi minuti.
Prova gratisCinque scoperte che si generalizzano
1. La fedeltà al prompt lungo è il vantaggio distintivo di GPT Image 2
Quando abbiamo confrontato la lunghezza media del prompt (1.400 caratteri) con il gap di fedeltà (13,1 punti percentuali), il pattern era coerente: più lungo e specifico era il prompt, più elementi Nano Banana Pro tendeva a far cadere. Non è un effetto piccolo — su 12 prompt, GPT Image 2 ha centrato il 99,2% degli elementi nominati mentre Nano Banana Pro l'86,1%.

GPT Image 2 — ogni specie nominata nel prompt da 1.600 caratteri è atterrata: quercia, acero, felci, erba, fiori selvatici, muschi (produttori); cervo dalla coda bianca, lepre delle nevi, scoiattolo grigio, topo di campagna, bruco, ape, scarabeo delle foglie (erbivori); volpe rossa, gufo cornuto, biscia giarrettiera, uccello canoro (silvia), toporagno (mesopredatori); lupo grigio, falco dalla coda rossa, orso nero (apice). Decompositori in una colonna destra separata con funghi a mensola / lombrichi / batteri. La legenda di trasferimento di energia (100% → 10% → 1% → 0,1%) è intatta.

Nano Banana Pro — stessi quattro livelli trofici, stessa scala kcal/m²/anno, tutte le specie riconoscibili. Ma ha lasciato cadere la distinzione funghi a mensola / batteri, ha lasciato cadere la legenda della percentuale di trasferimento di energia e ha etichettato solo "lombrico" anziché la colonna completa dei decompositori. Ha colto i tratti generali; ha mancato le note a piè di pagina di livello da libro di testo.
2. La notazione chimica è il fossato silenzioso di GPT Image 2
Il test del meccanismo SN2 ha prodotto il nostro più grande gap su singolo prompt (20 vs 15). GPT Image 2 ha renderizzato ogni convenzione chimica standard — doppio dagger, legami parziali, stereochimica R/S, geometria pentacoordinata, diagramma energetico, legenda degli elementi a colori. Nano Banana Pro ha prodotto un meccanismo riconoscibile, ma ha mancato il doppio dagger, omesso l'annotazione della stereochimica e non ha disegnato la legenda.
3. La topologia astratta 3D può rompere Nano Banana Pro
4. La semplicità in stile BioRender è il terreno di casa di Nano Banana Pro
Tre delle vittorie del modello (CRISPR-Cas9, Transformer, fotolitografia) condividono un pattern comune: il prompt premia la semplificazione. CRISPR è un meccanismo a 4 passaggi — il visivo passo-passo pulito di Nano Banana Pro ha vinto sulla versione più densa di GPT Image 2. Transformer è un diagramma strutturale — il rendering a livelli impilati di Nano Banana Pro ha catturato meglio l'intuizione architetturale.

GPT Image 2 — ogni elemento richiesto è presente: Cas9 con domini HNH e RuvC, sgRNA con sequenza target-complementare di 20 nt, PAM (5'-NGG-3') evidenziato, formazione dell'R-loop, taglio a doppio filamento blunt "3 nt a monte del PAM" e entrambe le vie di riparazione NHEJ e HDR. Punteggio: 15/20 — la leggibilità più bassa lo ha penalizzato perché ogni etichetta è impacchettata in un denso rendering 3D.

Nano Banana Pro — stessa struttura a 4 passaggi, stessa accuratezza scientifica, ma l'illustrazione piatta in stile BioRender lascia molto più respiro. Ogni passaggio ha un singolo elemento focale. Il ramo NHEJ "indels per knockout genico" (barrato rosso) e il ramo HDR "inserzione di template donatore per correzione genica" (segno di spunta verde) sono visivamente decisivi. Punteggio: 18/20 — il vincitore della convenzione del genere.
5. Il trade-off densità informativa / leggibilità è la scoperta più profonda
I punteggi medi su 24 figure espongono due profili coerenti:
- GPT Image 2: maggiore fedeltà al prompt (99,2%), maggiore prontezza alla pubblicazione (4,58), minore leggibilità (4,25)
- Nano Banana Pro: minore fedeltà al prompt (86,1%), minore prontezza alla pubblicazione (3,92), maggiore leggibilità (4,67), punteggio estetico più alto (4,83)
Entrambe sono filosofie valide di design delle figure — e si mappano su due usi finali diversi. GPT Image 2 è costruito per la figura che vive accanto a una prosa densa in un articolo di rivista. Nano Banana Pro è costruito per la figura che deve comunicare da sola a 4 metri di distanza in una sala conferenze.

GPT Image 2 — titolo "Circuito trisinaptico ippocampale", anatomia a sinistra con specificità di input/output EC Layer II / V-VI, circuito a quattro passaggi numerato (Via Perforante → Fibre Muschiate → Collaterali di Schaffer → Via di Output), meccanismo LTP ingrandito a destra con esplicito "Potenziale di Membrana a Riposo ~ -70 mV", quattro spiegazioni molecolari in punti elenco, legenda dei colori nell'angolo. Densità informativa al suo apice.

Nano Banana Pro — stessa anatomia, stesso circuito, stesso meccanismo LTP. Ma ogni regione è grande, le etichette sono spaziate e l'occhio ha tempo di seguire il flusso dei dati. I corpi cellulari dei neuroni piramidali e i dendriti apicali ottengono una rappresentazione visiva esplicita. Il trade-off è la specificità del layer EC (Layer II vs V-VI) e il potenziale a riposo di -70 mV — entrambi caduti. Risultato: stesso contenuto, esperienza del lettore diversa.
Verdetto: quale dovreste scegliere?
Usate l'albero decisionale qui sotto per i casi limite. Lavori scientifici diversi hanno modelli ottimali diversi — abbinate il vostro tipo di figura a una delle quattro destinazioni di output comuni (rivista con peer review, conferenza, web o "non sono sicuro"), poi approfondite la sotto-regola per la vostra disciplina o genere di figura specifici.
- Sottomissione a rivista (Cell, Nature, Science, PNAS)
- Chimica / stereochimica / meccanismo di reazione → GPT Image 2 (decisivo)
- Matematica astratta / topologia / varietà → GPT Image 2 (NBP può fallire concettualmente)
- Prompt lungo, denso, ricco di etichette → GPT Image 2
- Meccanismo biologico nella convenzione del genere stile BioRender → Nano Banana Pro è accettabile, talvolta preferito
- Slide / poster di conferenza / materiale didattico
- Default → Nano Banana Pro (vantaggio di leggibilità + estetica)
- Architettura ML / CS → Nano Banana Pro (visivo di stacking di livelli più forte)
- Flusso di processo con più passaggi → Nano Banana Pro (design a doppio pannello)
- Figura per blog o social media
- Default → Nano Banana Pro (più pulita, scorre meglio)
- Figura di qualità da copertina (copertina di rivista di alta gamma, stile National Geographic)
- Funziona uno qualsiasi dei due modelli; controllate la nostra galleria esempi per vedere output comparabili e scegliere per adattamento estetico
- Non sei sicuro
- SciFig supporta entrambi — basta generare da ognuno, fianco a fianco, e scegliere il vincitore. Comunque, è così che lavora un illustratore umano reale.
Dietro la metodologia
Abbiamo testato 12 prompt scientifici che spaziano in 10 discipline, bloccati al rapporto di aspetto 16:9 e alla risoluzione 2K, generati attraverso l'API Kie.ai direttamente (lo stesso fornitore API che alimenta lo stack di produzione di SciFig). Ogni prompt era di 1.100–1.800 caratteri di specificazione scientifica dettagliata — recettori, chinasi, equazioni, domini nominati, preferenze di colore. Abbiamo valutato ogni output su sei dimensioni: due oggettive (fedeltà al prompt, aderenza alle istruzioni) e quattro soggettive con rubriche esplicite (accuratezza scientifica, prontezza alla pubblicazione, leggibilità, qualità estetica). Per ogni punteggio soggettivo abbiamo registrato il ragionamento, in modo che la valutazione sia riproducibile da un lettore esterno.
/inspiration?model=gpt-image-2 e /inspiration?model=nano-banana-pro. Se eseguite di nuovo qualsiasi prompt e ottenete un risultato diverso, vogliamo saperlo — è così che questo tipo di valutazione migliora nel tempo.


