GPT Image 2 vs Nano Banana Pro : Disciplines testées
Comparaison approfondie entre GPT Image 2 et Nano Banana Pro à travers chimie, biologie, physique, ingénierie et plus.
GPT Image 2 et Nano Banana Pro en un coup d'œil
| Propriété | GPT Image 2 | Nano Banana Pro |
|---|---|---|
| Société mère | OpenAI | Google (Gemini 3) |
| Variantes de mode | Texte-vers-image, image-vers-image | Texte-vers-image, image-vers-image |
| Ratios d'aspect | auto, 1:1, 9:16, 16:9, 4:3, 3:4 | 1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9, auto |
| Résolutions | 1K, 2K, 4K | 1K, 2K, 4K |
| Indices de style natifs | Aucun (piloté par le prompt) | Aucun (piloté par le prompt) |
| Intégration SciFig | /models/gpt-image-2 | /models/nano-banana-pro |
GPT Image 2 : le modèle phare d'OpenAI pour les figures riches en détails
GPT Image 2 hérite de l'obsession des prompts longs qui définit les modèles de texte d'OpenAI depuis GPT-4. En pratique, cela signifie que le modèle traite chaque clause de votre prompt comme un élément de checklist — et qu'il s'efforce de toutes les faire apparaître dans la figure finale.
Forces
- La fidélité au prompt s'est élevée en moyenne à 99,2 % sur nos 24 figures, ce qui signifie que presque chaque élément nommé dans un prompt de 1 500 caractères apparaît dans la sortie rendue.
- La notation chimique est son super-pouvoir discret : dans le test de réaction SN2, il a rendu le symbole double-dague
‡sur l'état de transition, étiqueté les configurationsRetS, dessiné le carbone pentacoordonné avec trois hydrogènes dans un plan trigonal, inclus un diagramme énergétique complet en encart avecEaétiqueté, et ajouté une légende quatre couleurs cartographiant nucléophile / groupe partant / carbone / hydrogène. - Les formules mathématiques, les axes de coordonnées et les barres d'échelle apparaissent de manière constante — la figure du trou noir incluait
Rs = 2GM/c², le ruban de Möbius montrait l'équation paramétrique complètex(u,v) = (1+v/2·cos(u/2))·cos(u), et l'expérience des fentes d'Young portaitd·sin(θ) = m·λavec le triangle de différence de chemin tracé.

GPT Image 2 — toutes les conventions chimiques rendues : ‡ sur l'état de transition, annotation R/S, carbone pentacoordonné avec trois hydrogènes en plan trigonal, diagramme énergétique avec Ea, et légende codée par couleur (nucléophile / groupe partant / carbone / hydrogène).

Nano Banana Pro — reconnaissable comme SN2 mais la double-dague, l'annotation R/S, l'étiquette « pentacoordonné » et la légende de couleur des éléments sont toutes manquantes. La sortie est nette et lisible ; elle n'est juste pas rigoureuse en termes de conventions chimiques pour la revue par les pairs.

GPT Image 2 — traitement complet de manuel de physique : source monochromatique, construction de Huygens avec fronts d'onde circulaires, géométrie en encart de différence de chemin, motif de franges avec m = 0, ±1, ±2 étiqueté, formule de position y_m = mλL/d, et classification explicite « constructive brillante » / « destructive sombre ».

Nano Banana Pro — la géométrie et la construction de Huygens sont exactes (le triangle de différence de chemin est mis en évidence en orange doux, ce qui est visuellement élégant), mais la distance à l'écran L, la classification constructive/destructive et la formule de position sont absentes de la figure.
Limitations
- La densité d'information peut déborder en encombrement. Notre panneau test CRISPR a obtenu 95 % en fidélité au prompt mais seulement 3 sur 5 en lisibilité — chaque étiquette demandée était présente, juste trop serrée pour être scannée d'un coup d'œil.
- Pas d'effets d'empilement de couches 3D. Les diagrammes d'architecture (comme le Transformer) ressortent plats, avec les blocs
Add & Normrendus en 2D plutôt que les indices de répétition de couche d'apparence 3D que l'on voit parfois dans les sorties Nano Banana Pro.
Meilleurs cas d'usage scientifiques
- Soumissions à des revues où chaque étiquette, équation et légende doit survivre à l'examen par les pairs
- Articles de chimie nécessitant des diagrammes de stéréochimie, d'états de transition ou de mécanisme de réaction
- Mathématiques abstraites (topologie, variétés) où la fidélité conceptuelle l'emporte sur l'impact visuel
- Flux de travail à prompts longs (>1 000 caractères) — voir notre guide compagnon sur Maîtriser les prompts scientifiques IA pour des stratégies de prompt qui fonctionnent particulièrement bien avec ce modèle
Astuce
Voyez la génération de figures scientifiques par IA en action
Observez comment les chercheurs créent des figures scientifiques prêtes à publier à partir de descriptions textuelles.
Explorer l'outilNano Banana Pro : le haut de gamme de Google pour les figures propres de style BioRender
Nano Banana Pro est le modèle le plus puissant de la famille Gemini 3 de Google pour la synthèse d'images. Là où GPT Image 2 mise sur la spécification, Nano Banana Pro mise sur la composition — ses sorties donnent l'impression qu'un illustrateur senior a distillé le prompt en une figure éditoriale propre.
Forces
- La lisibilité s'est élevée en moyenne à 4,67 sur 5 contre 4,25 pour GPT Image 2. La différence est constante : chaque figure a plus d'espace pour respirer, des étiquettes plus grandes et moins d'empilement visuel.
- Le raffinement esthétique est le meilleur de sa catégorie pour l'esthétique d'illustration scientifique de style BioRender. Le diagramme d'architecture microservices a capturé le sujet Kafka, le pattern sidecar et la pile d'observabilité avec des événements métier annotés (
Order Created,Payment Processed) — transformant une architecture statique en un diagramme quasi narratif. - La visualisation d'empilement de couches est véritablement meilleure. Dans notre test Transformer, il a rendu l'
Encoder Stack (Nx)et leDecoder Stack (Nx)comme des blocs de couches visuellement empilés, avec des flèchesK,V,Qexplicites traçant le chemin de cross-attention de l'encodeur au décodeur — un niveau d'intuition structurelle que la sortie de GPT Image 2 n'a pas tout à fait atteint. - Les figures de flux de travail de processus bénéficient d'un choix de conception en double panneau que le modèle fait fréquemment : dans le test de photolithographie, il a dessiné une « vue détaillée » en haut et une « coupe simplifiée » en bas pour chacune des six étapes, ce qui correspond à la manière dont les manuels IEEE présentent réellement les processus de semi-conducteurs.

GPT Image 2 — référence technique riche en fournisseurs : API Gateway étiqueté « Kong / Envoy », Auth étiqueté « Keycloak », Istio Service Mesh enveloppant les cinq services avec des sidecars Envoy explicites, Kafka montré avec quatre partitions, et la pile d'observabilité divisée en Loki / Prometheus / Jaeger avec une légende latérale.

Nano Banana Pro — ajoute une couche narrative créative : au lieu de simplement étiqueter la file de messages « Kafka Topics », il annote les événements métier réels qui y transitent (Order Created, Order Updated, Payment Processed, Update Inventory, Send Notification). L'architecture passe d'un diagramme statique à une figure quasi narrative.

GPT Image 2 — séquence de 6 panneaux sur une seule rangée avec empilement de couches cohérent (Si / SiO₂ / photoresist) à toutes les étapes. Compact et clair, mais une seule vue en coupe par étape.

Nano Banana Pro — mêmes 6 étapes mais chacune rendue en double panneau : vue détaillée en haut, coupe simplifiée en bas. C'est ainsi que les manuels IEEE présentent réellement la photolithographie. Des détails bonus comme les symboles de vapeur d'eau pendant le soft-bake et les étiquettes « régions exposées (plus solubles) » font de cette sortie la figure d'ingénierie la mieux notée de notre benchmark (19/20).
Limitations
- La fidélité au prompt s'est élevée en moyenne à 86,1 % — soit environ 13 points de pourcentage en deçà de GPT Image 2. Spécifiquement, il tend à omettre les étiquettes optionnelles, les légendes de codes couleur et les annotations numériques explicites lorsque le prompt est long.
- La rigueur chimique est sa zone la plus faible. Dans le test SN2, il a omis le marqueur d'état de transition double-dague, l'annotation de stéréochimie
R/S, la légende d'éléments à quatre couleurs et l'étiquette explicite « état de transition pentacoordonné » — tout ce que GPT Image 2 incluait. - La topologie 3D abstraite peut échouer. Notre test du ruban de Möbius est l'exemple le plus frappant : Nano Banana Pro a rendu la figure principale comme un cylindre orientable simple (sans demi-tour) et n'a inclus le véritable ruban de Möbius que dans un petit encart — une erreur conceptuelle assez grave pour induire un étudiant en erreur. GPT Image 2 a réussi cela du premier coup.

GPT Image 2 — un ruban de Möbius 3D crédible avec le demi-tour clairement visible. Les marqueurs de fourmi rouge à « start » et « after 180° » démontrent le caractère unilatéral ; la frontière est rendue comme une seule courbe continue. Le cylindre est dans l'encart en coin pour comparaison, avec les annotations « two distinct edges » et « two-sided surface ». Score : 20/20.

Nano Banana Pro — la figure principale est un cylindre orientable ordinaire, pas un ruban de Möbius. Le véritable ruban de Möbius est rétréci dans un minuscule encart en coin. C'est une erreur conceptuelle assez grave pour induire en erreur tout étudiant lisant la figure. Score : 11/20 — notre deuxième plus grand écart sur un seul prompt.
Meilleurs cas d'usage scientifiques
- Posters de conférence, présentations et matériel pédagogique où la lisibilité l'emporte sur l'annotation dense
- Diagrammes de mécanismes biologiques (voies de signalisation, dessins de mécanismes) où la simplicité de style BioRender est la convention du genre
- Figures d'architecture ML/CS où l'empilement de couches et les flèches de flux de données importent
- Figures de flux de travail de processus où la présentation à double panneau « détail + simplifié » aide à la compréhension
Face à face : 10 disciplines, 24 figures
Avant le tableau, voici le seul test qui s'est terminé par une égalité — les deux phares ont atteint la qualité couverture Nature sur le même prompt :

GPT Image 2 — trois types de frontières côte à côte avec une forte profondeur volumétrique, gradient de température lithosphère/asthénosphère, cellules de convection mantellique. Style National Geographic / USGS. Score : 19/20.

Nano Banana Pro — même exactitude scientifique sur les trois types de frontières, avec un niveau bonus de détail écologique (biologie des cheminées hydrothermales, cheminées de sulfure) et annotation explicite « Slab Dehydration Zone ». Espacement d'étiquettes plus net. Score : 19/20.
Nous avons exécuté 12 prompts dans 10 disciplines, généré chacun en 16:9 / 2K avec les deux modèles, et noté chaque sortie. Ci-dessous le résultat complet. Les scores subjectifs sont sur une échelle de 1 à 5 par dimension ; le total est la somme de quatre dimensions subjectives (max 20).
| Prompt | Discipline | Fidélité GPT Image 2 | Fidélité NBP | Total GPT Image 2 | Total NBP | Gagnant |
|---|---|---|---|---|---|---|
| Signalisation EGFR / RAS / MAPK | Biomédical | 100 % | 80 % | 19 | 18 | GPT Image 2 |
| Coupe CRISPR-Cas9 | Biomédical | 95 % | 98 % | 15 | 18 | Nano Banana Pro |
| Architecture Transformer | CS | 100 % | 95 % | 16 | 18 | Nano Banana Pro |
| Architecture microservices | CS | 100 % | 85 % | 19 | 18 | GPT Image 2 |
| Substitution SN2 | Chimie | 100 % | 70 % | 20 | 15 | GPT Image 2 (décisif) |
| Fentes d'Young | Physique | 100 % | 75 % | 19 | 18 | GPT Image 2 |
| Processus de photolithographie | Ingénierie | 95 % | 100 % | 17 | 19 | Nano Banana Pro |
| Coupe de tectonique des plaques | Sciences de la Terre | 100 % | 95 % | 19 | 19 | Égalité |
| Topologie du ruban de Möbius | Mathématiques | 100 % | 80 % | 20 | 11 | GPT Image 2 (erreur de rendu NBP) |
| Disque d'accrétion de trou noir | Astronomie | 100 % | 80 % | 19 | 18 | GPT Image 2 |
| Réseau trophique forestier | Écologie | 100 % | 90 % | 19 | 18 | GPT Image 2 |
| Hippocampe / LTP | Neuroscience | 100 % | 85 % | 19 | 18 | GPT Image 2 |
/inspiration?model=gpt-image-2 et /inspiration?model=nano-banana-pro. Chaque figure sur ces pages a été générée pour ce benchmark — vous pouvez copier le prompt et relancer l'un ou l'autre modèle vous-même.Créez des figures scientifiques maintenant
Décrivez votre figure scientifique en langage naturel — obtenez des illustrations prêtes à publier en quelques minutes.
Essayer gratuitementCinq enseignements généralisables
1. La fidélité aux prompts longs est l'avantage signature de GPT Image 2
Lorsque nous avons comparé la longueur moyenne de prompt (1 400 caractères) avec l'écart de fidélité (13,1 points de pourcentage), le schéma était constant : plus le prompt était long et spécifique, plus Nano Banana Pro tendait à omettre d'éléments. Ce n'est pas un petit effet — sur 12 prompts, GPT Image 2 a atteint 99,2 % des éléments nommés tandis que Nano Banana Pro a atteint 86,1 %.

GPT Image 2 — chaque espèce nommée dans le prompt de 1 600 caractères a été placée : chêne, érable, fougères, herbe, fleurs sauvages, mousses (producteurs) ; cerf de Virginie, lièvre d'Amérique, écureuil gris, souris des champs, chenille, abeille, scarabée des feuilles (herbivores) ; renard roux, grand-duc d'Amérique, couleuvre rayée, oiseau chanteur (paruline), musaraigne (mésoprédateurs) ; loup gris, buse à queue rousse, ours noir (apex). Décomposeurs dans une colonne droite séparée avec champignons polypores / vers de terre / bactéries. Légende de transfert d'énergie (100 % → 10 % → 1 % → 0,1 %) intacte.

Nano Banana Pro — mêmes quatre niveaux trophiques, même échelle kcal/m²/an, toutes les espèces reconnaissables. Mais il a omis la distinction champignons polypores / bactéries, omis la légende de pourcentage de transfert d'énergie, et n'a étiqueté que « ver de terre » plutôt que la colonne complète des décomposeurs. A capté les grandes lignes ; manqué les notes de bas de page de manuel.
2. La notation chimique est le fossé silencieux de GPT Image 2
Le test du mécanisme SN2 a produit notre plus grand écart sur un seul prompt (20 vs 15). GPT Image 2 a rendu chaque convention chimique standard — double-dague, liaisons partielles, stéréochimie R/S, géométrie pentacoordonnée, diagramme énergétique, légende d'éléments codée par couleur. Nano Banana Pro a produit un mécanisme reconnaissable, mais a manqué la double-dague, omis l'annotation de stéréochimie et n'a pas dessiné la légende.
3. La topologie 3D abstraite peut casser Nano Banana Pro
4. La simplicité de style BioRender est le terrain de prédilection de Nano Banana Pro
Trois des victoires du modèle (CRISPR-Cas9, Transformer, photolithographie) partagent un schéma commun : le prompt récompense la simplification. CRISPR est un mécanisme en 4 étapes — la visualisation pas à pas propre de Nano Banana Pro a battu la version plus dense de GPT Image 2. Transformer est un diagramme structurel — le rendu en couches empilées de Nano Banana Pro a mieux capturé l'intuition d'architecture.

GPT Image 2 — chaque élément demandé est présent : Cas9 avec domaines HNH et RuvC, sgRNA avec séquence cible complémentaire de 20 nt, PAM (5'-NGG-3') mis en évidence, formation R-loop, cassure double brin franche « 3 nt en amont du PAM », et les voies de réparation NHEJ et HDR. Score : 15/20 — la lisibilité plus faible l'a pénalisé car chaque étiquette est emballée dans un rendu 3D dense.

Nano Banana Pro — même structure en 4 étapes, même exactitude scientifique, mais l'illustration plate de style BioRender laisse beaucoup plus d'espace pour respirer. Chaque étape a un seul élément focal. La branche NHEJ « indels pour knockout de gène » (barré rouge) et la branche HDR « insertion de matrice donneuse pour correction de gène » (coche verte) sont visuellement décisives. Score : 18/20 — le gagnant de la convention de genre.
5. Le compromis densité d'information / lisibilité est la conclusion la plus profonde
Les scores moyens sur les 24 figures révèlent deux profils constants :
- GPT Image 2 : fidélité au prompt plus élevée (99,2 %), aptitude à la publication plus élevée (4,58), lisibilité plus faible (4,25)
- Nano Banana Pro : fidélité au prompt plus faible (86,1 %), aptitude à la publication plus faible (3,92), lisibilité plus élevée (4,67), score esthétique le plus élevé (4,83)
Les deux sont des philosophies valides de conception de figures — et elles correspondent à deux usages finaux différents. GPT Image 2 est construit pour la figure qui vit à côté d'une prose dense dans un article de revue. Nano Banana Pro est construit pour la figure qui doit communiquer seule à 4 mètres dans une salle de conférence.

GPT Image 2 — titre « Hippocampal Trisynaptic Circuit », anatomie à gauche avec spécificité d'entrée/sortie EC Layer II / V-VI, circuit en quatre étapes numérotées (Perforant Path → Mossy Fibers → Schaffer Collaterals → Output Path), mécanisme LTP zoomé à droite avec « Resting Membrane Potential ~ -70 mV » explicite, quatre explications moléculaires en puces, légende de couleur en coin. Densité d'information à son apogée.

Nano Banana Pro — même anatomie, même circuit, même mécanisme LTP. Mais chaque région est grande, les étiquettes sont espacées, et l'œil a le temps de suivre le flux de données. Les corps cellulaires des neurones pyramidaux et les dendrites apicales obtiennent une représentation visuelle explicite. Le compromis est la spécificité de couche EC (Layer II vs V-VI) et le potentiel de repos -70 mV — tous deux omis. Résultat : même contenu, expérience de lecture différente.
Verdict : lequel devriez-vous choisir ?
Utilisez l'arbre de décision ci-dessous pour les cas limites. Les différents travaux scientifiques ont des modèles optimaux différents — adaptez votre type de figure à l'une des quatre destinations de sortie courantes (revue à comité de lecture, conférence, web ou « pas sûr »), puis approfondissez la sous-règle pour votre discipline ou genre de figure spécifique.
- Soumission à une revue (Cell, Nature, Science, PNAS)
- Chimie / stéréochimie / mécanisme de réaction → GPT Image 2 (décisif)
- Mathématiques abstraites / topologie / variétés → GPT Image 2 (NBP peut échouer conceptuellement)
- Prompt long, dense, riche en étiquettes → GPT Image 2
- Mécanisme biologique dans la convention de genre style BioRender → Nano Banana Pro est acceptable, parfois préféré
- Présentation / poster de conférence / matériel pédagogique
- Par défaut → Nano Banana Pro (avantage lisibilité + esthétique)
- Architecture ML / CS → Nano Banana Pro (visuel d'empilement de couches plus fort)
- Flux de travail de processus avec plusieurs étapes → Nano Banana Pro (conception double panneau)
- Figure de blog ou réseaux sociaux
- Par défaut → Nano Banana Pro (plus net, défile mieux)
- Figure qualité couverture (couverture de revue haut de gamme, style National Geographic)
- L'un ou l'autre modèle fonctionne ; consultez notre galerie d'exemples pour voir des sorties comparables et choisir par adéquation esthétique
- Vous n'êtes pas sûr
- SciFig prend en charge les deux — générez simplement à partir de chacun, côte à côte, et choisissez le gagnant. C'est de toute façon ainsi que travaille un véritable illustrateur humain.
Derrière la méthodologie
Nous avons testé 12 prompts scientifiques couvrant 10 disciplines, verrouillés à un ratio d'aspect 16:9 et résolution 2K, générés directement via l'API Kie.ai (le même fournisseur d'API qui alimente la pile de production de SciFig). Chaque prompt comportait 1 100 à 1 800 caractères de spécification scientifique détaillée — récepteurs, kinases, équations, domaines nommés, préférences de couleur. Nous avons noté chaque sortie sur six dimensions : deux objectives (fidélité au prompt, respect des instructions) et quatre subjectives avec des grilles explicites (exactitude scientifique, aptitude à la publication, lisibilité, qualité esthétique). Pour chaque score subjectif, nous avons enregistré le raisonnement, donc l'évaluation est reproductible par un lecteur extérieur.
/inspiration?model=gpt-image-2 et /inspiration?model=nano-banana-pro. Si vous relancez un prompt et obtenez un résultat différent, nous voulons le savoir — c'est ainsi que ce type d'évaluation s'améliore au fil du temps.


