Puis-je utiliser les crédits gratuits de SciFig pour tester les deux modèles ?

Oui. Le niveau gratuit comprend assez de crédits pour générer 4 à 6 figures, suffisant pour un test côte à côte sur votre propre prompt. Ouvrez Texte vers Figure , générez une fois avec chaque modèle sélectionné, et comparez les sorties. Cette comparaison pratique est plus informative que tout benchmark que nous pouvons publier.

Ces conclusions s'appliquent-elles à DALL-E 3 d'OpenAI ou aux anciens modèles Imagen de Google ?

Pas directement. DALL E 3 et Imagen 2 sont des modèles de génération précédente ; leur comportement sur des prompts scientifiques denses est significativement différent de leurs successeurs phares de 2026. Nous avons testé uniquement les phares actuels parce que c'est le choix auquel les chercheurs en 2026 sont réellement confrontés lors du choix d'un modèle par défaut.

Où puis-je voir les données complètes du benchmark ?

Le post compagnon est la version riche en données : GPT Image 2 vs Nano Banana Pro : 10 disciplines testées en 2026 — matrice de notation complète, comparaison dimension par dimension, notes méthodologiques. La galerie d'images complète avec prompts copiables est sur /inspiration?model=gpt image 2 et /inspiration?model=nano banana pro .

GPT Image 2 vs Nano Banana Pro : Lequel gagne ?

Name: SciFig
Author: SciFig

OpenAI affirme que GPT Image 2 est son modèle d'image le plus avancé jamais conçu. Google affirme que Nano Banana Pro est le meilleur de la famille Gemini 3. Les deux affirmations sont techniquement défendables — et toutes deux sont inutiles pour la question qui compte vraiment : lequel rend correctement un diagramme de voie de signalisation cellulaire du premier coup ? Nous avons fait passer 24 vraies figures scientifiques par les deux. Le gagnant n'est pas celui que vous pourriez supposer — et la réponse change selon que votre sortie va vers Cell, un poster de conférence ou un fil Twitter.

La vraie question derrière « lequel est le meilleur »

Demander « quel modèle d'image IA est le meilleur en 2026 » est le mauvais cadrage. Les deux modèles sont bons. La question honnête pour les chercheurs est plus étroite : pour le type spécifique de figure que vous êtes sur le point de réaliser aujourd'hui, lequel a le plus de chances de vous donner un résultat utilisable du premier coup ?

Dans notre benchmark face à face de 24 figures à travers 10 disciplines, le verdict n'a pas été un balayage net. GPT Image 2 a gagné 8 prompts, Nano Banana Pro en a gagné 3, et un s'est terminé par une égalité. Mais les victoires se sont regroupées : GPT Image 2 domine partout où la notation scientifique est dense et rigoureuse ; Nano Banana Pro domine partout où la simplicité éditoriale gagne. L'art de choisir consiste à reconnaître de quel côté se trouve votre figure avant de brûler 50 crédits sur le mauvais modèle.

Ce guide est la version cadre de décision des données. Si vous voulez le benchmark complet avec la matrice de notation côte à côte, la pièce compagnon est GPT Image 2 vs Nano Banana Pro : 10 disciplines testées en 2026. Si vous voulez le verdict — continuez à lire.

Avant les conclusions, l'antisèche pour ce à quoi chaque phare est destiné :

Aspect	GPT Image 2	Nano Banana Pro
Parent	OpenAI	Google (Gemini 3)
Conçu pour	Figures riches en détails avec spécifications strictes	Figures de style éditorial avec accent sur la composition
Gagne sur	Rigueur chimique, formules mathématiques, topologie abstraite, fidélité aux prompts longs	Lisibilité, raffinement esthétique, diagrammes structurels (CS / processus / mécanisme)
Perd sur	La densité d'information peut encombrer	La fidélité aux prompts longs chute de 13 points sur les spécifications complexes ; rares erreurs de rendu conceptuel
Par défaut pour	Soumission à une revue	Diapositives / posters / web
Dans SciFig	`/models/gpt-image-2`	`/models/nano-banana-pro`

Recommandation principale : GPT Image 2. Sur 12 prompts en face à face, GPT Image 2 a remporté 8 victoires, 1 égalité, et n'a perdu que 3 — et les défaites étaient stylistiques (le poli éditorial de Nano Banana Pro sur CRISPR / Transformer / photolithographie) plutôt que d'exactitude scientifique. Les victoires comprenaient deux déroutes décisives (chimie : 20 vs 15 ; topologie abstraite : 20 vs 11) qu'il serait coûteux de manquer dans un véritable article. Choisissez GPT Image 2 par défaut sauf si votre sortie va sur une présentation, un poster de conférence ou les médias sociaux — où l'avantage de lisibilité de Nano Banana Pro prend le dessus. Tout ce qui suit est la version nuancée de cette réponse en une ligne.

Trois conclusions décisives (et pourquoi elles s'appliquent probablement à vous)

Nous avons extrait trois conclusions du benchmark de 24 figures qui devraient changer le modèle vers lequel vous vous tournez par défaut. Elles sont décisives au sens où l'écart de score est suffisamment grand pour qu'un coup de pile ou face soit erroné.

Conclusion 1 : Les articles de chimie devraient utiliser GPT Image 2 (pas même proche)

Notre test de mécanisme de substitution SN2 a produit le plus grand écart sur un seul prompt de tout le benchmark : GPT Image 2 a obtenu 20/20, Nano Banana Pro a obtenu 15/20. La différence venait de la rigueur de notation. GPT Image 2 a dessiné le symbole double-dague ‡ sur l'état de transition, étiqueté les configurations stéréochimiques R et S sur le réactif et le produit, rendu le carbone pentacoordonné avec trois hydrogènes plats dans le plan trigonal, inclus un diagramme énergétique complet en encart avec l'énergie d'activation Ea étiquetée, et ajouté une légende quatre couleurs identifiant nucléophile / groupe partant / carbone / hydrogène.

Nano Banana Pro a produit une figure SN2 reconnaissable mais a manqué presque chacune de ces conventions. Pour les articles de chimie destinés à JACS, Angewandte Chemie, Organic Letters ou toute revue dont les évaluateurs se soucient de la notation des mécanismes de réaction — GPT Image 2 est le seul choix par défaut sensé.

GPT Image 2 : mécanisme de substitution SN2 avec notation chimique complète incluant état de transition double-dague, stéréochimie R-S et légende d'éléments en couleur

GPT Image 2 — chaque convention chimique standard rendue. Score 20/20.

Nano Banana Pro : mécanisme de substitution SN2 reconnaissable mais sans double-dague et annotation de stéréochimie R-S et légende de couleur

Nano Banana Pro — mécanisme reconnaissable mais la double-dague, la stéréochimie R/S et la légende d'éléments en couleur sont toutes manquantes. Score 15/20 — notre plus grand écart sur un seul prompt.

Conclusion 2 : La topologie 3D abstraite peut casser Nano Banana Pro

C'était le résultat le plus surprenant de notre benchmark. Le prompt demandait un ruban de Möbius rendu en 3D avec un demi-tour, accompagné d'un petit encart le comparant à un cylindre orientable régulier. GPT Image 2 a livré exactement cela : un ruban de Möbius 3D crédible sur la figure principale, un petit cylindre dans le coin étiqueté « cylindre orientable, deux arêtes distinctes, surface à deux côtés », plus l'équation paramétrique complète rendue comme un bloc mathématique.

Nano Banana Pro a inversé cela. La figure principale montrait un cylindre simple sans tour ; le véritable ruban de Möbius n'apparaissait que dans un minuscule encart en coin. C'est plus qu'un choix stylistique — c'est une erreur conceptuelle assez grave pour induire en erreur tout étudiant regardant le rendu. Score : 20 vs 11, notre deuxième plus grand écart. Pour les objets mathématiques abstraits, en particulier en topologie et géométrie, choisissez GPT Image 2 par défaut et vérifiez visuellement la sortie avant de l'accepter.

GPT Image 2 : ruban de Möbius en 3D avec demi-tour visible et encart de cylindre orientable pour comparaison et équation paramétrique

GPT Image 2 — ruban de Möbius 3D crédible avec le demi-tour clairement visible. Le cylindre est dans l'encart en coin, exactement comme le prompt le demandait.

Nano Banana Pro : rendu incorrect comme cylindre simple sans demi-tour avec le véritable ruban de Möbius relégué à un petit encart en coin

Nano Banana Pro — la figure principale est un cylindre simple, pas un ruban de Möbius. Le véritable ruban de Möbius est rétréci dans un minuscule encart en coin. Échec de rendu conceptuel.

Conclusion 3 : Les diapositives de conférence et posters devraient choisir Nano Banana Pro par défaut

Cette conclusion est l'inverse des deux premières. Sur nos 24 figures, Nano Banana Pro a constamment obtenu un score plus élevé en lisibilité (4,67 vs 4,25 en moyenne) et en esthétique (4,83 vs 4,75 en moyenne). Là où le prompt récompense la distillation plutôt que la spécification, Nano Banana Pro tend à gagner.

Le cas le plus clair était la figure de processus de photolithographie : Nano Banana Pro a fait un choix de composition créatif que nous n'avions pas demandé, divisant chacune des 6 étapes du processus en un panneau « vue détaillée » au-dessus et un panneau « coupe simplifiée » en dessous — exactement la façon dont les manuels IEEE présentent les processus de semi-conducteurs. Le résultat a été la figure d'ingénierie la mieux notée du benchmark (19/20).

Pour les présentations, posters et matériel pédagogique où un spectateur a 10 à 30 secondes par figure, Nano Banana Pro est le meilleur choix par défaut. Même lorsque GPT Image 2 met plus d'informations dans une figure, la densité d'information qui aide dans un article à comité de lecture nuit activement dans une présentation.

GPT Image 2 : processus de photolithographie en 6 panneaux horizontaux avec empilement de couches cohérent et étiquettes source UV photomasque révélateur

GPT Image 2 — séquence de 6 panneaux sur une seule rangée, compacte et claire. Score 17/20.

Nano Banana Pro : processus de photolithographie en 6 colonnes à double panneau avec vue détaillée au-dessus et coupe simplifiée en dessous

Nano Banana Pro — mêmes 6 étapes mais chacune rendue en double panneau : vue détaillée en haut, coupe simplifiée en bas. C'est ainsi que les manuels IEEE présentent réellement la photolithographie. Score 19/20 — notre figure d'ingénierie la mieux notée.

Voyez la génération de figures scientifiques par IA en action

Observez comment les chercheurs créent des figures scientifiques prêtes à publier à partir de descriptions textuelles.

Explorer l'outil

Un cadre de décision adapté à votre sortie

Les deux modèles sont accessibles depuis le même sélecteur de modèle dans Texte-vers-Figure. L'arbre de décision ci-dessous reflète la façon dont un illustrateur de recherche expérimenté choisirait.

Si votre sortie va vers une revue à comité de lecture

Articles de chimie, biochimie, chimie organique → GPT Image 2 (décisif, voir Conclusion 1)
Physique ou mathématiques appliquées avec formules, axes, barres d'échelle → GPT Image 2 (fidélité aux prompts longs)
Topologie, variétés, géométrie abstraite → GPT Image 2 (NBP peut échouer conceptuellement, voir Conclusion 2)
Biologie cellulaire, voies de signalisation, mécanismes moléculaires → l'un ou l'autre, mais le style BioRender de NBP est parfois préféré par les éditeurs de Nature Methods et Cell Reports Methods
Clinique / anatomie → l'un ou l'autre ; consultez notre galerie d'exemples pour des sorties comparables et choisissez par adéquation visuelle

Si votre sortie va vers une conférence ou un exposé

Présentation pour un exposé de 10 minutes → Nano Banana Pro (Conclusion 3)
Poster de conférence (taille A0 / A1) → Nano Banana Pro sauf si la figure est critique en détails (auquel cas GPT Image 2 + nettoyage manuel dans Vector Canvas)
Réunion de laboratoire / explication de journal club → Nano Banana Pro pour la clarté, puis itérer

Si votre sortie va sur le web

En-tête Twitter / LinkedIn / article de blog → Nano Banana Pro (plus net aux petites tailles de vignette)
Page d'accueil de laboratoire universitaire → Nano Banana Pro
Image de couverture de proposition de subvention → GPT Image 2 si l'évaluateur de l'agence est technique ; Nano Banana Pro si l'évaluateur est un public plus large

Si vous n'êtes pas sûr

Générez à partir des deux, côte à côte. SciFig facture identiquement par génération quel que soit le modèle, et le sélecteur de modèle est à un clic dans Texte-vers-Figure. Pour une figure à enjeux élevés (Figure 1 d'article, image de couverture de subvention, diapositive de défense de thèse), générer deux versions et choisir la meilleure est ce que ferait de toute façon tout chercheur principal sénior. Nous avons même construit Inspiration pour que vous puissiez parcourir les véritables sorties de chaque modèle côte à côte avant de commencer.

Créez des figures scientifiques maintenant

Décrivez votre figure scientifique en langage naturel — obtenez des illustrations prêtes à publier en quelques minutes.

Essayer gratuitement

Cinq découvertes contre-intuitives

Ce sont les conclusions de notre benchmark qui ont contredit nos attentes initiales.

1. Le modèle plus récent et plus tape-à-l'œil n'est pas automatiquement meilleur

En entrant, nous nous attendions à ce que GPT Image 2 domine tout parce qu'il s'agit de la version la plus récente. Ce n'a pas été le cas. Nano Banana Pro a remporté trois prompts sans appel (CRISPR-Cas9, architecture Transformer, photolithographie) — et les victoires n'étaient pas serrées. La leçon : ne supposez pas que le modèle avec le marketing le plus bruyant gagne sur le type de figure dont vous avez réellement besoin.

GPT Image 2 : diagramme d'architecture Transformer avec encodeur Nx décodeur Nx, attention multi-tête, projection Q K V, cross-attention, feed-forward, Add Norm, Linear, sortie Softmax

GPT Image 2 — chaque composant étiqueté avec une grande précision (« Two Linear Layers + ReLU », « Keys, Values from Encoder Output, Query from decoder », encodage positionnel « sinusoïdal »). Blocs 2D plats. Score 16/20.

Nano Banana Pro : architecture Transformer avec piles d'encodeur et décodeur 3D en couches et flèches K V Q de cross-attention explicites et icône d'encodage de position en forme d'onde

Nano Banana Pro — mêmes composants, mais l'encodeur/décodeur sont rendus comme des blocs en couches visuellement empilés (l'empilement Nx), les flèches K/V/Q de cross-attention tracent explicitement de l'encodeur au décodeur, et l'encodage de position obtient même une petite icône en forme d'onde. L'intuition structurelle gagne ici. Score 18/20.

2. La fidélité aux prompts longs est un écart de 13 points, pas un petit écart

Sur 24 figures, GPT Image 2 a en moyenne 99,2 % de fidélité aux éléments du prompt ; Nano Banana Pro 86,1 %. C'est un écart réel et reproductible, et il évolue avec la complexité du prompt. Si vous écrivez des prompts minimaux (« un diagramme de voie de signalisation cellulaire »), la différence se réduit. Si vous écrivez le type de prompts détaillés et entièrement spécifiés que nous recommandons dans Maîtriser les prompts scientifiques IA, la différence est décisive.

GPT Image 2 : cascade de signalisation EGFR RAS MAPK avec liaison du ligand, dimérisation du récepteur, GRB2 SOS RAS-GTP RAF MEK ERK, translocation nucléaire des facteurs de transcription et expression du gène cible avec légende de couleur complète

GPT Image 2 — cascade de signalisation complète avec échange GDP→GTP explicite, étiquetage en deux étapes (1 : liaison EGF, 2 : dimérisation + autophosphorylation), les trois facteurs de transcription (ELK1 / c-Fos / c-Jun), régions promotrices (SRE / AP-1 Site), gènes cibles spécifiques (Cyclin D1, c-Myc), et une légende de couleur à six catégories. 100 % de fidélité au prompt.

Nano Banana Pro : cascade de signalisation EGFR RAS MAPK rendue avec un flux d'image unique montrant l'activation du récepteur jusqu'à la transcription avec complexe de pore nucléaire mais sans légende de couleur et noms de gènes cibles

Nano Banana Pro — même exactitude scientifique sur la cascade, avec un beau détail anatomique (Complexe de Pore Nucléaire montré explicitement), mais sans la légende de couleur, la classification du promoteur SRE/AP-1 Site, les gènes cibles spécifiques (Cyclin D1, c-Myc), et l'annotation du domaine SH2. 80 % de fidélité au prompt. Même biologie — moins de notes de bas de page.

3. Le modèle qui « suit mieux les instructions » n'est pas nécessairement le modèle qui « a meilleure apparence »

Le score de fidélité plus élevé de GPT Image 2 ne se traduit pas par des figures universellement plus belles. Scores esthétiques moyens : 4,75 (GPT) vs 4,83 (NBP). Nano Banana Pro a légèrement devancé GPT Image 2 en qualité visuelle malgré le placement de moins d'éléments demandés — parce que ce qu'il a placé a été rendu avec plus de soin.

4. Nano Banana Pro peut halluciner entièrement le mauvais concept

L'échec ruban de Möbius → cylindre n'est pas une préférence stylistique — c'est le modèle rendant un objet mathématique différent de celui spécifié. La figure principale était structurellement un cylindre, pas un ruban de Möbius avec un tour. Ce type d'échec est rare mais conséquent : il induirait en erreur tout étudiant ou spectateur non expert. Vérifiez toujours visuellement les concepts abstraits ou peu familiers avant d'accepter une sortie Nano Banana Pro comme correcte.

5. Les deux modèles peuvent produire des figures de qualité couverture Nature

Notre test de tectonique des plaques a obtenu 19/20 pour les deux modèles. Les diagrammes de coupe géologique qui en sont sortis — trois types de frontières côte à côte, distinction lithosphère/asthénosphère, cellules de convection mantellique, échelle verticale de profondeur — ressemblent à des figures de National Geographic ou des publications de l'USGS. Le choix entre les deux pour les figures éditoriales haut de gamme est davantage une question de préférence esthétique qu'un écart de capacité. Le test du disque d'accrétion de trou noir a fait le même point — les deux modèles ont atteint la qualité d'image de couverture sur un prompt astrophysique difficile.

GPT Image 2 : trou noir de Kerr en rotation avec horizon des événements, sphère de photons, ISCO, ergosphère, gradient de température du disque d'accrétion, jet relativiste, lignes de champ magnétique hélicoïdales et encart multi-vues

GPT Image 2 — niveau revue d'astrophysique : titré « ROTATING KERR BLACK HOLE », quatre frontières étiquetées (Event Horizon, Photon Sphere 1.5 Rs, ISCO, Ergosphere), gradient de température du disque d'accrétion (10⁴ K → 10⁸ K) avec une légende latérale, lignes de champ magnétique hélicoïdales traversant le jet, flèches d'entraînement de cadre, axes de coordonnées droitiers, encart multi-vues (face + tranche), boîte de notes avec référence au mécanisme Blandford-Znajek.

Nano Banana Pro : trou noir en rotation avec gradient de température du disque d'accrétion, jet relativiste, axe de rotation, étiquettes ergosphère sphère de photons ISCO et barre d'échelle 1 Rs

Nano Banana Pro — même exactitude scientifique, même gradient de température encodé par couleur, épaisseur du disque d'accrétion explicitement notée comme proportionnelle à la température. Légèrement moins d'annotations (pas de système de coordonnées, pas d'encart multi-vues, pas d'étiquettes de champ magnétique), mais visuellement assez frappant pour atterrir sur une couverture de magazine. Notez l'espace négatif délibéré entourant le sujet — Nano Banana Pro tend à laisser à la figure de l'espace pour respirer dans les prompts d'astrophysique, en contraste avec le cadrage dense en information de GPT Image 2 ci-dessus. C'est en soi une différence de philosophie de composition qui mérite d'être vue sur le même écran.

Quand générer à partir des deux

Il existe trois situations où exécuter les deux modèles sur le même prompt est le bon mouvement :

Figures à enjeux élevés. Figure 1 d'article, image de couverture de proposition de subvention, diapositive de défense de thèse. Le coût de générer deux fois est de deux tours de crédits ; le coût de choisir le mauvais modèle est de jours de révisions ou d'une subvention ratée.
Concepts non familiers ou abstraits. Tout en topologie, mathématiques avancées, physique fondamentale ou un domaine pour lequel vous n'êtes pas sûr que l'un ou l'autre modèle ait vu beaucoup de données d'entraînement. La vérification visuelle compte.
Test A/B de style. Lorsque vous ne savez vraiment pas si votre public préfère le style dense de GPT Image 2 ou le style éditorial de Nano Banana Pro. Générez les deux, montrez-les à un collègue, choisissez par réaction.

Pour les 80 % de figures de routine — spécification scientifique claire, sujet courant, faible ambiguïté — choisissez un modèle par défaut basé sur le cadre ci-dessus et ne gaspillez pas de crédits. Pour les 20 % où le coût de l'erreur est élevé, exécutez les deux.

Si vous optimisez le budget et ne pouvez générer qu'une fois par figure, exécutez notre framework de prompts SciFig avant de commencer. Un prompt bien construit réduit considérablement l'écart entre les deux modèles.

Pourquoi nous faisons confiance à ce verdict

Ce guide est ancré dans un benchmark que nous avons exécuté spécifiquement pour lui : 12 prompts scientifiques couvrant 10 disciplines, générés via Kie.ai (le même fournisseur d'API que SciFig utilise en production), chacun noté sur six dimensions avec des grilles explicites et un raisonnement enregistré. Les deux modèles ont été testés le même jour avec des paramètres identiques : ratio d'aspect 16:9, résolution 2K.

Chaque prompt et chaque figure générée sont publiquement accessibles à /inspiration?model=gpt-image-2 et /inspiration?model=nano-banana-pro. La matrice de notation complète est dans le post de benchmark compagnon. Si vous relancez un prompt et obtenez un résultat différent, c'est une information utile — dites-le-nous, s'il vous plaît. La transparence est intentionnelle : les revendications marketing d'OpenAI et de Google sont invérifiables ; les tests reproductibles côte à côte sont le seul moyen honnête de comparer les modèles phares en 2026.

Pour un contexte plus large sur la façon dont ces deux se comparent au reste du marché des illustrations scientifiques IA, consultez Les 10 meilleurs outils d'illustration scientifique en 2026, notre comparaison phare d'outils.

Conseil

Le protocole de re-test transparent est le véritable verdict. Les revendications marketing d'OpenAI et de Google sont invérifiables. Les tests reproductibles côte à côte — mêmes prompts, mêmes paramètres, toutes les 24 sorties brutes publiées — sont le seul moyen honnête de comparer les modèles d'image phares en 2026. Si votre re-test contredit le nôtre, ce désaccord est plus utile qu'un autre post marketing.

Questions fréquemment posées

GPT Image 2 — mais uniquement parce que la chimie, les mathématiques abstraites et la fidélité aux prompts longs sont les situations où le mauvais choix est le plus coûteux. Nano Banana Pro produit des sorties stylistiquement meilleures en moyenne, mais ses modes d'échec (conventions chimiques manquantes, erreurs conceptuelles de topologie) sont du genre qui se font repérer en revue par les pairs. Si vous devez choisir un seul par défaut, choisissez le modèle dont les modes d'échec sont les moins catastrophiques pour votre travail spécifique.

Les scores esthétiques convergeront probablement avec le temps à mesure que les deux entreprises ajustent leurs modèles phares l'un par rapport à l'autre. Les conclusions structurelles — fidélité aux prompts longs, rigueur de notation chimique, rendu de topologie — sont liées à des choix architecturaux plus profonds et sont susceptibles d'être plus stables. Nous prévoyons de relancer ce benchmark tous les six mois et de mettre à jour les deux posts.

La tectonique des plaques est bien représentée dans les manuels de géologie et l'imagerie géologique en ligne, donc les deux modèles ont un signal d'entraînement abondant. Le ruban de Möbius est beaucoup plus rare dans les corpus d'entraînement — et lorsque les données d'entraînement sont rares, les modèles tendent à par défaut au concept le plus courant. Le comportement « par défaut au cylindre » de Nano Banana Pro sur le prompt Möbius ressemble à un artefact de données d'entraînement plutôt qu'à un choix de conception délibéré.

La latence de génération est à peu près comparable sur le pipeline SciFig (30 à 60 secondes par figure pour les deux, typique). La vitesse est rarement le facteur limitant pour choisir entre les phares — l'adéquation de la sortie l'est. Si la vitesse de génération brute compte le plus (par exemple, démonstrations en direct), le modèle Nano Banana 2 plus petit est plus rapide que l'un ou l'autre des phares et reste disponible dans SciFig.