Puis-je utiliser à la fois GPT Image 2 et Nano Banana Pro dans SciFig ?

Oui. Les deux modèles sont des options de premier ordre dans Texte vers Figure et à travers les outils image vers image de SciFig. Basculez entre eux dans le sélecteur de modèle avant de générer ; la tarification est identique entre les deux sur SciFig car les deux sont accessibles via le même contrat amont Kie.ai. Voir Tarification pour le coût en crédits de chaque génération.

Quel modèle est le moins cher à utiliser à grande échelle ?

Sur SciFig, les deux modèles coûtent le même nombre de crédits par génération, donc le coût n'est pas le différenciateur — l'adéquation de la sortie à votre type de figure l'est. Si vous traitez 200+ figures par mois en lot, vous économiserez plus en choisissant le modèle qui nécessite moins de révisions, pas celui avec un appel d'API légèrement moins cher.

L'un ou l'autre modèle produit-il une sortie SVG / vectorielle native ?

Non. Les deux produisent des images raster (PNG par défaut, JPEG en option). Pour une sortie vectorielle de qualité publication, générez d'abord la figure raster, puis faites la passer par Vector Canvas , qui trace et convertit la figure en SVG modifiable. Ce pipeline en deux étapes fonctionne aussi bien avec l'un ou l'autre modèle.

Comment GPT Image 2 se compare-t-il au Nano Banana original (non-Pro) ?

Nous avons concentré ce benchmark sur les deux phares spécifiquement parce que comparer les phares entre eux est la question que la plupart des chercheurs se posent réellement. Pour les figures rapides quotidiennes où la vitesse compte plus que le détail, les modèles Nano Banana plus petits restent un choix raisonnable et sont également disponibles dans SciFig.

Ces modèles peuvent-ils lire des PDF d'articles scientifiques en entrée ?

Pas directement — aucun modèle n'accepte un PDF comme entrée de génération. L'outil PDF vers Figure de SciFig gère cela en extrayant la description de figure pertinente de l'article et en l'utilisant comme prompt pour l'un ou l'autre modèle. Le choix entre GPT Image 2 et Nano Banana Pro s'applique à cette étape en aval.

Les figures générées par IA de ces modèles sont-elles acceptées par Nature, Cell ou Science ?

Les politiques éditoriales évoluent rapidement — la réponse courte en 2026 est « oui, avec divulgation ». La plupart des grandes revues exigent de déclarer la génération de figures assistée par IA dans la section méthodes. Nous suivons cela en détail dans Les figures générées par IA sont elles autorisées dans les revues ? Un guide des politiques 2026 .

Où puis-je voir les 24 figures et relancer un prompt moi-même ?

La galerie complète avec prompts copiables est sur /inspiration?model=gpt image 2 pour les sorties GPT Image 2 et /inspiration?model=nano banana pro pour les sorties Nano Banana Pro. Cliquez sur n'importe quelle figure pour voir le prompt ; copiez et collez dans Texte vers Figure pour relancer.

GPT Image 2 vs Nano Banana Pro : Disciplines testées

Name: SciFig
Author: SciFig

Nous avons généré 24 figures scientifiques dans 10 disciplines — des mécanismes de coupe CRISPR-Cas9 aux architectures Transformer, de la circulation des cellules de Hadley à la topologie du ruban de Möbius — en utilisant GPT Image 2 (le modèle phare d'OpenAI) et Nano Banana Pro (le haut de gamme Gemini 3 de Google). Chaque figure a été notée sur six dimensions : fidélité au prompt, respect des instructions, exactitude scientifique, aptitude à la publication, lisibilité et qualité esthétique. Le résultat, avec les 12 prompts et les 24 sorties brutes publiés pour réplication, est le test direct le plus approfondi que nous connaissions pour l'illustration scientifique IA en 2026.

GPT Image 2 et Nano Banana Pro en un coup d'œil

Les deux modèles sont des générateurs d'images phares publiés par leurs sociétés mères respectives début 2026. SciFig intègre les deux via Kie.ai, donc un seul compte vous permet de basculer entre eux d'un clic dans Texte-vers-Figure.

Propriété	GPT Image 2	Nano Banana Pro
Société mère	OpenAI	Google (Gemini 3)
Variantes de mode	Texte-vers-image, image-vers-image	Texte-vers-image, image-vers-image
Ratios d'aspect	auto, 1:1, 9:16, 16:9, 4:3, 3:4	1:1, 2:3, 3:2, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9, auto
Résolutions	1K, 2K, 4K	1K, 2K, 4K
Indices de style natifs	Aucun (piloté par le prompt)	Aucun (piloté par le prompt)
Intégration SciFig	`/models/gpt-image-2`	`/models/nano-banana-pro`

Pour ce benchmark, nous avons verrouillé les deux modèles à un ratio d'aspect 16:9 en résolution 2K pour rendre la comparaison visuelle équitable. Les prompts comptaient 1 100 à 1 800 caractères chacun, écrits pour imiter un véritable étudiant en doctorat briefant un illustrateur avec tous les détails scientifiques — chaque récepteur, chaque kinase, chaque état de transition explicité.

GPT Image 2 : le modèle phare d'OpenAI pour les figures riches en détails

GPT Image 2 hérite de l'obsession des prompts longs qui définit les modèles de texte d'OpenAI depuis GPT-4. En pratique, cela signifie que le modèle traite chaque clause de votre prompt comme un élément de checklist — et qu'il s'efforce de toutes les faire apparaître dans la figure finale.

Forces

La fidélité au prompt s'est élevée en moyenne à 99,2 % sur nos 24 figures, ce qui signifie que presque chaque élément nommé dans un prompt de 1 500 caractères apparaît dans la sortie rendue.
La notation chimique est son super-pouvoir discret : dans le test de réaction SN2, il a rendu le symbole double-dague ‡ sur l'état de transition, étiqueté les configurations R et S, dessiné le carbone pentacoordonné avec trois hydrogènes dans un plan trigonal, inclus un diagramme énergétique complet en encart avec Ea étiqueté, et ajouté une légende quatre couleurs cartographiant nucléophile / groupe partant / carbone / hydrogène.
Les formules mathématiques, les axes de coordonnées et les barres d'échelle apparaissent de manière constante — la figure du trou noir incluait Rs = 2GM/c², le ruban de Möbius montrait l'équation paramétrique complète x(u,v) = (1+v/2·cos(u/2))·cos(u), et l'expérience des fentes d'Young portait d·sin(θ) = m·λ avec le triangle de différence de chemin tracé.

Test : mécanisme de substitution SN2

GPT Image 2 : mécanisme de substitution SN2 avec état de transition double-dague, carbone pentacoordonné, stéréochimie R/S, encart de diagramme énergétique et légende d'éléments à quatre couleurs

GPT Image 2 — toutes les conventions chimiques rendues : ‡ sur l'état de transition, annotation R/S, carbone pentacoordonné avec trois hydrogènes en plan trigonal, diagramme énergétique avec Ea, et légende codée par couleur (nucléophile / groupe partant / carbone / hydrogène).

Nano Banana Pro : mécanisme de substitution SN2 reconnaissable mais sans double-dague, annotation de stéréochimie R-S et légende de couleurs

Nano Banana Pro — reconnaissable comme SN2 mais la double-dague, l'annotation R/S, l'étiquette « pentacoordonné » et la légende de couleur des éléments sont toutes manquantes. La sortie est nette et lisible ; elle n'est juste pas rigoureuse en termes de conventions chimiques pour la revue par les pairs.

Test : interférence des fentes d'Young

GPT Image 2 : expérience d'interférence des fentes d'Young avec fronts d'onde de Huygens, encart de triangle de différence de chemin, écran d'observation à distance L, et équation complète d sin theta égale m lambda

GPT Image 2 — traitement complet de manuel de physique : source monochromatique, construction de Huygens avec fronts d'onde circulaires, géométrie en encart de différence de chemin, motif de franges avec m = 0, ±1, ±2 étiqueté, formule de position y_m = mλL/d, et classification explicite « constructive brillante » / « destructive sombre ».

Nano Banana Pro : interférence des fentes d'Young avec fronts d'onde de Huygens et équation mais étiquettes manquantes

Nano Banana Pro — la géométrie et la construction de Huygens sont exactes (le triangle de différence de chemin est mis en évidence en orange doux, ce qui est visuellement élégant), mais la distance à l'écran L, la classification constructive/destructive et la formule de position sont absentes de la figure.

Limitations

La densité d'information peut déborder en encombrement. Notre panneau test CRISPR a obtenu 95 % en fidélité au prompt mais seulement 3 sur 5 en lisibilité — chaque étiquette demandée était présente, juste trop serrée pour être scannée d'un coup d'œil.
Pas d'effets d'empilement de couches 3D. Les diagrammes d'architecture (comme le Transformer) ressortent plats, avec les blocs Add & Norm rendus en 2D plutôt que les indices de répétition de couche d'apparence 3D que l'on voit parfois dans les sorties Nano Banana Pro.

Meilleurs cas d'usage scientifiques

Soumissions à des revues où chaque étiquette, équation et légende doit survivre à l'examen par les pairs
Articles de chimie nécessitant des diagrammes de stéréochimie, d'états de transition ou de mécanisme de réaction
Mathématiques abstraites (topologie, variétés) où la fidélité conceptuelle l'emporte sur l'impact visuel
Flux de travail à prompts longs (>1 000 caractères) — voir notre guide compagnon sur Maîtriser les prompts scientifiques IA pour des stratégies de prompt qui fonctionnent particulièrement bien avec ce modèle

Conseil

Pour les revues de niveau Cell, GPT Image 2 associé à Vector Canvas pour le nettoyage final est notre pipeline recommandé — détail riche en entrée, SVG poli en sortie.

Voyez la génération de figures scientifiques par IA en action

Observez comment les chercheurs créent des figures scientifiques prêtes à publier à partir de descriptions textuelles.

Explorer l'outil

Nano Banana Pro : le haut de gamme de Google pour les figures propres de style BioRender

Nano Banana Pro est le modèle le plus puissant de la famille Gemini 3 de Google pour la synthèse d'images. Là où GPT Image 2 mise sur la spécification, Nano Banana Pro mise sur la composition — ses sorties donnent l'impression qu'un illustrateur senior a distillé le prompt en une figure éditoriale propre.