Un de mes passe-temps personnels consiste à poser la même question à deux chatbots différents et à voir lequel fournit la meilleure réponse. Comme un professeur qui interroge les étudiants (ce que je fais parfois dans la vraie vie en tant que bénévole), j'évalue si le robot hallucine et invente des faits ou s'il fournit une réponse intelligente et cohérente qui est réellement utile.
« Intelligence » et « cohérence » ne sont pas les mots que j'utiliserais pour décrire ce que les chatbots génèrent habituellement en matière d'images. Connues sous le nom de AI slop, ces étranges concoctions – souvent avec un arrière-plan flou, un humain parfait avec des cheveux coiffés et peut-être quelques pouces supplémentaires – sont omniprésentes sur les réseaux sociaux et apparaissent même comme image principale dans des articles comme celui-ci.
Les images d’archives ont déjà une mauvaise réputation. Cette vidéo avec Emilia Clarke est toujours l’une de mes parodies de photos préférées de tous les temps et me fait rire même si elle est sortie bien avant le slop de l’IA :
Les temps ont changé. OpenAI a récemment mis à niveau le modèle de génération d'images ChatGPT pour concurrencer Google Gemini et Nano Banana Pro.
Étonnamment, les images n'utilisent plus ce flou distinctif et, lors de mes tests, semblent souvent beaucoup plus réalistes qu'auparavant.
J'ai décidé d'utiliser exactement les mêmes invites avec les deux chatbots et de voir lequel produisait les résultats les plus utiles. Je parle : une image que vous pourriez utiliser dans une campagne publicitaire ou avec un article, quelque chose que vous publieriez sur les réseaux sociaux pour accompagner une légende pleine d'esprit.
ChatGPT m'a impressionné par sa rapidité : aucune des images de stock ne ressemblait à des déchets générés par ordinateur. Cependant, Nano Banana Pro a le dessus car il a systématiquement généré des images plus réalistes lors de mes tests. Voici les invites que j'ai utilisées et les images générées par les deux robots afin que vous puissiez juger par vous-même. (Les images de Nano Banana sont à gauche.)
1. Personne écoutant un podcast
Invite utilisée : créer une image de stock d'une personne écoutant un podcast dans un bureau branché
J'ai demandé aux deux robots de créer une image de quelqu'un écoutant un podcast dans un bureau. Nano Banana a été clairement le gagnant ici, bien que l'image de Nano Banana présente un léger flou en arrière-plan qui pourrait être un révélateur mortel. Pourtant, l’IA apprend à éviter la perfection absolue. Honnêtement, j'aurais du mal à savoir que la femme dans un bureau dans la photo de Nano Banana n'était pas réelle. Ses cheveux sont légèrement en désordre (comme quelqu'un dans la vraie vie). Dans la photo ChatGPT, l'auditeur du podcast n'a pas l'air tout à fait correct : la photo est un peu trop parfaite.
2. Créer une image promotionnelle pour mon livre


Invite utilisée : mettez la couverture de ce livre entre les mains de quelqu'un qui souhaite vraiment le lire.
Pour ce test, j'ai téléchargé la couverture de mon propre livre et j'ai demandé aux robots de créer une image de quelqu'un qui le lisait. Nano Banana est allé un peu trop loin, car l'image de l'IA montre quelqu'un avec un peu trop d'enthousiasme. Pourtant, l’image ChatGPT a toujours une qualité surnaturelle (et je veux dire cela dans le mauvais sens) qui ne semble pas réelle. Tout dans l'image ChatGPT est trop parfait – l'éclairage, la pose, etc. – et crie toujours CGI.
3. Créez une image de stock à utiliser avec un article


Invite utilisée : créez une image de stock pour accompagner un article sur la génération d'images IA
Nano Banana n'a pas gagné toutes les batailles cette fois-ci. J'ai demandé aux deux robots de créer une image pour accompagner cet article. ChatGPT a produit une image quelque peu utile mais encore un peu trop fausse, mais Nano Banana Pro a brisé le quatrième mur avec une image générée par ordinateur qui superpose un cerveau et un pinceau sur un iPad d'Apple. En d’autres termes, ce n’est pas du tout utile.
4. Luttes de leadership


Invite utilisée : montrez quelqu'un qui a du mal à atteindre un objectif de leadership, mais donnez-lui un aspect vraiment réaliste
L'une des photos d'archives les plus courantes que vous verrez montre quelqu'un qui lutte pour atteindre un objectif, par exemple escalader une montagne, lever les bras vers le ciel ou sauter à travers un ravin. La raison pour laquelle cette image est si populaire est parce que les photos sont pertinentes : nous avons tous du mal à réussir. Je dirais que Nano Banana Pro et ChatGPT ont produit des résultats médiocres. Les images d’archives qu’ils ont réalisées montrent quelqu’un frustré dans un bureau avec des papiers froissés. Pourtant, Nano Banana a un look légèrement plus réaliste.
5. Emilia Clarke souriant à la caméra


Invite utilisée : créer une nouvelle image montrant Emilia Clarke souriant à la caméra dans un bureau
Pour un dernier test, j'ai demandé aux deux robots de créer une nouvelle image d'Emilia Clarke souriant à la caméra dans un bureau. J'ai été surpris que ChatGPT ait refusé de créer l'image, affirmant que Clarke était une « personne réelle et identifiable », alors que Nano Banana était heureux de le faire. Avec quelques cajoleries, j'ai demandé à ChatGPT de générer quelqu'un qui ressemble à Clarke. L’image de Nano Banana n’est en fait pas si mauvaise – elle n’a pas l’air complètement fausse.
Réflexions finales
La génération d’images IA a parcouru un long chemin. Aucune des photos produites par Nano Banana Pro ou ChatGPT ne montrait quelqu'un avec six doigts ou trois bras. Ils semblaient tous semi-réalistes. Quelques images de Nano Banana étaient suffisamment réalistes pour que je puisse les utiliser sur les réseaux sociaux ou à d'autres fins, et ChatGPT s'améliore définitivement. Ma prédiction ? L’année prochaine à la même époque, nous ne serons plus en mesure de faire la différence entre une vraie photo et une fausse.








