OpenAI est de retour avec une autre mise à niveau des capacités d'image de ChatGPT, et celle-ci ressemble moins à un gadget qu'à une étape sérieuse vers la création de visuels d'IA réellement utiles. OpenAI a officiellement introduit ChatGPT Images 2.0, un nouveau système de génération d'images qui s'appuie fortement sur le raisonnement et la précision.
ChatGPT Images 2.0 se concentre sur la compréhension, pas seulement sur la génération
Au lieu de transformer aveuglément les invites en éléments visuels, le modèle adopte désormais une approche plus délibérée, consistant essentiellement à « réfléchir » à ce que vous demandez avant de générer l'image.
Ce changement se manifeste de plusieurs manières clés. Le modèle est bien meilleur pour gérer des invites complexes, peut maintenir la cohérence entre plusieurs sorties et est sensiblement plus fiable lorsqu'il s'agit de placer du texte à l'intérieur d'images, ce avec lequel les outils d'IA antérieurs avaient du mal.


De plus, il peut également générer plusieurs variations à partir d’une seule invite tout en gardant l’idée de base intacte, ce qui le rend beaucoup plus utile pour le travail itératif. Le résultat est un système qui ressemble moins à un générateur d’art IA qu’à un outil qui comprend réellement ce que vous essayez de créer.
C’est là que les images IA commencent à devenir pratiques
Ce qui rend cette mise à jour intéressante, c’est la direction que prend OpenAI. Il ne s’agit plus de rechercher l’art viral de l’IA, mais également de rendre la génération d’images utilisable dans des scénarios du monde réel. Avec un rendu de texte amélioré, une meilleure structure et des résultats plus prévisibles, ChatGPT Images 2.0 commence à prendre du sens pour des éléments tels que les présentations, les créations de réseaux sociaux ou les maquettes de conception rapide. Il ne remplace pas encore complètement les outils professionnels, mais il s'en rapproche suffisamment pour gérer une quantité surprenante de travail créatif quotidien.
Cela dit, ce n'est pas parfait. Il existe encore des incohérences occasionnelles, notamment avec des mises en page plus complexes ou des textes non anglais. Mais par rapport à la situation il y a à peine un an, les progrès sont difficiles à ignorer. Et si cette tendance se poursuit, la frontière entre les visuels « générés par l’IA » et « réellement utilisables » va se rétrécir très rapidement. ChatGPT Images 2.0 est disponible dès aujourd'hui pour tous les utilisateurs de ChatGPT et Codex, avec des sorties avancées utilisant Thinking disponibles pour les utilisateurs Plus, Pro, Business et Enterprise. Le modèle sous-jacent, gpt-image-2, est également disponible dans l'API.






