OpenAI lance ChatGPT Images 2.0 avec un raisonnement de la série O

OpenAI a officiellement lancé ChatGPT Images 2.0, améliorant considérablement ses capacités de génération d’images IA, suite à la sortie de GPT-Image-1.5 en décembre 2025. Le nouveau modèle, qui a été testé sur LM Arena AI, peut générer des images détaillées avec de longs blocs de texte, des interfaces utilisateur réalistes et même recréer des personnages réels, dont Sam Altman.

Cette mise à jour représente une avancée substantielle dans la façon dont OpenAI aborde les médias visuels. ChatGPT Images 2.0 peut créer des plans d’étage, des grilles d’images, des modèles de personnages et appliquer des fonctionnalités aux images téléchargées par les utilisateurs, indiquant le passage de la visualisation des images simplement comme décoration à leur compréhension comme une forme de langage.

OpenAI n’a pas fourni de comparaisons de référence pour le nouveau modèle, mais il affirme que les performances correspondent aux capacités « de pointe », en particulier par rapport au modèle Nano Banana 2 récemment publié par Google, qui propose également l’intégration de texte dans les images. Les rapports suggèrent que ChatGPT Images 2.0 pourrait le surpasser en termes de fidélité et de reproductions de l’interface utilisateur.

Dans le cadre de son engagement en faveur de la sécurité, OpenAI intégrera le marquage des métadonnées dans les images générées par l’IA, répondant ainsi aux préoccupations croissantes concernant l’utilisation abusive potentielle de la technologie de l’IA dans des contextes politiques. Lors d’un récent briefing, Adele Li, responsable produit d’OpenAI, a souligné les mesures proactives de l’entreprise pour empêcher l’ingérence politique grâce à des protocoles de sécurité avancés.

Le modèle mis à jour intègre des capacités de raisonnement de la « série O », qui lui permettent de rechercher et d’examiner des mises en page avant de générer des images, améliorant ainsi sa capacité à créer des ressources de narration visuelle cohérentes. Les démonstrations ont montré que le modèle pouvait synthétiser des documents complexes et reproduire avec précision des cartes, marquant un bond en avant en termes de fonctionnalités par rapport aux itérations précédentes.

Les fonctionnalités d’Images 2.0 ont été structurées pour prendre en charge la typographie haute fidélité et la génération de texte multilingue, résolvant ainsi des problèmes de longue date dans les images générées par l’IA. Cette itération peut produire un texte cohérent dans des écritures non latines, offrant ainsi une accessibilité améliorée aux utilisateurs du monde entier.

OpenAI a défini un système d’accès clair à plusieurs niveaux pour le déploiement. Les utilisateurs gratuits auront un accès standard au modèle de base, tandis que les utilisateurs Plus et Pro auront accès à des fonctionnalités avancées, notamment le raisonnement assisté par l’IA et la possibilité de générer plusieurs images en maintenant la continuité à partir d’une seule invite.

La structure tarifaire pour les développeurs d’API a diminué par rapport au modèle précédent. La génération d’images coûte 8,00 $ par entrée et 30,00 $ par sortie, tandis que la génération de texte coûte 5,00 $ pour les entrées et 10,00 $ pour les sorties. Le passage à ChatGPT Images 2.0 indique que l’approche d’OpenAI est orientée vers l’adoption par les entreprises, permettant des tâches créatives plus complexes pouvant faciliter une productivité plus élevée.

En réponse à une concurrence croissante et aux progrès technologiques, OpenAI reste concentré sur l’amélioration de la sécurité et de la satisfaction des utilisateurs tout en fournissant des outils d’IA de pointe. À mesure que les fonctionnalités de ChatGPT Images 2.0 évoluent, la société vise à combler le manque d’intention dans la création artistique IA, en garantissant qu’elle répond à la fois aux besoins des utilisateurs et aux normes éthiques.

Crédit d’image en vedette

OpenAI lance ChatGPT Images 2.0 avec un raisonnement de la série O

Related Stories

OpenAI a approuvé le lancement public des modèles GPT-5.6 le 9 juillet

Meta lance un outil pour détecter les images générées par l’IA avec un filigrane invisible

Claude Cowork peut désormais exécuter des tâches depuis votre téléphone

Apple apporte des commandes vocales Siri plus personnelles à la version bêta 3