OpenAIChatGPT remplace Dall-E pour créer des images photoréalistes
OpenAI a intégré à son modèle de langage GPT-4o un nouveau générateur d'images, présenté comme «le plus avancé à ce jour».

Le nouveau générateur d'images d'OpenAI remplace Dall-E 3 et est intégré au modèle GPT-4o de ChatGPT.
OpenAIOpenAI a annoncé le lancement d'un nouveau modèle pour la génération d'images. En cours de déploiement, il est directement intégré à ChatGPT avec son modèle GPT-4o. Présenté par OpenAI comme son «générateur d'images le plus avancé à ce jour», il remplace Dall-E 3, lancé par OpenAI en 2023, qui pourra néanmoins continuer à être utilisé.
Avec ce nouvel outil, la société américaine promet «une génération d'image qui n'est pas seulement belle, mais utile». Accessible directement dans le fil de la conversation avec le célèbre chatbot, ce nouveau modèle «pratique, précis et puissant» permet aux utilisateurs de générer des images «exactes et photoréalistes» à partir de consignes écrites en langage naturel. Entraîné sur de nombreuses images, il peut aussi s'inspirer de visuels fournis par l'utilisateur et est capable de modifier, dans un second temps, les résultats générés.
Des textes écrits correctement
L'un de ses grands avantages réside dans son aptitude à écrire correctement du texte, contrairement à d'autres concurrents, y compris Dall-E 3. Dans l'un des exemples présentés, OpenAI montre comment son outil – qu'elle appelle 4o Image Generation – est capable de générer l'image photoréaliste d'une employée écrivant un texte précis sur un tableau blanc, avec le reflet d'une personne la prenant en photo. Le modèle, en mesure de générer différents formats, comme des bandes dessinées, ne rechigne pas à représenter des personnalités célèbres, comme Karl Marx, immortalisé par un paparazzi après avoir fait du shopping dans un centre commercial. Dans nos tests, il a par exemple créé des photos de Donald Trump à Lausanne, Meghan Markle à Berne, ou encore Roger Federer à Paléo, avec une ressemblance moindre pour ce dernier.
Malgré les qualités de son nouveau modèle, OpenAI reconnaît qu'il n'est pas parfait. «Nous sommes conscients des nombreuses limites actuelles que nous nous efforcerons de résoudre en améliorant le modèle après le lancement initial.»
Le nouvel outil est déployé auprès des abonnés payants Plus, Pro et Team, mais également aux utilisateurs de la version gratuite de ChatGPT. Ces derniers n'ont toutefois accès qu'à un nombre limité de générations d'images par jour. Il est aussi disponible dans l'outil de génération de vidéos Sora.