ChatGPT: OpenAI lance un générateur d'images plus avancé que Dall-E

Publié

OpenAIChatGPT remplace Dall-E pour créer des images photoréalistes

OpenAI a intégré à son modèle de langage GPT-4o un nouveau générateur d'images, présenté comme «le plus avancé à ce jour».

Le nouveau générateur d'images d'OpenAI remplace Dall-E 3 et est intégré au modèle GPT-4o de ChatGPT.

Le nouveau générateur d'images d'OpenAI remplace Dall-E 3 et est intégré au modèle GPT-4o de ChatGPT.

OpenAI

OpenAI a annoncé le lancement d'un nouveau modèle pour la génération d'images. En cours de déploiement, il est directement intégré à ChatGPT avec son modèle GPT-4o. Présenté par OpenAI comme son «générateur d'images le plus avancé à ce jour», il remplace Dall-E 3, lancé par OpenAI en 2023, qui pourra néanmoins continuer à être utilisé.

Avec ce nouvel outil, la société américaine promet «une génération d'image qui n'est pas seulement belle, mais utile». Accessible directement dans le fil de la conversation avec le célèbre chatbot, ce nouveau modèle «pratique, précis et puissant» permet aux utilisateurs de générer des images «exactes et photoréalistes» à partir de consignes écrites en langage naturel. Entraîné sur de nombreuses images, il peut aussi s'inspirer de visuels fournis par l'utilisateur et est capable de modifier, dans un second temps, les résultats générés.

Des textes écrits correctement

L'un de ses grands avantages réside dans son aptitude à écrire correctement du texte, contrairement à d'autres concurrents, y compris Dall-E 3. Dans l'un des exemples présentés, OpenAI montre comment son outil – qu'elle appelle 4o Image Generation – est capable de générer l'image photoréaliste d'une employée écrivant un texte précis sur un tableau blanc, avec le reflet d'une personne la prenant en photo. Le modèle, en mesure de générer différents formats, comme des bandes dessinées, ne rechigne pas à représenter des personnalités célèbres, comme Karl Marx, immortalisé par un paparazzi après avoir fait du shopping dans un centre commercial. Dans nos tests, il a par exemple créé des photos de Donald Trump à Lausanne, Meghan Markle à Berne, ou encore Roger Federer à Paléo, avec une ressemblance moindre pour ce dernier.

Image générée par GPT-4o de ChatGPT à partir de la consigne suivante: «Une image large prise avec un téléphone d'un tableau blanc en verre, dans une pièce surplombant le Bay Bridge. Le champ de vision montre une femme en train d'écrire, portant un t-shirt avec un grand logo OpenAI. L'écriture semble naturelle et un peu désordonnée, et on voit le reflet du photographe.»
Résultat pour la consigne «une photo candide de Karl Marx, prise par un paparazzi, traversant à la hâte le parking du Mall of America, jetant un coup d'œil par-dessus son épaule avec une expression effrayée pour essayer d'éviter d'être photographié. Il tient à la main plusieurs sacs de shopping en papier glacé remplis de produits de luxe. Son manteau flotte derrière lui dans le vent et l'un des sacs se balance comme s'il était en pleine course. L'arrière-plan flou avec des voitures et une entrée de centre commercial lumineuse souligne le mouvement. Le flash de l'appareil photo surexpose partiellement l'image, lui donnant un aspect chaotique et tabloïd».
Résultat d'image générée avec la consigne: «Un chat regarde dans une flaque d'eau dans une rue, mais son reflet est celui d'un tigre, et les deux reflets sont déformés de manière réaliste par les ondulations de l'eau.»
1 / 7

Image générée par GPT-4o de ChatGPT à partir de la consigne suivante: «Une image large prise avec un téléphone d'un tableau blanc en verre, dans une pièce surplombant le Bay Bridge. Le champ de vision montre une femme en train d'écrire, portant un t-shirt avec un grand logo OpenAI. L'écriture semble naturelle et un peu désordonnée, et on voit le reflet du photographe.»

OpenAI

Malgré les qualités de son nouveau modèle, OpenAI reconnaît qu'il n'est pas parfait. «Nous sommes conscients des nombreuses limites actuelles que nous nous efforcerons de résoudre en améliorant le modèle après le lancement initial.»

Le nouvel outil est déployé auprès des abonnés payants Plus, Pro et Team, mais également aux utilisateurs de la version gratuite de ChatGPT. Ces derniers n'ont toutefois accès qu'à un nombre limité de générations d'images par jour. Il est aussi disponible dans l'outil de génération de vidéos Sora.

Ton opinion

1 commentaire
L'espace commentaires a été desactivé