Décryptage

Bye bye Dall-E : ce que change GPT-4o Image Generation, le nouveau générateur d’images d’OpenAI

06 avril 2025
Par Florence Santrot
Bye bye Dall-E : ce que change GPT-4o Image Generation, le nouveau générateur d’images d’OpenAI
©OpenAI/Générée avec GPT-4o

OpenAI frappe fort avec son nouveau générateur d’images, GPT-4o Image Generation, reléguant Dall-E au rang de souvenir. Plus rapide, plus souple, plus puissant… On vous explique tout ce que cette mise à jour apporte et les questions qu’elle soulève.

Le 27 mars 2025, OpenAI a discrètement révolutionné l’image générée par IA. Sans tambour ni trompette, l’entreprise de Sam Altman a basculé de son célèbre générateur Dall-E vers une nouvelle technologie intégrée dans GPT-4o, baptisé GPT-4o Image Generation. Un succès immédiat : plus d’un million de nouvelles inscriptions à ChatGPT ont été enregistrées dans l’heure qui a suivi l’annonce. Il faut dire que le changement n’est pas qu’un rebranding : c’est une refonte complète du moteur visuel maison. 

Et depuis lundi 31 mars dernier, la fonctionnalité est désormais disponible pour tous les utilisateurs de ChatGPT, y compris ceux de la version gratuite, avec un système de quotas. Et elle s’accompagne d’une série d’évolutions techniques qui promettent de faire date dans l’univers des générateurs d’images par intelligence artificielle. Une nouveauté qui n’est pas passée inaperçue : le grand public s’est rué sur le nouvel outil. « Nos GPU sont en train de fondre », a même plaisanté Sam Altman sur X, face à l’afflux massif d’utilisateurs. Et d’ajouter : « Nous allons introduire temporairement certaines limites [d’usage]. J’espère que ce ne sera pas long ! »

Une génération d’image plus fluide et plus intelligente

Avec GPT-4o Image Generation, OpenAI abandonne définitivement Dall-E et sa méthode de génération en « patchs », pour une approche dite autogressive. Concrètement, l’image est produite pixel par pixel, de gauche à droite et de haut en bas, ce qui permet une bien meilleure cohérence visuelle, notamment lorsqu’il s’agit d’intégrer du texte ou de générer des visages. Une prouesse que Dall-E ne maîtrisait pas totalement. Le revers de la médaille est que cette technologie nécessite une puissance de calcul importante… et va donc encore alourdir l’impact carbone des usages de l’IA.

La performance est au rendez-vous : les résultats sont plus nets, plus fidèles aux prompts, et surtout plus rapides. L’expérience utilisateur s’en ressent immédiatement : pas de chargement interminable, pas de brouillon mal fichu en guise de première version. GPT-4o Image Generation affiche une image complète en quelques secondes, avec une qualité qui rivalise déjà avec les meilleurs modèles du marché, comme Midjourney ou Stable Diffusion. Résultat : en quelques heures, les réseaux sociaux ont été inondés d’images générées avec GPT-4o, des plus artistiques aux plus absurdes. Mais l’outil n’est tout de même pas parfait : la technologie reste perfectible dans certains cas complexes, comme la génération d’images avec des éléments très spécifiques ou des compositions artistiques particulièrement sophistiquées.

La génération d’images désormais gratuite… avec des limites

Autre révolution : l’accès grand public. Là où Dall-E était réservé aux utilisateurs abonnés payants de ChatGPT Plus (20 € par mois) par exemple, GPT-4o Image Generation s’ouvre à tout le monde, sans surcoût. Une décision stratégique d’OpenAI qui entend démocratiser l’usage de l’image générée, quitte à brider légèrement les performances selon le niveau d’abonnement.

Les utilisateurs gratuits peuvent ainsi générer jusqu’à trois images par jour (à l’heure où nous écrivons cet article, les nouveaux comptes ne peuvent pas générer de vidéo, mais ce n’est que passager). Les abonnés Plus bénéficient, eux, d’une capacité accrue (jusqu’à 100 requêtes selon la disponibilité des serveurs), et les entreprises peuvent intégrer cette technologie via l’API. Mais, même pour les abonnés premium, face à la demande explosive, OpenAI a dû instaurer des files d’attente et des limites de fréquence pour éviter l’embouteillage numérique. « Notre priorité est de maintenir une expérience stable et rapide pour tout le monde, même dans les pics d’usage », a expliqué un porte-parole d’OpenAI à The Verge.

Van Gogh-Terminator IA
Terminator peint par Van Gogh, une illustration créée par l’intelligence artificielle d’OpenAI.©Image générée par GPT-4o

Une précision redoutable et déjà des controverses artistiques

Mais cette montée en puissance pose aussi de nouvelles questions. L’intégration du texte dans les images, autrefois très approximative, est désormais étonnamment précise. On peut demander un logo, une affiche de film, une couverture de magazine : GPT-4o sait faire, et le fait bien. C’est un atout de taille, mais aussi un levier pour toutes sortes d’usages problématiques (publicité trompeuse, plagiat, fausses informations visuelles…). Les préoccupations sur le plan éthique et juridique sont majeures.

L’affaire « Ghibli-gate », survenue dès les premiers jours de déploiement, l’a prouvé : des milliers d’images pastichant l’univers visuel du Studio Ghibli (célèbre studio d’animation japonais) ont afflué sur les réseaux. De quoi déclencher l’ire de nombreux artistes et soulever, une fois de plus, la question du respect des droits d’auteur et de la propriété intellectuelle dans l’ère de IA. « Voir quelque chose d’aussi brillant, d’aussi merveilleux que l’œuvre de Miyazaki être massacré pour donner naissance à quelque chose d’aussi immonde. Mon Dieu, j’espère que le Studio Ghibli poursuivra OpenAI en justice pour ça », a dénoncé sur X la dessinatrice indépendante Karla Ortiz.

Risques éthiques et juridiques

À l’instar de ce Ghibli-gate, des artistes pourraient voir leur travail copié ou détourné sans leur consentement, ce qui pose un problème majeur en termes de propriété intellectuelle. Si on ajoute à cela la création facilitée de deepfakes (surtout qu’on peut intégrer le visage de personnes connues dans les images et vidéos), ces risques nécessitent une régulation stricte et des garde-fous technologiques pour éviter les dérives.

exemples generations image gpt-4o
Il est beaucoup trop simple de générer une image de style Ghibli avec le nouveau générateur d’image GPT-4o.©Image générée par GPT-4o

OpenAI devra donc travailler en étroite collaboration avec les législateurs et les parties prenantes pour garantir un usage responsable et éthique de cette technologie révolutionnaire.

OpenAI mise gros : vers une fusion des médias générés

En toile de fond, ce changement illustre la nouvelle stratégie d’OpenAI : unifier les formats générés dans un même écosystème. Texte, voix, image, code, tout converge dans GPT-4o. Et les ambitions sont claires : proposer un assistant créatif complet, capable de produire du contenu multimodal sans cloison. Une façon de se démarquer de ses concurrents qui proposent souvent l’un ou l’autre des formats, mais pas un écosystème intégral.

exemples generations image gpt-4o
Exemples de generation d’images avec GPT-4o.©Images générées par GPT-4o

Cette orientation s’inscrit aussi dans une dynamique de levée de fonds impressionnante. En mars 2025, OpenAI a obtenu 40 milliards de dollars supplémentaires, principalement de SoftBank, portant sa valorisation à plus de 300 milliards. De quoi alimenter la guerre des modèles, avec Anthropic, Google DeepMind et Mistral en embuscade.

Le futur de l’image générée s’écrit maintenant

Avec GPT-4o, OpenAI signe non seulement une mise à jour technologique majeure, mais aussi un tournant culturel. L’image générée devient un outil fluide, puissant, presque banal. Ce qui était autrefois réservé aux studios ou aux experts est désormais accessible à tous – pour le meilleur, le pire… et surtout dans le plus grand des flous juridiques.

Reste à savoir si les prochaines étapes permettront de résoudre les conflits d’usage, ou si l’innovation continuera à courir plus vite que la régulation. En attendant, les artistes s’organisent, les juristes s’énervent… et les internautes, eux, s’amusent.

À lire aussi

Article rédigé par