Enquête

IA générative : il était une fois la révolution de l’image

29 novembre 2022

・ Par Florence Santrot

Image créée avec Dall-e grâce au prompt (traduit en français) "Rendu 3D multicolore d'un robot artiste content peignant un humain à côté d'un ordinateur en format panoramique".

L’intelligence artificielle peut-elle être créative ? Si les algorithmes ne sont pas des artistes, leur capacité à « imaginer » de toute pièce des images à partir d’une simple requête écrite est bluffante.

La créativité est-elle un signe d’intelligence ? Peut-on être libre sous la contrainte ? Autant de questions philosophiques qui pourraient s’appliquer à l’IA générative. Depuis quelques mois, on entend de plus en plus parler de ce nouveau concept de génération d’images grâce à l’intelligence artificielle (IA). Peut-être avez-vous vu passer les noms de DALL-E (GPT-3), MidJourney ou encore Stable Diffusion, pour ne citer que les outils les plus connus.

Ils sont capables de créer en une poignée de secondes une peinture, une photo ou un dessin sur la base d’une simple phrase descriptive. Cela peut être « un astronaute sur un cheval », mais aussi « rendu en 3D coloré d’un robot artiste joyeux en train de peindre une peinture avec des rayures », ou encore « vue panoramique d’une chaise dans le style pop art sur fond de forêt ». S’agit-il pour autant d’une œuvre artistique ? « Je ne crois pas que la machine crée quelque chose, indique Monty Barlow, directeur de l’apprentissage machine chez Cambridge Consultants. Elle prend un domaine dans lequel les humains sont extrêmement bons et elle trouve les mécanismes derrière. Mais il faut toujours que nous lui donnions une entrée initiale. »

IA générative : des programmes créatifs sous contraintes

Concrètement, il s’agit d’un réseau de neurones artificiels capable de résoudre des problèmes complexes, en l’occurrence la création d’images, suite à un apprentissage sur la base de millions d’images et de légendes associées. Les algorithmes apprennent peu à peu des styles artistiques (dessiner comme Van Gogh), les caractéristiques des êtres vivants (représenter un bébé, un tapir), des émotions (la joie, la peur…) ou encore des lieux (à la plage, au pied de la tour Eiffel…).

Ensuite, la puissance des calculateurs et les algorithmes d’intelligence artificielle permettent de créer des images originales en partant de contraintes (les instructions données par une requête formalisée par une personne) et en les adaptant à de nouvelles situations. À chaque fois que l’on soumet une requête, aussi appelée « prompt », le système va créer un nouveau visuel, assez proche du précédent ou très différent. C’est cette variable aléatoire dans l’algorithme qui est ce qu’on peut imaginer de plus proche de la créativité humaine.

« Si on a une idée précise en tête, il faut tout décrire : quel sujet, quel angle de la caméra, quel filtre artistique, veut-on un cadrage centré ou décalé, quelle texture, imagine-t-on une image avec beaucoup de couleur ou neutre, souhaite-t-on une photo ou une peinture, etc. »

Geoffrey Dorne
Designer

L’art de parler à l’intelligence artificielle ou des heureux accidents ?

Ces « heureux accidents » sont ce qui plaît à Geoffrey Dorne, designer indépendant de 37 ans qui s’est lancé dans le « prompt art » depuis début 2022 et a partagé sur son compte Twitter des images générées par IA. Son concept ? Via le hashtag #IAFP, il crée des images collant avec des titres d’actualité de l’agence de presse AFP. « J’adore tester les toutes dernières innovations tech. Mais je ne teste jamais dans le vide. Sur Twitter, j’avais remarqué que les infos de l’AFP étaient régulièrement non illustrées ou avec des illustrations ‘prétexte’. Je voulais voir si l’IA pouvait régler ce problème », explique-t-il.

En ce moment, @GeoffreyDorne utilise l'IA pour générer des images d'illustration pour la presse (#IAFP), le résultat est top MAIS SURTOUT je ne me remets pas de cette « canicule heureuse » publiée ce matin pour illustrer la Une de @lepopulaire_fr pic.twitter.com/ITPvGvJDQs
— Jules Grandin (@JulesGrandin) August 24, 2022

Mais comment parler à un outil d’IA Générative ? Si on peut imaginer au départ que c’est un peu comme apprendre à formuler une recherche dans Google, les prompts peuvent être bien plus complexes. « J’ai appris les bases du langage des signes il y a quelques années et je m’aperçois que cela me sert beaucoup pour créer des prompts car il faut vraiment être très descriptif, souligne le designer. Pour évoquer une poignée de porte, le langage des signes va décrire son usage (une barre en métal sur laquelle on appuie pour ouvrir une porte). C’est la même chose avec l’IA Générative. Si on a une idée précise en tête, il faut tout décrire : quel sujet, quel angle de la caméra, quel filtre artistique, veut-on un cadrage centré ou décalé, quelle texture, imagine-t-on une image avec beaucoup de couleur ou neutre, souhaite-t-on une photo ou une peinture, etc. »

L’art du prompt… et tout le business autour

Geoffrey Dorne travaille beaucoup avec l’IA MidJourney – particulièrement entraînée pour un rendu artistique quand Dall-E est meilleure dans le réalisme – qui est accessible sur un serveur de Discord, une plateforme de discussion. « L’avantage est qu’on peut suivre en temps réel toutes les requêtes soumises par les autres. Cela permet de voir comment les autres font pour créer leurs prompts puis se lancer », explique Geoffrey Dorne. Mais il est aussi possible d’être aidé. Le site Phraser.tech propose un outil gratuit qui guide pas à pas la création d’images pour ne (presque) rien oublier dans le descriptif.

PromptBase va encore plus loin. Il s’agit d’un site payant où quiconque peut venir vendre ses « prompts », que ce soit pour de la création d’images ou de l’écriture de textes (ce qu’on appelle l’IA Writing et qui repose sur les mêmes principes). La place de marché présente un exemple des résultats que l’on peut obtenir en utilisant l’un de ces prompts (chaque génération d’images sera différente). Si celui-ci vous plaît, il suffit de débourser 2 à 5 dollars en moyenne pour pouvoir l’utiliser. Vous découvrez alors le détail du prompt (un long texte qui rentre dans le détail avec des informations parfois assez techniques). Il vous sera ensuite possible d’utiliser vous-même ce descriptif en l’adaptant à vos besoins.

Le prompt créé par Phraser pour générer cette image dans Midjourney (traduit en français) est « Croquis multicolore d’un journaliste écrivant une histoire par Blender Guru, fait d’une texture duveteuse de pissenlit, plan moyen, avec un sentiment d’inspiration et d’amusement. »

L’épineuse question des droits d’auteur

L’IA générative pourrait-elle un jour remplacer les artistes ? Cela semble peu probable. « Tout le monde peut faire un prompt, c’est vrai, mais les illustrateurs ou encore les photographes sont à l’affût de milliers de petits détails (regard unique sur un sujet, angle, contexte, narration, propos à tenir, etc.). On peut aussi avoir un engagement politique et social qui se retranscrit dans nos créations, ce qu’une IA n’aura jamais », note le designer.

Reste la question du droit d’auteur. Geoffrey Dorne crédite et vend les créations imaginées par IA grâce à ses prompts mais il met un point d’honneur à toujours les retravailler a posteriori pour améliorer le résultat et l’adapter davantage à son goût. « C’est un peu à l’image des premiers samples de la musique hip-hop. Là, les IA vont piocher dans des millions voire des milliards d’images. Et c’est mon prompt qui va donner vie à une nouvelle création. » Il n’est pas seul : on trouve de plus en plus de ces créations par IA sur des banques d’images ayant pignon sur rue, comme Shutterstock. Elles sont identifiées comme telles et vendues de la même manière qu’une photo ou un dessin.

« En droit français, seul un être humain peut être l’auteur d’une œuvre et créer une œuvre originale. Or, dans le cas du Prompt Art comme Dall-E, SnowPixel, MidJourney… on considère qu’il n’y a pas d’intervention humaine dans la création même de l’image. Et le robot ne bénéficie d’aucun droit. »

Betty Jeulin
Avocate en droit numérique

Est-ce vraiment légal ? Betty Jeulin, avocate en droit numérique, explique qu’il existe encore un grand flou en termes de législation. « En droit français, seul un être humain peut être l’auteur d’une oeuvre et créer une oeuvre originale. Or, dans le cas du Prompt Art comme Dall-E, SnowPixel, MidJourney… on considère qu’il n’y a pas d’intervention humaine dans la création même de l’image. Et le robot ne bénéficie d’aucun droit. » Impossible donc de qualifier ces créations comme des « œuvres de l’esprit » et on tombe alors dans une sorte de vide juridique.

Un far west juridique… qui ne va pas durer

« Le droit d’auteur ne revient pas à la personne qui a créé le prompt. Pas plus que l’on ne peut réellement attribuer une paternité aux personnes qui ont entraîné l’algorithme. En attendant une législation plus claire, il faut se référer aux conditions d’utilisation des outils générateurs d’images par IA. Souvent, il est indiqué que l’image peut être utilisée en créditant l’outil, qui en conserve la propriété. En revanche, il n’est pas possible d’en faire commerce », détaille Betty Jeulin.

L’Union européenne laisse pour l’heure chaque pays légiférer selon sa volonté en la matière. En France, une loi sur l’intelligence artificielle est attendue pour début 2023, mais elle portera sur les risques critiques, par exemple en matière de santé et de transports. Les droits d’auteurs n’y figureront pas. Mais les sociétés de gestion collective de ces droits, comme la Société des gens de lettres (SGDL) ou encore la Sacem pour la musique, sont en pleine réflexion… et pourraient bientôt statuer chacune différemment sur la question. Une chose est sûre, on s’oriente vers l’obligation de préciser clairement quand une « œuvre » a été générée par intelligence artificielle.

Se pose enfin la question des droits des artistes dont les images ont été utilisées pour entraîner les algorithmes. Autant il peut paraître difficile d’attribuer une quelconque paternité à un artiste pour un détail dans une image, autant on peut comprendre que les représentants de Picasso ou Dalí menacent de poursuites des créations faites spécifiquement « dans le style de ». « Si la “patte” d’un artiste est aisément reconnaissable, alors on entre dans le domaine de la contrefaçon. Copier une œuvre et en tirer des bénéfices est déjà un cas puni par la loi », prévient Betty Jeulin.

La plateforme DeviantArt, qui permet aux artistes d’exposer en ligne, vient d’annoncer une nouvelle option : un « opt-out » pour les artistes afin d’interdire aux IA génératives d’utiliser leurs créations pour entraîner leur algorithme. Mais comment les isoler parmi des centaines de millions de visuels déjà soumis et s’assurer qu’une IA va « désapprendre » ? Un vrai casse-tête.

IA générative : des programmes créatifs sous contraintes

L’art de parler à l’intelligence artificielle ou des heureux accidents ?

L’art du prompt… et tout le business autour

L’épineuse question des droits d’auteur

Un far west juridique… qui ne va pas durer

À lire aussi