Article

Dall-E, ChatGPT… des IA génératives pas très douées en orthographe

14 janvier 2023
Par Kesso Diallo
Il revient aux humains de faire attention à l'orthographe avec les IA génératives.
Il revient aux humains de faire attention à l'orthographe avec les IA génératives. ©Tada Images/Shutterstock

Si les intelligences artificielles sont douées dans plusieurs domaines, notamment celui de la créativité, ces systèmes ne sont pas aussi forts que les humains avec l’orthographe.

L’intelligence artificielle ne cesse d’impressionner dans le domaine de la créativité ces derniers mois. Des systèmes comme Dall-E ou Stable Diffusion sont capables de générer des images ou des vidéos à partir d’une simple description textuelle. D’autres, à l’instar de ChatGPT, peuvent rédiger des articles de presse, critiques et autres types de texte.

Malgré ces capacités, ces IA sont loin d’être parfaites, comportant encore des limites. Elles ne sont ainsi pas capables (pour le moment ?) d’égaler, voire de surpasser les humains dans plusieurs domaines. C’est notamment le cas avec l’orthographe.

Des erreurs non détectées

Les difficultés de ces systèmes avec l’orthographe ont été démontrées le mois dernier avec une campagne de communication de Bescherelle publiée sur les réseaux sociaux. Dans le cadre de celle-ci – axée sur les IA génératrices d’images – la marque des éditions Hatier a collaboré avec Brainsonic, agence de publicité à l’origine de l’initiative.

« Ça fait déjà quelques mois qu’en tant qu’agence de pub, on s’intéresse à l’intelligence artificielle tout en ayant envie de voir comment ça fonctionne. Il y a un aspect fascinant, révolutionnaire, un peu flippant aussi, parce qu’on se dit qu’on va se faire remplacer par la machine. Mais, comme tout est dicté par l’écrit, on s’est dit “si aujourd’hui, on ne sait pas écrire, on n’arrivera pas à avoir des résultats corrects” », explique Alban Pénicault, directeur de la création chez Brainsonic.

Bescherelle et l’agence de publicité ont prouvé cela avec deux IA particulièrement connues : Dall-E et Midjourney, intégrant volontairement des fautes d’orthographe dans leurs descriptions textuelles. Ces deux systèmes sont tombés dans le piège, générant littéralement des images de ce qui leur était demandé : « une jolie maison dans une forêt de pains », « une compétition de seau en hauteur » ou encore « un enfant jouant avec un cerf volant ». « Des expressions assez basiques, des choses du quotidien, avec des homophones, qui pouvaient donner des images étant très vite compréhensibles », précise Julia Rérolle, directrice marketing et commerciale Éducation grand public chez Hatier.

Des IA encore incapables de se passer de l’humain…

L’intérêt de cette campagne était en effet d’être à la fois ludique, mais aussi qu’une personne voit directement la faute d’orthographe pour ne pas avoir à expliquer la démarche intellectuelle. « C’était vraiment une façon d’utiliser l’IA pour montrer l’importance de l’orthographe et de la syntaxe encore aujourd’hui, car on entend souvent dire qu’on écrit moins vu qu’on est tous sur nos téléphones et que beaucoup de choses passent par l’oral. Au contraire, la communication passe de plus en plus par l’écrit avec les smartphones, le commerce en ligne, etc. Une maîtrise de l’orthographe et de la syntaxe est donc fondamentale pour se faire comprendre aujourd’hui. On a voulu rebondir là-dessus en disant qu’effectivement, l’IA peut permettre de faire beaucoup de choses mais elle ne peut pas encore se passer de l’humain et d’une bonne orthographe », indique Julia Rérolle.

Si l’IA est capable de bien des choses, on a en effet tendance à oublier que derrière ces systèmes se cachent souvent des humains. C’est ce qu’on appelle le « digital labor », soit des activités où des personnes travaillent dans l’ombre et sont payées pour effectuer des tâches répétitives comme la catégorisation de contenus publiés sur les réseaux sociaux. Même les internautes discutant avec ChatGPT ou d’autres IA les entraînent et améliorent ainsi gratuitement leurs performances.

… et loin de remplacer les professeurs

Les IA génératrices d’images ne sont pas les seules à avoir des problèmes avec l’orthographe. C’est aussi le cas des systèmes comme ChatGPT, le robot conversationnel d’OpenAI qui surprend par ces capacités depuis son lancement en novembre. « Attention, n’utilisez pas ChatGPT pour apprendre la grammaire à vos enfants ! L’IA ne va pas tout de suite remplacer le professeur », a tweeté en décembre Emmanuel Freund, cofondateur et président de PowerZ, une startup qui veut aider les enfants à apprendre par le jeu vidéo.

Et ce n’est pas pour rien qu’il affirme cela. Sa publication était accompagnée d’une capture d’écran montrant que le fameux chatbot n’est pas doué avec la grammaire, commettant plusieurs erreurs et semant la confusion concernant les règles d’accord. Il assure ainsi que « le choix entre “des robes marron” et “des robes marrons” dépend de l’adjectif qui précède le nom ». Selon lui, l’adjectif s’accorde par exemple en genre et en nombre avec le nom s’il est placé avant ce dernier, ce qui donne « des robes marron » au singulier et des « chats marrons » au pluriel. Il va même jusqu’à dire qu’« il existe des exceptions à cette règle, comme certains adjectifs qui ne s’accordent jamais en genre et en nombre ». Ce serait le cas de « pauvre » qui ne prendrait jamais de “s”, ChatGPT illustrant cela avec « des chats pauvre » et « des chats de couleur pauvre ». 

Malgré les capacités de l’intelligence artificielle, ce n’est donc pas demain que ces systèmes pourront se passer des humains, notamment pour l’orthographe. Dans ce domaine, il revient encore aux utilisateurs de faire attention, de ne pas compter sur ces IA pour détecter ou corriger leurs fautes et encore moins pour remplacer les professeurs de français.

À lire aussi

Article rédigé par
Kesso Diallo
Kesso Diallo
Journaliste
Pour aller plus loin