Actu

Meta lance un traducteur par IA capable de parler 100 langues

25 août 2023
Par Kesso Diallo
Meta présente son outil comme « le premier modèle de traduction d’IA multimodal et multilingue tout-en-un ».
Meta présente son outil comme « le premier modèle de traduction d’IA multimodal et multilingue tout-en-un ». ©kovop / Shutterstock

Baptisé « SeamlessM4T », cet outil multimodal utilise l’intelligence artificielle pour effectuer des traductions.

Poursuivant ses travaux dans le domaine de la traduction à l’aide de l’intelligence artificielle (IA), Meta vient de dévoiler « SeamlessM4T », un outil capable de traduire des phrases dans près de 100 langues, dont l’anglais, l’espagnol, le vietnamien ou encore le turc. Présenté comme « le premier modèle de traduction d’IA mulitimodal et multilingue tout-en-un », il peut effectuer des traductions de texte à texte, de parole à parole, mais aussi de parole à texte et de texte à parole, selon le groupe californien. 

« Notre modèle unique fournit des traductions à la demande qui permettent aux personnes parlant différentes langues de communiquer plus efficacement (…) SeamlessM4T reconnaît implicitement les langues sources, sans avoir besoin d’un modèle d’identification de langue distinct », a déclaré Meta AI, la branche dédiée à l’IA de l’entreprise, dans un article de blog

« Une avancée significative »

Pour concevoir un tel outil, la société s’est appuyée sur plusieurs de ses anciens projets. Parmi eux figurent le système de traduction vocale alimenté par l’IA et dédié au hokkien, une langue non écrite, dévoilé fin 2022. Plus tôt cette année, Meta a aussi dévoilé Massively Multilingual Speech, outil capable de détecter et identifier plus de 1 100 langues. 

« Construire un traducteur de langue universel, comme le poisson Babel fictif du Guide du voyageur galactique, est un défi car les systèmes parole-parole et parole-texte existants ne couvrent qu’une petite fraction des langues du monde », a expliqué Meta AI. La branche a affirmé que SeamlessM4T représente « une avancée significative » dans le domaine car ce modèle effectue l’intégralité de la tâche de traduction en une seule fois, alors que d’autres grands modèles de traduction la divisent entre différents systèmes. 

Éviter les erreurs et les dangers

Conscient des risques de mauvaise traduction et de génération de propos toxiques ou inexacts, Meta s’y est préparé. Lors du développement de SeamlessM4T, l’entreprise a construit un système capable d’identifier les mots toxiques ou sensibles, soit lorsque « la traduction peut inciter à la haine, à la violence, aux grossièretés ou aux abus ». Il permet de détecter quand un mot toxique est introduit dans la traduction alors qu’il n’était pas présent dans le contenu original.

Meta assure également que son modèle est en mesure de quantifier les préjugés sexistes dans les traductions. Il peut vérifier si une phrase utilise la forme genrée d’un mot, comme doctora en espagnol, et ensuite attribuer un pronom féminin dans une langue cible sans grammaire genrée de manière équivalente si nécessaire. 

À lire aussi

Article rédigé par
Kesso Diallo
Kesso Diallo
Journaliste