Partagée sur TikTok, la vidéo montrant la réaction de sa mère est rapidement devenue virale.
Un cadeau unique pour Noël. Cette année, Phillip Willett, créateur américain de contenus sur Internet, a offert à sa mère un enregistrement de la voix de son père, décédé en 2022 d’un cancer du pancréas. Pour y parvenir, il a utilisé l’intelligence artificielle (IA). Initialement réticent à l’idée suggérée par son épouse d’exploiter cette technologie pour récréer la voix, il s’est laissé convaincre après avoir effectué quelques recherches en ligne.
Dans le détail, Phillip Willett a utilisé le logiciel de synthèse vocale d’ElevenLabs, société fondée par d’anciens employés de Google et de Palantir. Il s’est décidé à mener à terme son projet après avoir entendu les premiers mots dans la voix générée par le logiciel. « J’ai eu des frissons dans tout le corps », a-t-il déclaré à Good Morning America. Quelques heures lui ont suffi pour obtenir le résultat escompté : « Je me suis assis à mon bureau à 7 heures du matin et j’ai eu le produit final à 18 heures, mais je n’ai pas quitté mon bureau de toute la journée », a expliqué le créateur.
Des utilisations à des fins bienveillantes et malveillantes
Après avoir recréé la voix de son père, Phillip Willett a réalisé une vidéo avec des photos de lui et de sa mère, qu’il a présenté à celle-ci sous la forme d’un livre numérique quelques jours avant Noël. « Je voulais que la vidéo ressemble à un portail, qu’elle puisse ouvrir ce livre, s’y plonger et ressentir l’émotion de leur relation, a-t-il indiqué. Ce que l’IA a pu faire avec cette vidéo, c’est vraiment résumer toute leur vie ensemble ». Publiée sur TikTok, la vidéo montrant la réaction de sa mère est rapidement devenue virale, avec 6 millions de vues et 1,1 million de likes.
Le créateur suggère désormais aux autres d’explorer la possibilité d’utiliser l’IA générative à des fins bienveillantes, s’ils le souhaitent. Cette technologie peut aussi être exploitée à des fins malveillantes, des personnes ayant tiré avantage de son potentiel pour des arnaques téléphoniques. Début 2023, le logiciel d’ElevenLabs a également été utilisé pour générer des deepfakes de célébrités et leur faire tenir des propos racistes, transphobes ou encore violents.
Spécialisée dans la recherche sur les technologies vocales, la société a dévoilé, plus tôt cette année, un outil de doublage capable de traduire automatiquement un discours dans une langue différente tout en conservant la voix de l’orateur d’origine, afin d’éliminer les barrières linguistiques.