Actu

La synthèse vocale de Google imite désormais la voix humaine à la perfection

29 décembre 2017
Par Laure Renouard
La synthèse vocale de Google imite désormais la voix humaine à la perfection

Google travaille à l’amélioration des fonctions vocales de ses services. Pour ce faire, il détaille la nouvelle version de son moteur de synthèse vocale, qui imite de manière bluffante la voix humaine.

Pour communiquer avec vous, les assistants vocaux s’appuient sur des moteurs de synthèse vocale qui tentent de reproduire au mieux les intonations et la fluidité d’une voix humaine. Les résultats sont de plus en plus naturels, mais peuvent difficilement se confondre avec des mots prononcés par de véritables individus, les intonations manquant généralement de naturel et les phrases paraissant hachées. Google, pour son Assistant, travaille évidemment sur le sujet. Et comme le relève le site Quartz outre-Atlantique, il a publié les résultats de ses recherches quant à un nouveau moteur de synthèse vocale, Tacotron 2.

Voix

Deuxième génération de moteur signé Mountain View, Tacotron 2 s’appuie sur des réseaux neuronaux capables de créer un spectrogramme (une représentation graphique des fréquences audio) lui-même traduit vocalement par WaveNet, le système créé par DeepMind (la division d’Alphabet-Google dédiée à l’intelligence artificielle). Tout cela pour obtenir une démonstration pour le moins convaincante d’une synthèse vocale capable de reproduire une voix humaine, si bien qu’on la confondrait presque avec un individu. Google livre d’ailleurs des exemples de phrases prononcées à l’aide de Tatrocon 2 couplé à WaveNet, le tout ne se traduisant pour l’heure que par une voix féminine. Ils témoignent non seulement d’une capacité à interpréter correctement des homographes à la prononciation différente, à énoncer des termes complexes, à reproduire l’intonation de phrases selon leur mode (affirmatif ou interrogatif, par exemple) ou encore à mettre en exergue certains termes. Vous pouvez vous faire une idée des résultats en écoutant les samples livrés par Google à cette adresse.

Malgré ces démonstrations, Tatrocon 2, pour l’heure uniquement entraînée dans la langue de Shakespeare, n’en est pas encore au stade commercial. Il ne serait toutefois pas étonnant de la voir débarquer sur Google Assistant dans le courant de l’année prochaine, en anglais du moins, avant une adaptation dans les autres pays où officie le système de Google.

Article rédigé par
Laure Renouard
Laure Renouard
Journaliste
Pour aller plus loin