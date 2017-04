La synthèse vocale a franchi un nouveau cap avec l’arrivée de VoCo considéré comme le Photoshop pour l’audio d’Adobe. Si le logiciel nécessitait 20 minutes d’enregistrement vocal afin de reproduire la voix d’une personne, la startup Lyrebird ne demande qu’une minute. Le traitement vocal passera par la nouvelle API de la jeune entreprise canadienne et un traitement dans le Cloud.

Lyrebird a présenté quelques exemples audio sur son site internet. Et le moins que l’on puisse dire, c’est que le résultat est convaincant. Pourtant, le modèle n’aura parlé que pendant une minute sans mentionner les mots reproduits pour la synthèse vocale. La technologie de Lyrebird est également capable de varier l’intonation. Cependant, la performance de son système soulève d’importantes questions sur la sécurité et la circulation de fausses informations. Ses détracteurs pensent que l’API permet de manipuler les internautes qui peinent à distinguer la fiabilité d’un enregistrement audio. En outre, les escrocs auront la possibilité de se glisser sous la peau de quelqu’un autre afin de soutirer plus d’argent à leurs cibles.

À l’image de Photoshop et des photos qui sèment le doute sur le net, il faut dire que l’évolution de la synthèse vocale remet en question la validité des preuves audio. C’est dans ce contexte que Lyrebird a tenu à se défendre face aux nombreuses critiques. « Nous espérons que tout le monde sera bientôt conscient qu'une telle technologie existe et que la copie de la voix de quelqu'un d'autre est possible », a déclaré la startup dans un communiqué.

