L’IA de Google peut extraire toutes les voix dans une vidéo (et c'est super efficace)

Il est relativement aisé pour la nature humaine de distinguer une personne par le son de sa voix si celle-ci parle au milieu d'une foule, mais paradoxalement l’intelligence artificielle d’un ordinateur est difficilement de le faire. Google semblerait être parvenu à réaliser cet exploit avec son Assistant Google. 

La solution trouvée s’avère finalement très simple. Dans un premier temps, le système isole les personnes en train de parler à l’aide des mouvements du visage. Ensuite, l'algorithme va créer une piste audio spécifique pour chaque individu identifié par l’IA. De cette façon, l’IA est capable d'extraire et diffuser une seule voix de deux individus qui parlent en même temps. Cette méthode fonctionnerait aussi si la personne cache partiellement son visage.

Dans le futur, cette avancée technologique pourrait être le fruit de nombreuses fonctionnalités dans les applications Google comme Hangouts et Duo. Elle permettrait d’entendre plus distinctement son interlocuteur au milieu d’un brouhaha et pourrait offrir aussi une meilleure qualité audio lors d’un enregistrement. La seule problématique évoquée par Engadget serait probablement la confidentialité. En effet, il serait bien plus facile avec cet outil d’écouter des gens sans leur consentement.

Posez une question dans la catégorie News du forum
Cette page n'accepte plus de commentaires
Soyez le premier à commenter
Commenter depuis le forum
    Votre commentaire