La surveillance à distance des conversations téléphoniques est techniquement possible sous certaines conditions. Voici comment.
À distance, vos appels peuvent être décodés grâce aux vibrations de votre téléphone
Des chercheurs de l’université de Penn State ont exploré une nouvelle technique de surveillance appelée « écoute sans fil ». Cette méthode consiste à déchiffrer des conversations téléphoniques à distance en analysant les vibrations très faibles émises par l’écouteur d’un téléphone portable.
Selon les chercheurs, il est possible de générer des transcriptions d’appels à partir de mesures radar prises jusqu’à trois mètres du téléphone. La précision reste limitée, autour de 60 % pour un vocabulaire de 10 000 mots, mais les résultats soulèvent des questions sur les risques pour la vie privée.
Les travaux ont été présentés à la conférence WiSec 2025, qui porte sur la sécurité et la confidentialité des réseaux sans fil. Ils s’appuient sur un projet précédent de 2022, où les mêmes chercheurs avaient réussi à identifier sans fil 10 mots, lettres et chiffres avec une précision allant jusqu’à 83 %.
« Quand nous parlons au téléphone, nous ne prêtons pas attention aux vibrations qui traversent l’écouteur et font trembler le téléphone », explique Suryoday Basak, doctorant et auteur principal. « En captant ces vibrations avec un radar et en utilisant l’intelligence artificielle, nous pouvons déchiffrer des conversations. L’objectif est de montrer les risques potentiels pour la vie privée. »
Quelle est la technique utilisée dans cette étude ?
Pour leur expérience, Basak et son directeur de recherche Mahanth Gowda, professeur agrégé, ont utilisé un capteur radar à ondes millimétriques, similaire à ceux utilisés dans les voitures autonomes et les réseaux 5G. Ils ont adapté un modèle de reconnaissance vocale open source appelé Whisper pour transformer les signaux radar en texte compréhensible. Pour cela, ils ont utilisé une technique d’adaptation de bas rang, qui permet de spécialiser le modèle sans réentraîner l’ensemble des paramètres.
Le dispositif expérimental capte les vibrations subtiles du téléphone lorsque quelqu’un parle dans l’écouteur. Les données sont ensuite traitées par le modèle Whisper adapté, ce qui permet d’obtenir des transcriptions avec une précision allant jusqu’à 60 %. La précision peut encore être améliorée grâce à des corrections manuelles et à des informations contextuelles sur la conversation.
Selon les chercheurs, cette approche peut être comparée à la lecture labiale. Même si une personne ne perçoit qu’une partie des mots, elle peut reconstituer une conversation grâce au contexte. De la même manière, les transcriptions radar combinées à des indices contextuels peuvent permettre de comprendre des parties d’une conversation téléphonique à distance.
Les chercheurs soulignent que cette étude a un but préventif : sensibiliser le public aux risques d’espionnage à distance et inciter à la prudence lors d’appels sensibles.
Source : psu.edu