Surveillez vos paroles, un paquet de chips vous écoute

Crédits : MabelAmber / Pixabay

Serons-nous un jour espionnés par tout ce qui nous entoure ? Des chercheurs du MIT, Microsoft et Adobe ont mis au point un algorithme capable de transformer n’importe quel objet du quotidien en mouchard, grâce à des caméras très haute vitesse qui filment les plus infimes vibrations à leur surface.

« Lorsqu’un son percute un objet, celui-ci se met à vibrer.Cette ondulation crée un signal visuel très subtil habituellement invisible à l’oeil nu. Les gens ignoraient que ces informations étaient là. »  Voilà comment  Abe Davis, premier auteur de l’étude qui sera présentée au Siggraph 2014, pose les bases de réflexion qui ont animé ses recherches. La finalité du projet est de démontrer comment ces vibrations peuvent être enregistrées, puis « décodées » par un matériel adapté.

Quand l’image devient son

C’est là qu’entrent en scène les caméras à très haute vitesse, conçues pour enregistrer plusieurs milliers d’images par seconde. La technique à l’oeuvre, baptisée « microphone visuel » consiste donc à capturer le son à partir de l’image uniquement : l’algorithme nouvellement créé se charge d’analyser la propagation de ces micro-vibrations à la surface des objets filmés, pour ensuite reconstituer le son qui en est à l’origine. Les chercheurs ont également démontré qu’il était possible d’obtenir des informations avec du matériel vidéo standard, malgré une perte significative de fidélité dans la reconstruction du son.

Bien qu’à un stade peu avancé de sa mise en oeuvre, la méthode fournit des résultats probants : les données permettent de recomposer un discours intelligible, de déterminer le sexe et le nombre d’interlocuteurs présents dans la salle… Le tout en filmant un simple paquet de chips à 5 mètres de distance, isolé par un double vitrage.

La vidéo ci-dessous montre d’autres expériences, incluant l’utilisation d’une célèbre application de reconnaissance musicale…

Sources : Time, MIT,