Le Deep Web sous la griffe du programme Memex

Crédits : geralt / Pixabay

C’est un laboratoire de l’armée américaine qui a présenté dans le courant du mois de février Memex, un programme de recherche internet capable d’aller explorer les pages web introuvables sur les moteurs de recherches classiques, ce qu’on appelle le « deep web ».

La majorité des utilisateurs d’Internet à travers le monde n’ont quasiment rien vu de ce qui se passe sur la toile. En effet, nous n’avons accès qu’à une minuscule partie de l’ensemble du contenu web, généralement par le biais de nos moteurs de recherche classiques. « Certains estiment que Google, Microsoft et Yahoo ne nous donnent accès qu’à 5% du contenu du Web » commente à ce sujet Chris White, un ingénieur de la Darpa, une agence du département de la Défense des États-Unis, et créateur du programme.

Le web est donc semblable à un iceberg, où la partie immergée s’appelle le « deep web« . Inaccessible par les moteurs de recherche classiques, et protégé par des logiciels spécifiques (Tor, etc…), ce contenu web est surtout réputé pour les activités criminelles qui s’y déroulent. Chris White a donc mis au point un programme de type « moteur de recherche », capable d’explorer à la fois le web classique et le « deep web« . Un programme qui s’appelle Memex.

Ce moteur de recherche est non seulement précieux pour parcourir ces profondeurs du web, mais il analyse aussi les résultats trouvés, et établit des liens entre eux. Les informations sont ensuite représentées sous forme de graphiques, de cartes ou de frises chronologiques, plutôt que sous forme de liste de popularité, afin de faciliter l’expérience utilisateur. « Nous voulons que les résultats de recherche s’adaptent aux utilisateurs, et non le contraire » affirme Chris White.

Pour le moment seulement destiné à la défense américaine, ce programme a été testé avec succès puisqu’il a permis le démantèlement d’une filière de prostitution aux Etats Unis. Comme nous l’explique le figaro, « Memex était capable de repérer de nombreuses pages cachées faisant la promotion de services sexuels, puis de récupérer des données permettant d’identifier le lieu de leur publication: géolocalisation d’un appareil, adresse IP, numéro de téléphone ou une adresse mentionnée dans la réclame. Elles étaient ensuite compilées, recoupées puis associées aux photos de femmes figurant sur ces pages.« 

Ne restait plus ensuite qu’à suivre les mouvements de ces prostituées, et de transmettre toutes les informations à la police. Une opération saluée par le Président Obama en personne : « Il s’agit d’un bel exemple de la manière dont le Big Data peut aider à protéger les personnes vulnérables« .

Sources : 01net, lefigaro