Comment extraire les adresses email d’une page ?

Publié le 23 décembre 2008 par Annuairedugeek

Surement très utilisé par les spammeurs, la récupération d’email en “clair” sur une page est une chose assez simple à réaliser. Il suffit de bien savoir manier Unix, ce qui ne devrait pas poser beaucoup de problèmes aux geeks qui suivent ce blog.

Vous avez besoin d’un serveur ou directement sur votre machine unix et de cette commande:

echo exec(”wget -q -O - http://www.annuairedugeek.com/contact.html | grep -oe ‘\w*.\w*@\w*.\w*.\w\+’ | sort -u”, $result);

Il faut bien entendu adapter l’url au site que vous voulez explorer

On peut donc facilement comprendre que certains site, notamment les réseaux sociaux comme Facebook, protègent les email en les transformant en image ou en les  affichant de cette façon annuairedugeek[at]gmail[dot]com.

Une autre solution est d’utiliser la librairie CURL de PHP. Mais j’en parlerai un autre jour…

Partagez cet article avec les autres geeks