Magazine High tech

Categorization fail...

Publié le 26 mai 2010 par Sid

Accès interdit

U

n confrère mais néanmoins ami me faisait récemment remarquer que mon site perso était bloqué par le proxy filtrant déployé sur le réseau de son employeur :

Accès à un site interdit.
Le site auquel vous tentez d'accéder est classé dans la
catégorie : "Social Networking; Society and Lifestyles"
qui est une catégorie interdite car il ne présente pas, 
a priori, un intérêt professionnel

Par contre, le blog, lui, est accessible. Il tombe en effet dans la catégorie "Productivity PG; Message Boards and Forums" qui semble moins bloquée par les utilisateurs du produit, contrairement à la menace planétaire que représentent les réseau sociaux...

Une recherche rapide montre que c'est l'ami Websense qui s'est loupé dans la catégorisation du site. Car si je conçois qu'on puisse considérer la lecture de mon blog comme une perte de productivité, j'ai du mal à imaginer en quoi quelques pages statiques peuvent constituer un réseau social... À la limite, qu'ils me collent dans en "Bandwidth PG" à cause des photos, voire des vieilles vidéos qui font hurler les psychopathes qui me servent d'hébergeur...

C'est un peu le problème de ces services de listes noires. On ne sait jamais comment c'est maintenu, et en l'occurrence comment est fait le classement. On nous explique certes que la catégorisation met à profit une super technologie innovante, propriétaire et brevetée, ainsi qu'un peu de travail humain pour obtenir des résultats qui déchirent :

Websense utilizes a combination of proprietary classification 
software and human inspection techniques to categorize and 
maintain URLs to ensure real-time protection against today's 
blended threats.

Ça ne nous apprend pas grand chose. Et peut-être que la part de l'humain ne se résume qu'à l'intervention des webmasters pour indiquer l'erreur de classement[1]. En fait, je serais rudement curieux de connaître les critères qui ont amené leur moteur à penser qu'il s'agissait d'un site de réseau social.

Mais ce n'est pas bien grave au fond, puisque de toute manière, on a affaire à un problème inhérent à ce type de service dont on comprend bien que les gestionnaires, quels qu'ils soient, ne puissent pas catégoriser l'intégralité du web dans toute sa variété et ses langues sans se tromper. Et ce bien qu'ils s'en vantent.... Enfin, tout frustrant pour l'ego que puisse être la perte un lectorat ô combien désiré, il faut bien reconnaître que ce genre d'erreur n'est comparé aux monstrueuses boulettes que nous pondent régulièrement certains opérateurs de listes noires antispam qui n'hésitent pas à blacklister des FAI complets, voire des TLD. Ce qui fait relativiser l'efficacité de ces services, quand ils arrivent régulièrement à vous couper d'une partie du net...

Ceci étant, si je n'aime pas les proxies web filtrant, ce n'est pas parce qu'ils bloquent mes pages. C'est parce qu'ils m'empêchent de faire une partie de mon travail. Et je pense partager cette constatation avec tous ceux qui font un tant soit peu de veille, dont une bonne partie se fait sur la toile. Je ne connais évidemment pas l'étendue des dégâts pour les autres secteurs d'activité, mais s'il y a une chose dont je suis sûr, c'est que dans le domaine de la sécurité informatique, c'est véritablement gonflant. Pour rester poli. Entre les erreurs de catégorisation, celles qui sont pour le moins exagérées[2], et ce qui est compréhensible, mais ne nous aide pas à y accéder pour autant, il y a parfois de quoi être agacé...

En fait, je ne comprend même pas que d'aucuns puissent simplement imaginer que quelqu'un qu'ils voudraient qualifier d'expert en sécurité informatique puisse se satisfaire d'un accès ainsi bridé dans son activité de tous les jours. Franchement, à part une crasse ignorance de ce qu'est ce métier, je ne vois pas. Et je ne parle même pas de certains qui voudraient qu'on s'en servent pour lancer des tests d'intrusion...

Mais pour en revenir à mes moutons, voila qui m'apprendra à dire du mal des gens ;)

Notes

[1] Ce que je me suis empressé de faire, évidemment ;)

[2] Pas mal de repositories d'outils de pentest de font bloquer régulièrement par exemple...


Retour à La Une de Logo Paperblog

A propos de l’auteur


Sid 341 partages Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte l'auteur n'a pas encore renseigné son compte