Magazine Internet

Recherche d'images : qu'est-ce qui marche(ra) le mieux ?

Publié le 22 octobre 2008 par Eogez
Sur l'excellent site de l'Atelier, on peut lire un nouvel article sur la recherche d'images. L'auteur nous explique qu'on va de plus en plus vers des moteurs de recherche qui n'utilisent pas ou plus seulement les textes descriptifs pour les retrouver. Il nous donne ainsi deux exemples de travaux : ceux du MIT et de l'université de San Diego et ceux de l'université d'Etat de Pennsylvannie.
Les méthodes sont en effet différentes :
  • Les premiers utilisent les codes - les suites de bytes ;
  • Les seconds, avec Alipr (Automatic Linguistic Indexing of Pictures in Real-Time), utilisent un logiciel de reconnaissance de formes et un système de mots-clés. Cela suppose bien évidemment un gros travail manuel d'alimentation de la base en images.
Pour les chercheurs de l'université d'Etat de Pennslvannie : "Les images sont bien plus diversifiées que la structure logique d'une phrase". Et donc, on a peu de chances d'avoir un jour des moteurs de recherche fiables à 100 %.
Pour les chercheurs du MIT et de l'université de San Diego, la fiabilité est également partielle : "la perfection en la matière n'existe pas." Il en va des objets comme des mots. "Même une personne maîtrisant parfaitement une langue découvrira toujours de nouveaux mots."
Je trouve que c'est bien de reconnaître les limites des systèmes, quels qu'ils soient.
Jérôme : Je m'interroge plus sur les utilisations réelles pour monsieur et madame tout le monde. J'en vois déjà une que j'ai testé ce week-end et que j'ai trouvé très intéressante et très bien faite : les name tags de picasa. J'imagine bien une recherche par image pour un site d'e-commerce ou un comparateur de prix afin de trouver les produits qui ressemblent à une photo (un peu comme like.com).
Mais quoi d'autre ? Vous avez des idées d'applications ?

Retour à La Une de Logo Paperblog

A propos de l’auteur


Eogez 5328 partages Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte l'auteur n'a pas encore renseigné son compte