Les chercheurs de Xerox viennent de concevoir un nouveau logiciel capable de faire le lien entre des textes et des images. Il s’agit d’une technologie révolutionnaire dans le domaine de la catégorisation des informations, qu’elles soient imprimées ou en ligne. En raison de la multiplication des contenus numériques, les documents qui associent des textes et des illustrations sont de plus en plus nombreux. Cependant, les outils actuels classifient ou étiquettent les textes ou les images pour pouvoir les traiter, mais ne permettent pas de relier les deux de manière efficace. En reliant l’image au texte et inversement, la nouvelle technologie logicielle de Xerox améliore considérablement les principales tâches dans le domaine de la gestion documentaire telles que la recherche d’informations ou le routage automatique de documents. Les résultats sont ainsi plus complets et les workflows rationalisés.
Par exemple, si la brochure d’un hôtel isolé situé dans les Alpes décrit les caractéristiques de l’hébergement et comporte des cartes et des photos des montagnes environnantes, le nouveau logiciel de catégorisation de Xerox reconnaîtra automatiquement le contenu, et établira un lien entre le texte et les images. Ainsi, si une personne recherche un hébergement isolé en montagne et dans une certaine fourchette de prix, il accédera à la brochure même si celle-ci ne mentionne pas dans son texte « hébergement isolé en montagne ». Cette technologie s’inscrit parfaitement dans la stratégie de Xerox visant à développer des documents plus intelligents afin de faciliter l’accès aux informations.
Marco Bressan, responsable de l’équipe de recherche au Xerox Research Centre Europe (XRCE de Grenoble), est convaincu que ce nouveau logiciel de catégorisation aura de multiples utilisations : « Prenons le cas d’un voyageur souhaitant regrouper ses photos et son journal de bord pour produire un album photo annoté ou un blog photo qui retracent les grands moments de ses vacances. Avec le logiciel de catégorisation de Xerox, il pourra identifier les photos et les mettre automatiquement en relation avec les commentaires, ou encore enrichir les illustrations avec des informations complémentaires par le biais d’hyperliens vers une base de connaissance telle que Wikipedia. »
Ce nouveau logiciel pourrait également servir dans les centres d’imagerie de Xerox. En effet, la société y analyse et numérise des documents pour créer des archives d’informations en ligne, sécurisées et disponibles à la recherche pour ses clients. Actuellement, le processus d’analyse, d’étiquetage et d’indexation des documents est partiellement supervisé par des opérateurs. Une catégorisation hybride permettrait de rationaliser la gestion documentaire, en améliorant sa précision et en éliminant certaines opérations manuelles.
Le logiciel hybride de Xerox s’appuie sur de récentes avancées technologiques en matière d’apprentissage automatique et de reconnaissance des formes, ainsi que sur un grand nombre de contenus hybrides disponibles. Le XRCE bénéficie d’une forte expérience dans le domaine de la catégorisation de textes, et a présenté en 2005 la première technologie capable de catégoriser des images génériques. Ce nouveau logiciel s’appuie sur les spécificités des précédents, et permet désormais de gérer des contenus hybrides avec d’excellents résultats. « La technologie de Xerox créée un espace commun de connaissance couvrant les textes et les images », conclut Marco Bressan. « Les informations textuelles et visuelles s’enrichissent mutuellement. Et le tout est bien plus efficace que la somme des parties. » Cette nouvelle technologie logicielle, toujours en cours de développement, a fait l’objet de plusieurs dépôts de brevets de la part de Xerox.
Les scientifiques et ingénieurs de Xerox mènent principalement leurs recherches dans les domaines de la science des couleurs, de l’informatique, de l’imagerie numérique, des méthodes de travail, des systèmes électromécaniques, des nouveaux matériaux et dans d’autres domaines liés à l’impression et à la gestion de documents. Pour de plus amples informations : http://www.xerox.com/innovation