Parmi toutes les informations multimédias engrangées sur le net, la difficulté pour l’utilisateur est de trouver ce qu’il cherche. Des chercheurs du pôle de compétitivité de l’Inria de Rennes ont créé un logiciel qui segmente le flux télévisé.
L'explosion de la quantité de documents multimédias numériques a engendré un très fort dynamisme de la recherche dans le domaine de l'indexation multimédia. Pour répondre à cette problématique des chercheurs français réunissant des spécialistes de compétences multiples (médias, bases de données, recherche d'information, statistiques...) se sont regroupés dans une Task Force baptisée TexMex. Leurs premiers résultats concrets ont donné jour à TexMix, une application qui permet de segmenter les flux vidéo
TexMix, montre et démontre
Ce prototype pourrait être directement adapté dans le monde industriel et entrepreneurial en ciblant les organisations qui détiennent de nombreuses archives vidéos, ou encore les diffuseurs d’information comme les télévisions et les radios. Selon les chercheurs, ce programme incorpore l’ensemble des algorithmes dédiés à l’agrégation de flux vidéos développés ces derniers années. Comme par exemple la transcrisption de la parole, ou encore l’algorithme de “l’entité nommée”. Le premier se centre sur la segmentation reposant sur la bande son et non sur l’image. Le second cible la bonne prononciation des patronymes ou les toponymes qui peuvent être difficiles à détecter, et qui fait souvent défaut dans les logiciels de transcription de paroles. Ainsi ces algorithmes créent des mots clés et des liens avec d’autres vidéos.
Un outil optimisé pour une recherche dans les gros volumes
Les algorithmes exploités permettent à TexMIX de découper et de segmenter les informations de façon automatique. Ainsi le logicel trouve les documents vidéos correspondant aux mots clès à travers un gros volume d’information. “Sept millisecondes suffisent pour extraire ces images dans une base qui en compte 1,5 million» explique le chercheur Hervé Jégou. Pour cela, le logiciel sélectionne des liens web qui présentent un rapport direct au thème ou bien fournit un complément d'information pour permettre à l'utilisateur d'aller plus loin dans ses recherches. Enfin, le dernier changement majeur est la possibilité de transférer le logiciel sur les appareil mobiles sans faire de modifications importantes. Cette capacité a être multi plateforme grâce à l’architecture HTML5 est un atout qui cependant doit être encore paufiné pour le rendre efficient aux besoins des entrerpises.