La recherche audio et video, c'est pour bientôt ?

Publié le 19 juin 2008 par Eogez
56 équipes issues de 17 pays différents vont, dans les prochains mois, plancher sur le développement d'une technologie de recherche basée sur l'analyse audio et vidéo (cela implique donc de la reconnaissance vocale et de la reconnaissance de formes comme les visages). Ils ont à leur disposition du contenu réel (documentaires télévisés, publicités et actualités) fourni par l'A*Star, qui est à l'origine de cette initiative.
Il existe déjà des systèmes de ce type mais ils utilisés dans des contextes bien précis comme la Défense. Les vidéos grand public sont autrement plus complexes à analyser : quantité de voix, qualité de l'image, multitude de choses à reconnaître, etc. Blinkx s'en sort plutôt bien...
Jérôme : Comme nous l'avons vu hier avec Facesaerch, il existe déjà par exemple chez Google des technologies de reconnaissance de portraits qui fonctionnent pas mal. Nous avons également des outils de recherche visuelle comme like.com (en maintenance au moment où j'écris ces lignes) qui est vraiment très intéressant. Donc oui, je crois à la possibilité de rajouter automatiquement des méta données aux vidéos et aux images. Concernant la voix, il y a maintenant longtemps (depuis la popularisation du téléphone) que de nombreuses recherches existent sur le sujet (c'est d'ailleurs il me semble les premiers travaux à avoir utilisé les N-Grams). Donc, encore une fois oui, je crois que d'un point de vue technologique de tels moteurs peuvent voir le jour dans un avenir proche. Mais d'un point de vue économique, je suis plus réservé : le traitement des flux vidéos et photos est bien plus gourmand en ressources que celui des simples textes. Qui pourra se permettre de lancer un tel projet à l'échelle du Web ? Quel sera le modèle économique pour que les revenus équilibrent les ressources nécessaires à ce genre de moteur ? De plus il ne faut pas oublier qu'un tel traitement nécessite une forte composante linguistique : ce qui signifie qu'un tel moteur n'est pas aussi facilement transposable d'une langue à l'autre que peut l'être un moteur de recherche par mots clés.
Bref, oui, j'y crois d'un point de vue technologique. Mais je suis plus réservé sur la faisabilité économique.
On peut s'attendre dans les prochaines années à l'apparition de moteurs de recherche nouvelle génération qui permettront, qui sait, de soumettre en guise de requête un extrait vidéo ou audio. Info ou intox ?