Pour conserver l'attention des spectateurs, un système de visioconférence mis au point par Bell Labs adapte ses flux vidéos en fonction des émotions de l'utilisateur.
Lors d'une conférence, maintenir l'attention de son assistance peut s'avérer être un vrai parcours du combattant. Cette assertion se vérifie d'autant plus dans le cadre d'une visioconférence où la qualité de l'image peut être inadaptée aux besoins des téléspectateurs. Une équipe de chercheurs des Bell Labs d'Alcatel-Lucent s'est donc intéressée à l'optimisation des flux vidéos pour conserver l'attention de toute personne assistant à une visioconférence. Leur dispositif, présenté le 20 juin à l'occasion de l'Open Days Bell Labs, utilise l'informatique affective, c'est-à-dire des appareils capables de reconnaître et de synthétiser les émotions humaines, et l'applique à la technologie de la visioconférence.
Une technologie centrée sur l'utilisateur
L'adaptation du meilleur flux vidéo à un téléspectateur particulier se fait par la mise en place de deux types d'outils qui vont analyser le comportement des utilisateurs. Le premier, une caméra, permet de repérer les comportements physiques grâce à la reconnaissance faciale. Le second est un capteur qui mesure les ondes cérébrales et l'état de stress de l'utilisateur. « L'utilisation d'ondes cérébrales est l'élément le plus avant-gardiste de notre méthode, expliquent les chercheurs. Elle assure l'obtention rapide et efficace de relevés sur le niveau d'attention de l'utilisateur. » Un logiciel fondé sur un modèle de Markov caché récupère ensuite ces données stockées sur un serveur et les agrège afin de déterminer un flux vidéo qui attirera plus l'attention qu'un autre. Par ailleurs, l'intervenant peut lui aussi intervenir et générer des flux vidéos par l'utilisation de mots-clefs ou de gestes-clefs.
Vers un nouveau mode de visionnage
« Cette optimisation permet donc de présenter une image plus en accord avec les attentes des utilisateurs, continuent les chercheurs des Bell Labs. Elle pourrait avoir de nombreux domaines d'application. » Parmi ces exemples, les chercheurs livrent l'exemple de l'éducation, et les cours en ligne qui diffusent du contenu vidéo en seraient les premiers bénéficiaires. En effet les mesures collectées par la caméra et le capteur d'ondes cérébrales offrent un retour d'expérience au professeur instantané, et celui-ci peut générer des vidéos plus adaptées à la concentration des élèves. Une autre possibilité pourrait être l'utilisation de principe lors de rencontres sportives : elle permettrait au téléspectateur de s'attarder sur ce qui les intéresse réellement.