deMarin Dacos
Marin Dacos, pour le Cléo (Centre pour l’édition électronique ouverte) et Patrice Bellot, pour le LIA (Laboratoire informatique d’Avignon), sont lauréats duGrant Google pour les Digital Humanities. Google va en effet attribuer 50000$ aux deux laboratoires pour le projet de recherche et développement suivant : « Robust and Language Independent Machine Learning Approaches for Automatic Annotation of Bibliographical References in DH Books, Articles and Blogs« .
Ce programme de R&D porte sur les centaines de milliers de références bibliographiques insérées dans les textes publiés sur les plateformes du Cléo. Une des originalités du projet est de prévoir une très grande diversité de formes bibliographiques, et de prévoir une application aux trois portails :Revues.org,Calenda,Hypotheses.org. Il permettra de développer des fonctionnalités avancées de cross-linking (références croisées) à l’intérieur de la plateforme et vers l’extérieur de la plateforme. Les résultats seront rendus publics.
Il constitue la première pierre d’un programme ambitieux de fouille de texte (« text-mining ») sur le vaste corpus constitué par les trois portails du Cléo.
Le Cléo est un laboratoire duCNRS, del’Université de Provence, de l’EHESSet de l’Université d’Avignon. Il est financé notamment par leTGE Adonis. Il est implanté à Marseille et à Paris.
Lire la suite : http://leo.hypotheses.org/5942