Magazine Entreprise

Open Calais : Reuters nous rapproche du Web sémantique

Publié le 16 février 2008 par Jean-Marie Le Ray


[MàJ - 20 février 2008] « Les autorités européenne et américaine de la concurrence ont donné, mardi 19 février, leur accord sous conditions à l'acquisition du groupe britannique Reuters, connu comme une des principales agences de presse, par le canadien Thomson Corporation, actif sur les marchés de l'analyse juridique, fiscale et comptable. Le nouveau groupe sera l'un des plus grands fournisseurs mondiaux d'informations et de données. » (source : Le Monde)
Le 8 février, Devin Wenig annonçait à Tim O'Reilly que l'avenir de son groupe, Reuters, passait par le Web sémantique (ou Web 3.0 ?). Le lancement d'Open Calais a suivi cette interview de quelques jours.
Open Calais : Reuters nous rapproche du Web sémantique
En fait, il s'agit d'un service Web (technologie ClearForest, voir ici) capable de rattacher automatiquement au contenu que vous soumettez des métadonnées sémantiquement riches, en catégorisant et en liant vos documents à des entités (des gens, des lieux, des organisations, etc.), des faits (‘X’ travaille pour la société ‘Y’) et des événements (‘X’ a été nommé PDG de la société ‘Y’ le jour ‘J’). Ces métadonnées sont ensuite stockées dans une archive centralisée et vous sont retournées sous forme de modèle RDF accompagné d'un identifiant unique (GUID : Globally Unique Identifier).

The Calais web service automatically attaches rich semantic metadata to the content you submit – in well under a second. Using natural language processing, machine learning and other methods, Calais categorizes and links your document with entities (people, places, organizations, etc.), facts (person ‘x’ works for company ‘y’), and events (person ‘z’ was appointed chairman of company ‘y’ on date ‘x’). The metadata results are stored centrally and returned to you as industry-standard RDF constructs accompanied by a Globally Unique Identifier (GUID).

Le tout de manière transparente (sans privilégier d'approche top-down ou bottom-up) et simple (les modèles RDF sont créés à la volée), voir la FAQ et un peu de documentation.
L'API est également décrite ici. J'ai l'impression qu'à peine lancé, le concept jouit déjà d'un retour fortement positif, avec un premier client SOAP qui a déjà vu le jour, un module Drupal, et combien d'autres applications à venir ? Y aura-t-il des connexions possibles avec Twine, c'est également probable.
En tout cas, cela pourrait bien marquer un tournant dans la transition du Web actuel vers le Web 3.0... Alors, est-ce la fin du Web 2.0 ? (petit clin d'œil au passage ;-)
Source. À noter que Reuters offre 5000 $ à qui développera un plugin pour Wordpress via son Bounty Program...


Retour à La Une de Logo Paperblog

A propos de l’auteur


Jean-Marie Le Ray 633 partages Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte l'auteur n'a pas encore renseigné son compte