Google Knowledge Graph : la recherche sémantique est en marche

Publié le 17 mai 2012 par Brokenbird @JournalDuGeek

En mars dernier nous vous rapportions la rumeur selon laquelle Google s’apprêtait à proposer la recherche sémantique sur son moteur de recherche. Et bien nous y sommes presque. En effet la firme américaine a déployé ce qu’elle appelle le « Knowledge Graph« , littéralement le « Graphe de la connaissance » en français. De façon plus terre à terre on peut parler d’une gigantesque base de données.


Mais alors comment cela fonctionne t-il ?

Pour développer ce Knowledge Graph Google a utilisé deux notions, la notion d’objets qui peut prendre la forme d’une personne, d’un film ou de bien d’autres choses et la notion d’informations pures avec des types de données. Par exemple Larry Page est un objet, sa date de naissance est une donnée pure. Le but est donc pour Google d’établir les différentes données nécessaires pour décrire un objet et de les collecter pour les proposer sur son moteur de recherche. Pour l’objet « personne » ou « personnalité » on peut donc penser que la date de naissance, le lieu de vie et les travaux effectués sont intéressants.

Mais il existe une multitude de possibilités d’objets et la tâche s’annonce donc ardue. Pour établir sa base de données Google a utilisé différentes sources telles que Wikipédia qu’on ne présente plus et Freebase, une base de données développée par la société Metaweb rachetée par Google en 2010. Ainsi pour l’instant Google recense plus de 500 millions d’objets et plus de 3,5 milliards d’informations associées à ces derniers.

Pourquoi opérer de cette manière ?

C’est là qu’entre en scène la recherche sémantique. En effet en créant des objets et les types de données qui vont avec le moteur de recherche sera à même de répondre à de vraies questions. Ainsi pour reprendre l’exemple précédent Google « connait » l’âge de Larry Page, du coup il va bientôt devenir possible de demander « Quel est l’âge de Larry Page? ».

Ces requêtes sont bien plus naturelles pour l’utilisateur, certes c’est plus long à taper que les mots clés « Larry Page » et « âge » mais pour un néophyte qui ne sait pas vraiment comment fonctionne un moteur de recherche c’est beaucoup plus simple de poser la question comme il le ferait dans le monde réel. Toutefois cette fonctionnalité n’est pas encore implémentée de cette manière, l’occasion de voir comment se présente les résultats de recherche du Knowledge Graph dans sa forme actuelle.

La présentation des données

Jusqu’à présent Google se contentait de renvoyer les personnes qui cherchent quelque chose vers d’autres sites web, le moteur de recherche n’était donc qu’un passage et pas une finalité en soi. Avec le Knowledge Graph cela va changer puisque certaines informations apparaîtront directement sur le site web de Google. Pour présenter son nouveau service, la société décrit les trois améliorations en ce qui concerne la recherche sur son moteur.

La première consiste à chercher à comprendre quelle information un utilisateur souhaite vraiment obtenir. Ainsi certains mots clés peuvent paraître ambigus et présenter plusieurs significations. Dans le cas de Taj Mahal par exemple on peut soit chercher des informations sur le monument soit sur le musicien. Dans cette optique Google proposera donc le choix entre ces deux possibilités pour affiner la recherche :

La deuxième qui marque sans doute le plus gros changement dans la philosophie du moteur de recherche propose de regrouper les données relatives à un objet de façon claire et résumée directement sur la page du site. Ainsi lorsque vous cherchez par exemple des informations sur Marie Curie vous aurez droit à une courte biographie, à une photo, des lieux et toutes sortes d’informations jugées importantes. Le moteur de recherche propose également des suggestions, dans le cas de Marie Curie d’autres personnalités du domaine de la recherche sont proposées.

Enfin la dernière amélioration qui est sans doute la plus difficile à intégrer consiste à répondre à la question que vous n’avez pas encore posée. Pour répondre à cet objectif Google s’appuiera sur les suggestions, ces suggestions seront proposées grâce aux requêtes qui reviennent le plus fréquemment à propos d’un mot clé. Google se basera donc sur l’historique des recherches pour proposer les suggestions aux internautes.

Pour montrer comment cette fonction est implémentée, l’auteur du billet sur le blog de Google donne l’exemple de Matt Groening, le créateur des Simpsons. Il montre comment il est possible de répondre à la question qu’aurait pu se poser l’internaute « Comment lui est venue l’idée des prénoms des personnages » en soulignant que sur la courte biographie on peut voir des similitudes avec la famille de Groening. D’ailleurs si l’on compare le résumé de Marie Curie et celui de Matt Groening on voit bien que nous n’avons pas accès aux mêmes types d’informations, signe que ce sont les plus pertinentes qui sont privilégiées.

Toutes ces améliorations permettent aux utilisateurs d’effectuer des recherches plus fines, mais aussi d’avoir des résultats plus rapidement sans passer par un site tiers. Google ne doit toutefois pas oublier que ses revenus proviennent justement de ces sites tiers et doit donc jongler entre amélioration de son moteur de recherche et préservation de son modèle économique.

Ces nouvelles fonctionnalités ne constituent pas encore vraiment de la recherche sémantique, mais le fait de créer une base de données conséquente va bien dans ce sens et il est clair que c’est l’objectif de Google. Pour l’instant elle n’est implémentée que dans les pays anglophones, gageons qu’elle le sera bientôt chez nous. Google indique également que cette fonctionnalité sera disponible sur les appareils mobiles tels que les smartphones et tablettes. Je vous propose de regarder la vidéo de présentation de ce Knowledge Graph :

Source