Magazine Ebusiness

Le Web Sémantique : la “fin” de Google ?

Publié le 01 octobre 2007 par Christophe Da Silva

Le Web Sémantique, la fin de Google ?L’écho de la Recherche Sémantique se fait de plus en plus intense. Si en France, on en écoute toujours à peine parler, elle est devenue une réalité aux Etats-Unis et Google, pris dans la spirale de Wall Street, en quête de leadership sur des niches de marché plus profitables que le Search Marketing, pourrait avoir quelques soucis face à de nouvelles startups dédiées à la Recherche Sémantique, a priori beaucoup plus efficaces que le traditionnel moteur de recherche de Google, qui malgré la sophistication de son algorithme d’indexation, se repose quelque peu sur ses lauriers. Dans notre travail de veille, nous avons trouvé un article en anglais sur ce sujet publié le 21 septembre dernier par Tomio Geron, sur Red Herring. Nous avons décidé que cette information d’outre-Atlantique pouvait vous être utile et nous avons donc décidé de vous traduire cet article.

La Recherche Sémantique

Toujours plus d’entrepreneurs et d’investisseurs promettent une nouvelle génération d’Internet qui serait plus organisée, plus simple d’utilisation et faciliterait les recherches des internautes. Le Web Sémantique serait basé sur une technologie de recherche qui parmettrait à des internautes de saisir leurs questions en utilisant le langage qu’ils y ont l’habitude d’employer. Les développeurs de cette nouvelle génération de moteurs de recherche disent que leur technologie “comprendrait” la sémantique du langage dans les requêtes effectuées, avec beaucoup plus de précision que la technologie du géant d’Internet, Google.

Les nouveaux moteurs de recherche crawleront donc le web à la recherche des pages déjà indexées pour fournir les meilleures correspondances. Des réponses spécifiques pourront être fournies comme “quelle est la meilleure compagnie pétrolifère au monde ?” différencier “movies by women” de “movies about women”.

Les startups de la Recherche Sémantique

C’est le but de cette poignée de startups de la Recherche Sémantique qui espèrent changer la manière dont les internautes voient les résultats des informations fournies sur Internet. Mais leur plus grand challenge est de défier Google, qui est passé leader de la recherche sur Internet en proposant le plus simple moteur, mais néanmoins sophistiqué, qui génère plus de la moitié des recherches des Etats-Unis. Le challenge peut être énorme, mais la récompense en vaut la peine car les résultats de recherche aujourd’hui vont de paire avec les annonces publicitaires. Don Dodge, qui dirige le développement économique de Microsoft, estime qu’1% du marché du search marketing aux Etats-Unis vaut environ 100 millions de dollars de revenus annuels et à 1 milliard pour le haut de la fourchette.

Hakia, moteur de recherche sémantique
Hakia, basé à New York, a déjà lancé son propre moteur de recherche sémantique avec de nombreuses critiques positives pour sa capacité à trouver rapidement une information extrêmement spécifique. La société a également mis en place un plug-in pour navigateur qui permet aux utilisateurs de trouver les sections exactes de documents qui contiennent les réponses de leur requête associée.

Les moteurs de recherche comme Google positionnent principalement les pages dans les résultats de recherche en fonction de leur popularité sans comprendre le contenu de chacune d’entre elles“, selon Melek Pulatkonak, directeur de Hakia. Chez Hakia, “un peu plus d’analyse est effectuée offline pour extraire la signification du contenu de chaque page”. Hakia a également mis en place une “tchatte box” qui permet aux utilisateurs de poser une question de manière instantanée, ce qui est plus dans l’ère du temps chez les jeunes. Hakia emploie pour le moment la plateforme d’annonces publicitaires d’Ask.com, mais espère développer sa propre plateforme dès 2008.

PowerSet, moteur de recherche sémantique
Le plus en vogue de ce groupe émergeant est PowerSet à San Francisco, malgré qu’il n’est toujours pas lancé son moteur de recherche. Il est soutenu par des investisseurs réputés comme Esther Dyson and the Founders Fund, connu pour avoir débaûché des ingénieurs de Google, et a obtenu l’autorisation d’employer la technologie du langage sophistiqué de Xerox. Comme toujours, obtenir d’un ordinateur de comprendre le langage naturel - et trouver les résultats de recherche appropriés - est un processus difficile.

Les sceptiques disent que la plupart des gens font une recherche avec en moyenne 2 mots. “Généralement, les internautes sont paresseux“, explique Jakob Nielsen, consultant en utilisabilité de sites web.

Barney Pell, directeur de PowerSet, concède que les moteurs de recherche sémantiques doivent convaincre les gens de changer leur manière de rechercher sur le Web. Mais les internautes “ont été formés” pour employer des mots-clés sur Google, bien que cela ne soit pas la manière naturelle dont pensent les gens. Donc les usages peuvent changer.

PowerLabs, moteur de recherche sémantique

PowerSet a lancé cette semaine PowerLabs (uniquement sur invitation), un programme destiné à tester une version de démonstration pour la recherche sur l’encyclopédie en ligne Wikipédia. Dans un exemple, le programme extrait des faits en relation avec des personnes ou des choses dans Wikipédia, comme Hulk Hogan. Il compare également les résultats de PowerSet côte à côte avec les résultats fournis par ses concurrents, pour montrer les progrès de la société.

D’autres sociétés adoptent une approche plus pragmatique en créant des produits sémantiques pour des tâches sémantiques spécifiques. La startup Radar Networks - soutenu par Paul Allen de Venture Capital et Leapfrog Ventures - a développé le partage d’informations et un service de collaboration qui permet aux utilisateurs de trouver et de partager des sites web, photos, produits, et toute autre information avec d’autres. On prévoit son lancement d’ici la fin 2007.

Un système déjà en place, AdaptiveBlue, soutenu par Union Square Ventures, dispose d’un gadget qui recherche automatiquement des livres, films ou musiques en relation avec n’importe quelle page web qu’un utilisateur est en train de surfer.

Google et la Recherche Sémantique

De son côté, Google dispose d’une armée d’ingénieurs travaillant sur le langage naturel, dont le très réputé Ramanathan Guha. Et la technologie de Google est déjà assez intelligente pour répondre à de simples questions comme “What is the population of Japan ?“.

Cependant, la philosophie de Google a été : “plus c’est simple, mieux c’est“. “Pour la majorité des questions, ce n’est pas ce que les gens veulent“, indique Peter Norvig, Directeur de la Recherche chez Google, dans une récente interview dans une revue technologique. “Ils ne veulent pas avoir le fardeau d’exprimer une pensée sous la forme d’une phrase complète“.

Les startups ont un avantage non négligeable : Google grandit rapidement sur des marchés tels que le traitement de texte, les systèmes de paiement en ligne, les dispositifs mobiles… Ces nouveaux marchés fournissent la plus haute croissance - et davantage de satisfaction à Wall Street - contrairement à ce que pourrait être le marché de la reconstruction de son moteur de recherche actuel. Ce qui laisse une ouverture béante pour ces startups - “si elles peuvent fournir aux utilisateurs une assez bonne raison de ne plus utiliser la puissante simplicité de Google“, indique Greg Sterling (Sterling Market Intelligence). “Ces moteurs ont besoin de créer des incitations pour changer et récompenser les internautes pour les modifications de leur comportement“, ajoute-t-il. “Si les moteurs de recherche sémantiques délivrent ce que les utilisateurs souhaitent, ils répondront à l’appel“.


Retour à La Une de Logo Paperblog