Magazine Internet

Google ne pénalise pas le duplicate content

Publié le 17 septembre 2009 par Christophe Da Silva
Alors que Matt Cutts a certainement déjà fourni une foule de conseils utiles via le Webmaster Central de Youtube, il n'est pas le seul à l'avoir fait. En effet, Greg Grothaus de l'équipe de recherche qualité de Google a posté une vidéo (avec une présentation faite sur le blog de Google Webmaster Central) couvrant le sujet du duplicate content (contenu dupliqué sur votre site) et les problèmes multiples auxquels les webmasters d'un site continuent d'être confrontés lorsqu'ils tentent de bien se positionner dans Google.

Grothaus dissipe le mythe de la pénalité pour contenu dupliqué

Dans la vidéo, Greg Grothaus commence par dissiper la croyance populaire que Google pénaliserait les sites qui proposeraient du contenu dupliqué. Google ne pénalise pas le contenu dupliqué ! Cela ne veut pas dire que le contenu dupliqué ne peut pas avoir un impact négatif sur votre classement, mais Google ne vous pénalisera pas pour ça.

Greg Grothaus indique que des personnes peuvent voir des messages comme celui ci-dessous et penser que leur contenu a été omis des résultats de recherche de Google, alors qu'en fait, il n'a été omis que pour une requête en particulier. Greg souligne que le contenu dupliqué est tout simplement un facteur "par requête".

Google et le contenu dupliqué

"Que se passe-t-il réellement ? Nous nous penchons sur la requête que l'utilisateur fait, et nous disons que nous voulons la diversité dans les résultats que nous montrons à l'utilisateur", explique Grothaus. Il ajoute que ceux qui pensent que leur contenu a été omis parce qu'il est en double, devraient plutôt se concentrer sur l'ajustement de leurs requêtes pour refléter plus précisément la partie manquante et voir si leur contenu apparait dans les résultats.

Google reconnaît que la plupart des contenus dupliqués ne sont pas créés pour être trompeurs. Il y a bien sûr des exceptions, qui sont considérées comme du spam. Grothaus avoue même que les sites spammeurs ne sont pas non plus pénalisés pour avoir un contenu dupliqué. Ils sont pénalisés pour spam. Tout comme certains spammeurs qui utilisent le formatage excessif en gras. Google ne pénalise pas les gens seulement pour leur utilisation. Il ne pénalise pas non plus les sites pour avoir un contenu dupliqué.

Exemples de contenu dupliqué

  • exemple.com/
  • exemple.com/?
  • exemple.com/index.html
  • exemple.com/home.aspx
  • www.exemple.com/
  • www.exemple.com/?
  • www.exemple.com/index.html
  • www.exemple.com/home.aspx

La liste présentée ci-dessus par Grothaus montre des exemples d'URLs qui sont différentes mais qui montrent le même contenu (en l'occurrence la page d'accueil d'un site). Google va reconnaître que c'est la même page, et tenter de choisir la bonne URL à montrer pour une requête précise (même si parfois Google ne choisit pas la bonne). Grothaus affirme que les webmasters sont les mieux placés pour savoir laquelle est la meilleure, et par conséquent, il est plus avantageux d'en utiliser qu'une seule.

Vous ne pouvez pas être pénalisé pour l'utilisation de plus d'une URL, mais il existe certains problèmes qui peuvent survenir et qui peuvent nuire à vos classements. D'une part, la popularité de votre lien sera diluée. Les backlinks pointant vers plusieurs URL au même contenu rendront plus difficile l'accumulation du link juice d'un lien. Grothaus ajoute aussi qu'avec de multiples versions d'un même contenu, Google perdra du temps à crawler la même chose, ce qui signifie qu'il aura moins de temps à consacrer à aller plus profondément dans votre site, au risque donc de voir du contenu finalement qui ne sera pas indexé.

Résolution du problème de duplicate content

Afin d'éviter ce type de problématique, Grothaus suggère l'utilisation de la version canonique de l'URL, c'est-à-dire, la forme la plus significative. Il explique qu'il faut choisir l'une des URLs et de la relier systématiquement dans votre site. Vous pouvez également employer l'attribut rel="canonical" dans votre lien comme l'explique Matt Cutts dans cette vidéo :

Les règles pour rel="canonical"

Il existe des règles pour l'emploi de cet attribut. D'une part, il doit seulement être employé pour relier des pages pour un même domaine. Cela fonctionne également pour les sous-domaines.

Vous pouvez l'utiliser également pour les protocoles comme http:// et https:// et aussi pour les ports. Si vos pages ne sont pas identiques, mais seulement semblables, donc avec de légères différences, alors vous n'avez pas besoin d'utiliser le rel="canonical". C'est juste une option, "un autre outil dans votre arsenal", comme le dit Grothaus.

Une autre option est de prendre toutes les URL non canoniques et de faire des redirections permanentes (301) vers l'URL canonique. En outre, depuis Webmasters Tools de Google, vous pouvez spécifier les www et les non-www. Les redirections 301 sont en général employées pour déplacer un site ou des pages.

Les domaines multiples

Finalement, Grothaus aborde le sujet des domaines multiples, en référence au fait que vous pouvez avoir du contenu pour différents publics (par pays, langue...).

Dans ce cas, il est à craindre que votre notoriété soit redistribuée au travers de ces domaines multiples, et Google ne montrera comme résultat que ce qu'il perçoit comme étant la meilleure page pour une requête en particulier. Et dans ce cas, vous êtes susceptibles de perdre vos Sitelinks (les différents liens présentés sous votre résultat dans les SERPs Google). En effet, si votre contenu est distribué sur plusieurs domaines, vous pourriez manquer des clics par ce simple fait.

La vidéo de Grothaus sur le duplicate content

Grothaus explique en détail tout ce qui précède dans cette vidéo de 15 minutes. Cette vidéo a été réalisée lors de sa conférence au récent Search Engine Strategies de San Jose.

Source : Webpronews


Retour à La Une de Logo Paperblog

A propos de l’auteur


Christophe Da Silva 999 partages Voir son profil
Voir son blog

l'auteur n'a pas encore renseigné son compte l'auteur n'a pas encore renseigné son compte

Magazine