Duplicate content, s’en protéger
Le duplicate content nuit à la qualité de votre site et engendre des pénalités d’indexation. Les moteurs de recherche, vont pour préserver la qualité de leurs résultats, pénaliser vos pages en mettant en avant des sites proposant un contenu non dupliqué. Il est donc important dans votre stratégie SEO de mettre en place des moyens de lutte contre le duplicate content.
Qu’est-ce que le duplicate content ?
Le contenu dupliqué, ou duplicate content, désigne un contenu présent en plusieurs exemplaires.
Il y a duplicate content lorsque 2 contenus identiques se trouvent sur 2 sites différents donc 2 URL différentes. Il existe différentes formes de duplicate content qui peuvent se retrouver sur un même nom de domaine (même site) ou sur un nom de domaine différent (différents sites).
Les causes :
Exemple : sur un blog, la page d’accueil liste vos différents articles ; si vous ne tronquez pas le texte affiché, votre page d’accueil, vos pages de tags, vos pages catégories et votre page d’articles seront considérées comme des copies.
Le near duplicate content décrit le fait d’avoir des pages réellement différentes mais se ressemblant to de même.
Environ 30% des pages sur le web sont des doublons.
Cas de duplicate content le plus fréquent
Les problèmes liés au duplicate content
le problème est lié à une mauvaise gestion du contenu par l’utilisateur.
Par exemple, pour une page dupliquée et indexée, la recherche d’un internaute pourra donner les 5 ou 10 premiers résultats identiques en terme de contenu : l’internaute n’y trouvera donc aucun intérêt.
Qu’elles sont les causes du duplicate content ?
Comment contourner les sanctions du duplicate content ?
Une balise HTML a toutefois été validée par Google, la balise « canonical » qui permet d’éviter le duplicate content en indiquant à ses robots quelle page est la page d’origine en cas de contenu dupliqué.
Cette balise est à insérer dans la section <head>
du code HMTL des pages qui dupliquent un contenu, de la façon suivante :
<link rel= »canonical »
href= »http://www.votresite.com/pagedorigine.html » />
Ainsi, les pages de duplication ne sont plus indexées et indiquent aux moteurs de recherche quelle est la page d’origine qu’il faut indexer et à laquelle il faut attribuer tout le poids, ainsi que le PageRank. > Ceci ne fonctionne qu’à l’intérieur d’un même domaine y compris dans les sous-domaines. > Validée par Yahoo et Microsoft, la balise est prise en compte dans leurs moteurs de recherche.
Un plugin Wordpress est déjà disponible afin de simplifier l’implantation de cette balise.
Des informations détaillées à ce sujet sont disponibles sur le site de Google Webmaster Central : http://googlewebmastercentral.blogs...
Comment favoriser un contenu unique ?
Outils anti Duplicate content
Voici quelques outils pour vous permettre de vérifier ou trouver du contenu dupliqué "Duplicate Content", sur le Web. Il vous suffira simplement d’entrée l’URL de la page dont vous souhaitez vérifier que le contenu n’a pas été plagié.
Sources :