J’ai découvert un excellent schéma de la gestion des contenus en double faite par les moteur de recherche qui provient d’elliance et trouver via l’excellent webilus
Ce schéma résume en 4 étapes le processus général de découverte et de gestion des contenus doublons. Voici donc un résumé des ces différentes étapes :
1- La Découverte :
À cette étape, les robots des moteurs de recherche parcourent le Web en suivant les hyperliens afin de détecter les nouvelles pages ainsi que les modifications au contenu en les comparant aux pages déjà indexées dans son index.
2- L’élimination :
Durant cette étape les différents algorithmes déterminent si un contenu est digne de figurer dans l’index en se basant sur les endroits où ce contenu est référencer. Il s’agit d’un processus sommaire ou les moteurs tentent de déterminé si le contenu reçoit ses références de sites de qualité ou si c’est un processus artificiellement gonflé ( achat massif de lien, mauvais entrenoeuds ou encore de sources ayant déjà participé ou participant à des opérations de spam auprès des moteurs de recherche.
3- L’analyse :
Lors de cette étape les algorithme examinent les contenus restant de manière plus détaillés afin d’en déduire la pertinence et la qualité selon de critère d’appréciations tel que la qualité des liens entrants, les ancrages utiliser dans ces liens et le contenu de la page. C’est à cette étape que des critères tel que le PageRank ( Dans le cas de google) commencent à être calculer. Les contenus jugés moins pertinent sont soit éliminés complètement de l’index ou reçoivent un poids moins fort lors du classement dans les recherche.
4- La Définition :
Cette étape détermine lequel des contenus est le plus susceptible d’être la source et lesquels les complémentes dans le but d’allouer les différents classements au contenus qui sont à la fois les plus pertinents et originaux.
En conclusion, la création de contenus et les endroits où ils sont présents sont déterminants pour le classement d’un site dans les moteurs de recherche. En effet, plus vos contenus sont originaux, varier et de qualité plus ils correspondent à la finalité des engins de recherche qui consiste à nous permettent de trouver des résultats pertinents !