lundi 23 juillet 2007

Moteurs de recherche et duplicate content

Il n’existe pas un mais plusieurs filtres de détection de pages identiques mis en place par les moteurs de recherche. Ces filtres sont appliqués à chaque étape du processus de prise en compte des pages web par les moteurs : crawling, indexation et affichage des résultats de requêtes.

Un certain nombre de pages dupliquées visitées par les moteurs ne sont purement et simplement pas indexées. D’autres filtres de détection sont appliqués après le processus d’indexation : les pages indexées considérés comme identiques sont alors exclues des pages de résultats des moteurs de recherche.

Beaucoup estiment que l’index supplémentaire de Google a pour fonction de pénaliser ces pages dupliquées, il n’en est rien : le duplicate content n’est pas un critère d’insertion d’une page dans l’index supplémentaire : c‘est le niveau de PageRank qui détermine l‘inclusion dans cet index.

Une confirmation officielle est venue de Vanessa Fox, rédactrice du blog officiel de Google ( «un faible PageRank est souvent à l’origine de la présence d’une page dans l’index supplémentaire») et de Matt Cutts («avoir des url dans les résultats supplémentaires n’est pas une sanction. Le principal critère qui détermine l’indexation dans les résultats supplémentaires est le PageRank»).

La redirection 301 est souvent considérée comme le meilleur moyen d’éliminer les pages à contenu similaire. Tout dépend en fait de la situation donnée.

Le pointage de plusieurs url vers la même page constitue le cas typique pour lequel la redirection 301 est une solution adaptée. Si la page d’accueil de votre site est accessible via deux url ou plus (par exemple : masociete.com , masociete.com/index.htm , masociete.com/defaut.htm), la redirection 301 vous permettra de diriger les internautes vers l’url la plus appropriée.

Les moteurs de recherche utilisent leur propre critères de sélection pour choisir une url parmi celles liées à la même page. L’url prise en compte est appelée «url canonique». Soyez cependant pro-actif pour ne pas laisser les moteurs choisir à votre place l’url à afficher dans les pages de résultats.

La redirection 301 est également souvent employée pour conserver le PageRank d’une page qui n’existe plus : dans ce cas de figure, celle-ci se fait souvent vers la pager d’accueil. Ce type de redirection est peu pertinent pour l’internaute, auquel on ne présentera pas la page correspondante à sa demande. Une page d’erreur 404 personnalisée proposant un contenu similaire à la demande du chercheur serait plus adapté dans ce cas de figure.

Source : Search Engine Land

0 commentaires:

Enregistrer un commentaire

Liens vers ce message:

Créer un lien

<< Accueil