Eviter le duplicate content
Le duplicate content est une problématique qui touche de nombreux sites, mais est souvent ignorée par la majeur partie des webmasters concernés.
La notoriété planétaire d’un moteur de recherche comme Google réside essentiellement dans sa capacité à fournir des résultats de recherche pertinents pour l’utilisateur. Si les moteurs présentaient plusieurs réponses identiques au sein de la même page de résultat, leur pertinence en pâtirait.
C’est pour conserver ce maximum de pertinence dans leurs résultats que les principaux moteurs de recherche ont mis en place des filtres de détection et de pénalisation (voire de suppression) des pages au contenu dupliqué. Un site avec des pages identiques détectées par les moteurs pourra ainsi se retrouver fortement handicapé dans sa quête de visibilité.
Voici les principaux cas de figure dans lesquels plusieurs url d’un même site peuvent pointer sur la même page :
-url avec (www.domaine.com) ou sans www (domain.com)
Ces deux écritures d’url pointent la plupart du temps vers la même page. Dans ce cas de figure, toutes les pages du site sont potentiellement duplicables.
-url racine (www.domaine.com) ou avec le fichier index (www.domaine.com/index.htm)
-url avec id de session (www.domaine.com/page.php?PHPSESSID=121DFD21)
Ce cas de figure affecte de nombreux sites dont les pages sont construites dynamiquement (php, asp, cfm…). Les pages des forums sont souvent confrontées à ce type de duplicate content. Les id de session changent chaque fois qu’un visiteur arrive sur votre site. En d’autres termes, à chaque fois que les moteurs passent indexer votre site, ils obtiennent le même contenu avec une url différente.
-plusieurs url dynamiques pointant sur la même page
www.domaine.com/produit.php?categorie=fruits&type=pomme
www.domaine.com/produit.php?variete=golden&type=pomme
Un produit (une pomme dans notre exemple) peut être localisé à plusieurs endroits dans la base de donnée, dans ce cas, la page « détail produit » générée dynamiquement est identique mais disponible via ces deux url.
Quels sont les mesures anti-duplicate content à prendre pour chacun de ces cas de figures ?
-url avec (www.domaine.com) ou sans www (domain.com) :
Utilisez une redirection 301 pour indiquer aux moteurs de recherche quelle version de l’url doit être prise en compte. Si votre site est hébergé sur un serveur apache, l’instruction de redirection s’effectue par l’ajout dans le fichier .htaccess du bout de code suivant :
RewriteCond %{HTTP_HOST} ^domaine.com
RewriteRule (.*) http://www.domaine.com/$1 [R=301,L]
Les webmasters sur serveur Microsoft IIS peuvent utiliser le module de réécriture d’url ISAPI_Rewrite.
-url racine (www.domaine.com) ou avec le fichier index (www.domaine.com/index.htm) :
Votre page d’accueil ne doit jamais pointer vers le fichier index de votre site. Si tel est le cas, votre home page s’en trouvera dupliquée (même contenu accessible par les deux url www.domaine.com et www.domaine.com/index.htm), et le pagerank de votre page d’accueil dilué entre ces deux versions.
Vous devez dans ce cas modifier tous les liens internes de votre site pointant vers la page index et rediriger ces liens vers la racine de votre site (www.domaine.com) via une instruction de redirection 301.
-url avec id de session (www.domaine.com/page.php?PHPSESSID=121DFD21)
La meilleur solution est de supprimer purement et simplement ces id de sessions. Pour les sites en php, l’insertion de ce code dans le fichier .htaccess permet de désactiver leur utilisation :
php_value session.use_only_cookies 1
php_value session.use_trans_sid 0
Si les id de session d’avèrent indispensables à une navigation optimale dans le site, enregistrez cette information sous forme de cookie. Cette solution a cependant le défaut majeur d’ôter certaines fonctionnalités de votre site aux visiteurs ayant désactivé le module d’acceptation des cookies.
-plusieurs url dynamiques pointant sur la même page :
Utilisez une redirection 301
Source : Ragepank
La notoriété planétaire d’un moteur de recherche comme Google réside essentiellement dans sa capacité à fournir des résultats de recherche pertinents pour l’utilisateur. Si les moteurs présentaient plusieurs réponses identiques au sein de la même page de résultat, leur pertinence en pâtirait.
C’est pour conserver ce maximum de pertinence dans leurs résultats que les principaux moteurs de recherche ont mis en place des filtres de détection et de pénalisation (voire de suppression) des pages au contenu dupliqué. Un site avec des pages identiques détectées par les moteurs pourra ainsi se retrouver fortement handicapé dans sa quête de visibilité.
Voici les principaux cas de figure dans lesquels plusieurs url d’un même site peuvent pointer sur la même page :
-url avec (www.domaine.com) ou sans www (domain.com)
Ces deux écritures d’url pointent la plupart du temps vers la même page. Dans ce cas de figure, toutes les pages du site sont potentiellement duplicables.
-url racine (www.domaine.com) ou avec le fichier index (www.domaine.com/index.htm)
-url avec id de session (www.domaine.com/page.php?PHPSESSID=121DFD21)
Ce cas de figure affecte de nombreux sites dont les pages sont construites dynamiquement (php, asp, cfm…). Les pages des forums sont souvent confrontées à ce type de duplicate content. Les id de session changent chaque fois qu’un visiteur arrive sur votre site. En d’autres termes, à chaque fois que les moteurs passent indexer votre site, ils obtiennent le même contenu avec une url différente.
-plusieurs url dynamiques pointant sur la même page
www.domaine.com/produit.php?categorie=fruits&type=pomme
www.domaine.com/produit.php?variete=golden&type=pomme
Un produit (une pomme dans notre exemple) peut être localisé à plusieurs endroits dans la base de donnée, dans ce cas, la page « détail produit » générée dynamiquement est identique mais disponible via ces deux url.
Quels sont les mesures anti-duplicate content à prendre pour chacun de ces cas de figures ?
-url avec (www.domaine.com) ou sans www (domain.com) :
Utilisez une redirection 301 pour indiquer aux moteurs de recherche quelle version de l’url doit être prise en compte. Si votre site est hébergé sur un serveur apache, l’instruction de redirection s’effectue par l’ajout dans le fichier .htaccess du bout de code suivant :
RewriteCond %{HTTP_HOST} ^domaine.com
RewriteRule (.*) http://www.domaine.com/$1 [R=301,L]
Les webmasters sur serveur Microsoft IIS peuvent utiliser le module de réécriture d’url ISAPI_Rewrite.
-url racine (www.domaine.com) ou avec le fichier index (www.domaine.com/index.htm) :
Votre page d’accueil ne doit jamais pointer vers le fichier index de votre site. Si tel est le cas, votre home page s’en trouvera dupliquée (même contenu accessible par les deux url www.domaine.com et www.domaine.com/index.htm), et le pagerank de votre page d’accueil dilué entre ces deux versions.
Vous devez dans ce cas modifier tous les liens internes de votre site pointant vers la page index et rediriger ces liens vers la racine de votre site (www.domaine.com) via une instruction de redirection 301.
-url avec id de session (www.domaine.com/page.php?PHPSESSID=121DFD21)
La meilleur solution est de supprimer purement et simplement ces id de sessions. Pour les sites en php, l’insertion de ce code dans le fichier .htaccess permet de désactiver leur utilisation :
php_value session.use_only_cookies 1
php_value session.use_trans_sid 0
Si les id de session d’avèrent indispensables à une navigation optimale dans le site, enregistrez cette information sous forme de cookie. Cette solution a cependant le défaut majeur d’ôter certaines fonctionnalités de votre site aux visiteurs ayant désactivé le module d’acceptation des cookies.
-plusieurs url dynamiques pointant sur la même page :
Utilisez une redirection 301
Source : Ragepank



1 commentaires:
Votre commentaire est intéressant , cependant que me conseilleriez vous sur un site : www.lesfeescreatives.com ou je commercialise des perles...difficile de trouver d'autres temrs que ceux employés sur le site.J'aimerais avoir votre avis.
Enregistrer un commentaire
Liens vers ce message:
Créer un lien
<< Accueil