IDENTIFIER ET COMBATTRE LES PROBLÈMES DE DUPLICATION DE CONTENU

IDENTIFIER ET COMBATTRE LES PROBLÈMES DE DUPLICATION DE CONTENU

Un récent article de Paddy Moogan de Distilled sur le moment où il faut utiliser une redirection 301 et celui où il faut utiliser un Rel = Canonical m’a fait réfléchir à toutes les façons possibles de lutter contre les problèmes de duplication de contenu.

Premièrement, pour ceux qui sont nouveaux dans le marketing de recherche, une pénalité pour contenu dup1nséquence que les moteurs de recherche imposent lorsqu’ils trouvent de grandes quantités de texte qui ont été copiés à partir d’autres sources sur le Web. Certains diront que les moteurs de recherche ne font que vous filtrer des SERP (pages de résultats des moteurs de recherche) afin de vous fournir un contenu plus pertinent et plus frais. Quoi qu’il en soit, vous n’en tirerez aucun avantage, et c’est donc une pénalité à mes yeux.

Qu’est-ce qui peut causer des problèmes de duplication de contenu ?

Les pages d’accueil dupliquées peuvent être considérées comme des pages individuelles, ce qui peut réduire les avantages que votre véritable page d’accueil a gagnés. Si la page d’accueil de votre site peut être vue comme les exemples ci-dessous, vous pouvez continuer à lire pour corriger l’erreur.

http://www.example.com ou http://example.com sont tous deux bons, mais il faut que ce soit l’un ou l’autre.
http://www.example.com/index ou /home ou /homepage doit être corrigé.

Il est également possible que quelqu’un ait carrément volé votre contenu. Si le contenu que vous avez créé a déjà été indexé et s’est établi dans l’index de Google, il y a de fortes chances que le voleur n’en profite pas sur les moteurs de recherche. Dans l’idéal, ils seront simplement filtrés.

Créer des dizaines de versions d’un même article pour les distribuer sur des sites/réseaux d’articles est une technique de création de liens assez populaire. Bien que je ne prenne pas position sur son efficacité, si vous utilisez un article qui est déjà sur votre site et que vous en créez de nombreuses versions, il peut revenir vous mordre parce que les moteurs de recherche peuvent encore voir la corrélation entre l’original et les copies répandues sur le Web. Il est tout à fait possible qu’il puisse même réduire davantage les liens inclus.

Certains systèmes de gestion de contenu de panier d’achat peuvent avoir des chemins différents pour accéder à la même page de produit ou de catégorie. Pourquoi est-ce un problème ? Si ces deux URL différentes mènent au même produit, il est juste de dire qu’il s’agit de pages dupliquées.

Cependant, si vous avez un blog et que vous craignez que vos différentes catégories aient un contenu dupliqué en raison des différentes catégories dans lesquelles vous l’avez publié, les moteurs de recherche sont très intéressés par ce problème et comprennent les blogs. En outre, plus vous aurez de messages dans ces catégories, plus il y aura de confusion dans le contenu, ce qui évitera tout problème de doublon. C’est la même chose pour les bribes de messages.

Comment puis-je trouver un contenu dupliqué qui pourrait nuire à mon site ?

L’un des moyens consiste à parcourir votre site pour voir si vous avez l’un des exemples ci-dessus. Un autre moyen est de taper votre URL dans Copyscape. Gardez à l’esprit que cette opération ne vous montre que le résultat de la page que vous avez saisie, et non l’ensemble du site. En outre, le système ne renvoie pas les résultats des contenus dupliqués que vous avez sur la même URL que celle pour laquelle vous avez soumis vot1omment puis-je résoudre mes problèmes de contenu dupliqué ?

Tout d’abord, il est peu probable que vous soyez victime d’autres personnes qui vous volent votre contenu. Consultez SEOmoz.com sur copyscape.com et vous verrez qu’il y a des pages de résultats mais comme ils sont à l’origine du contenu, il est peu probable qu’ils soient filtrés ou qu’ils reçoivent une quelconque pénalité.

Si vous avez du contenu que d’autres personnes ont copié ou volé, vous pouvez essayer d’envoyer un e-mail au webmaster et lui demander gentiment de le retirer. Il y a peu de chances qu’ils vous répondent, donc la meilleure chose à faire est probablement de les oublier. Les gens volent du contenu à droite et à gauche sur Internet, s’attarder sur ce contenu est une perte de temps alors que vous n’êtes probablement pas pénalisé de toute façon.

Comment résoudre les problèmes de double page d’accueil

Heureusement, si vous êtes pénalisé parce que vous avez des pages en double, c’est de votre côté et c’est relativement facile à réparer. Si vous avez des problèmes de double page d’accueil, localisez votre fichier .htaccess.

Ajoutez le code suivant pour rediriger tous vos www-URL vers les URL non-www :

RedirectMatch : 301 ^(.*)$ http://domain.com
RedirectMatch permanent : ^(.*)$ http://www.domain.com

Vous devrez remplacer « domain.com » par votre URL et changer si vous voulez que tout se passe sur www ou non.

Si vous devez vous débarrasser de vos problèmes de page d’index ou de page d’accueil, vous devrez mettre en place une simple redirection 301. Cela devra également être spécifié dans le fichier .htaccess en utilisant le code ci-dessous :

Redirection 301 : /badurl.htm http://www.example.com/

Modifiez les exemples d’URL pour qu’ils correspondent à votre situation particulière.

Rediriger 301 /index http://www.example.com

Pour plus de précision, il indique au site de rediriger en permanence votre /index vers http://www.example.com, vous laissant avec une structure URL propre. Désormais, toutes vos pages d’accueil dupliquées doivent aller soit à http://example.com soit à http://www.example.com, selon votre préférence.

Correction d’autres pages dupliquées à l’aide de la balise Rel=Canonical

Par exemple, si le site d’un produit a plus d’un moyen d’y accéder, ces URL en double peuvent se nuire mutuellement. Par exemple :

http://www.site.com/ipods/skins/blue-ipod-covers vs. http://www.site.com/skins/ipods/blue-ipod-covers

Même page, différentes URL. Dans ce cas, l’utilisation d’une balise rel=canonical est dans votre intérêt. Son utilisation indiquera aux principaux moteurs de recherche que la page qui copie votre autre page doit être traitée comme une seule et même page. Par exemple :

Si http://www.site.com/ipods/skins/blue-ipod-covers n’est pas la bonne page, et que vous préférez que http://www.site.com/skins/ipods/blue-ipod-covers soit la page principale, vous voudrez mettre une balise rel=canonical sur http://www.site.com/ipods/skins/blue-ipod-covers. De cette façon, les moteurs de recherche comprennent qu’il s’agit d’une page dupliquée générée par l’utilisateur et que vous voulez que tous les liens et autres mesures soient dirigés vers la bonne page. Les moteurs de recherche ne seront plus confus quant à la page à afficher ou à créditer également.

L’utilisation de la balise rel=canonical est une alternative à la programmation d’une redirection 301. Une redirection 301 reste le moyen privilégié pour garantir que les moteurs de recherche comprennent votre intention de déplacer le contenu d’une URL à une autre.

En plus de résoudre les éventuels problèmes de duplication de contenu, le fait de traiter les deux pages séparées comme une seule peut aider à éviter toute cannibalisation de mots-clés.