Comment éviter la pénalité Google pour Duplicate content ?

Comprendre comment Google pénalise le duplicate content

Le duplicate content (ou contenu dupliqué) désigne le fait de retrouver sur deux pages web un contenu totalement ou partiellement identique. Google applique par défaut un filtre qui permet d’éviter le référencement de doublons dans les pages de résultats du moteur de recherche. Ce n’est donc pas réellement une pénalité Google, mais un contenu dupliqué peut quand même nuire à votre communication marketing.

Quels contenus Google identifie-t-il comme duplicate content ?

Le premier cas possible est un duplicate content externe à votre site internet : l’une de vos pages web possède un contenu et des tournures très similaires à la page d’un autre site web. Cela peut être du plagiat : vous avez copié quelqu’un, ou quelqu’un a réutilisé votre contenu web. Regardez aussi du côté des annuaires : vous avez peut-être publié de nombreuses fois la même description sur ces sites. Ou encore, si vous possédez un site e-commerce, faites des descriptions d’articles et des fiches produits différentes de celles des sites concurrents.

Le second cas, plus courant, mais aussi plus sournois, est un duplicate content entre deux pages web de votre site internet. Le plus fréquent se situe dans les balises title et description : attention à ce qu’elles coïncident bien avec le contenu de chaque page web ! Il ne s’agit pas de répéter les mêmes contenus sur tout votre site internet… Un duplicate content interne provient parfois des URLs : plusieurs URLs pointant vers un même contenu par exemple.

Comment sortir mes pages web d’un duplicate content ?

Dans le cas d’un duplicate externe, si vous êtes l’auteur du plagiat, vous allez tout simplement devoir produire un contenu original ! Vous pouvez vous inspirer d’autres sites internet, surtout si vous touchez aux sujets d’actualité, mais vous devrez trouver vos propres formulations. Si vous êtes victime de duplication, contactez le webmaster du site internet coupable pour lui demander de retirer son contenu dupliqué, ses fiches produits ou les articles de blog copiés. Si cela ne fonctionne pas, vous pourrez toujours signaler la page web à Google en expliquant votre situation.

Quant au duplicate content interne, il dépend de votre propre travail. À vous d’indiquer à Google les pages web à référencer pour que les robots n’aient pas à choisir eux-mêmes. Il est très fréquent que diverses URLs renvoient au même contenu : pensez à indiquer votre URL canonique grâce à la balise correspondante. De même, en cas de modifications au sein de votre site internet, n’hésitez pas à utiliser les redirections 301 qui permettront d’indexer seulement votre nouvelle URL.

Comment éviter le duplicate content : les outils et bonnes pratiques

Afin d’éviter une pénalité pour duplicate content, des outils anti-plagiat vous aideront à détecter si votre contenu a été copié sur une autre page web. Positeo, Copyscape, Webconfs ou encore Quetext sont des outils spécialisés dans la détection du duplicate content externe. Pour ce qui est de la duplication de contenu interne – vous avez plusieurs pages similaires – indiquez à Google l’URL principale à prendre en compte grâce à la balise URL canonique. Et si plusieurs contenus sont similaires, Google préconise de développer le contenu des pages concernées ou de les regrouper.

Sur les pages de votre site internet, assurez-vous de maîtriser l’affichage de votre contenu : certains contenus peuvent apparaître sur plusieurs autres pages sous des formes diverses (encarts, messages…). Cela vaut aussi pour les éléments de bas de page identiques (par exemple les avis de copyright) qui se répètent d’une page à l’autre. Faites une brève description sur chaque page puis créez un lien vers une page dédiée.

Quels sont les risques d’un contenu dupliqué pour votre référencement ?

Il n’y a pas de pénalité Google en cas de duplicate content. Le filtre fonctionne page par page : pour une infraction normale, votre site internet ne sera pas désindexé des pages de résultats du moteur de recherche. Si ses robots trouvent plusieurs pages web identiques, Google référencera seulement la mieux positionnée, et l’autre sera reléguée aux résultats complémentaires afin d’éviter les contenus dupliqués dans la SERP.

Une exception : l’algorithme Panda prend également en compte le duplicate content, mais cette fois à l’échelle d’un site web entier. Attention, du contenu dupliqué présent sur votre site internet pourrait vous attirer une pénalité Panda !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.