Référencement

WordPress, PrestaShop les nouveautés
08
décembre 2016

Tout savoir sur le duplicate content

DUPLICATE CONTENT

Source de pénalisation pour le référencement et nuisant à la qualité d’un site web, le contenu dupliqué ou « duplicate content » constitue un phénomène affectant considérablement le positionnement du site dans les résultats des moteurs de recherche. Tour d’horizon sur sa définition et sur les moyens pour l’éviter.

Contenu dupliqué : définition

Le contenu dupliqué désigne un contenu éditorial d’un site web apparaissant sur d’autres sites. Plusieurs sont les causes pouvant être à l’origine de ce phénomène. Parmi les plus fréquents, on retrouve le système du copier/coller pour alimenter facilement un site web. À noter que le plagiat constitue un vol de contenu, passible de sanction SEO par Google. En effet, ce géant du web a mis en place un filtre dénommé « Panda » permettant de détecter des contenus dupliqués. Sachez que le duplicate content s’avère néfaste pour la visibilité du site dans les résultats de recherche. D’autres cas sont remis en cause, notamment l’utilisation du descriptif d’un fournisseur dans le cas de la vente de mêmes produits sur différents sites de e-commerce.

Pour vous assurer que vos contenus n’ont pas été plagiés par d’autres sites ou que votre plateforme ne contienne pas de contenus dupliqués, utilisez des outils de détection en ligne comme Positeo, Copyscape ou encore PlagSpotter.

Le contenu dupliqué accidentellement

Dans certains cas, le contenu dupliqué peut être causé de manière involontaire, notamment à cause du CMS utilisé. En effet, celui-ci peut être à l’origine d’URLs à rallonge provoquant l’indexation d’un duplicata du site par les moteurs de recherche. Le site devient alors accessible à partir du nom de domaine avec ou sans www, et sans redirection. Si après le contrôle de votre site, vous avez constaté qu’aucune redirection n’est faite à partir du site exemple.com vers www.exemple.com, celui-ci est sans aucun doute indexé deux fois. D’autres cas de duplicate content sont possibles, notamment l’utilisation de paramètres de session donnant à chaque visite sur un site un identifiant différent. Ce dernier sera gardé dans l’URL et provoquera des soucis liés à une duplication de contenu.

Les pratiques à adopter pour éviter ce phénomène

Dans le cas d’un site indexé deux fois (avec et sans www), l’utilisation d’un fichier « .htaccess » permettra de transférer le contenu des pages du site sans le www vers les pages de celui avec le www. Vous pouvez également définir le domaine favori à indexer via l’outil « Google Search Console ». Il est également possible d’utiliser un fichier « robots.txt » pour déterminer les pages à ne pas indexer.

Enfin, le recours à un rédacteur web ou à la rédaction par vous-même de vos contenus permet d’éviter ce phénomène.

Commun
Pas de commentaire

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *