Qu'est-ce que le contenu dupliqué en SEO ?
Être bien référencé sur les moteurs de recherche est aujourd’hui indispensable. C’est pourquoi il est essentiel d’enrichir votre site de contenu original et pertinent. En SEO, on parle de duplicate content lorsque du contenu a été accidentellement dupliqué, ou même volé.
Comment identifier du contenu dupliqué ? Quelles en sont les conséquences ? Comment éviter les pénalités liées à ce type de contenu ? Découvrez tout ce que vous devez savoir sur le duplicate content en SEO dans cet article !
Qu’est-ce qu’un duplicate content (contenu dupliqué) ?
Sur le web, un contenu dupliqué est un texte similaire ou identique que l’on retrouve sur deux URL distinctes. Il s’agit en fait d’un copier / coller entre deux pages web ou sites internet. Ce contenu peut être aussi petit qu’un paragraphe, ou aussi grand qu’une page complète.
Même si le contenu dupliqué peut être issu d’une simple erreur technique ou humaine, les moteurs de recherches le pénalise fortement. En effet, ce type de contenu peut être considéré comme volé. Et en plus d’être illégal, c’est une pratique punie par les robots de Google, Bing, etc.
Les deux types de contenu dupliqué
Le duplicate content intra-site
Au cœur d’un même site, il peut être fréquent de trouver des contenus dupliqués. En effet, certains CMS permettent de publier deux fois la même page, avec deux URL différentes. Typiquement avec une version desktop, et une version mobile.
Les robots de crawl peuvent également être confus lorsque vous effectuez une refonte de site. En effet, les nouvelles URLs peuvent entrer en conflit avec les anciennes. Vous pouvez mettre en place des redirections ou utiliser la balise rel=”canonical” dans votre code.
Si vous êtes e-commerçant, le contenu dupliqué interne peut provenir de pages produits. En effet, des produits similaires ou des déclinaisons de produits possèdent souvent la même description.
Le duplicate content de sites extérieurs
Le contenu dupliqué entre deux ou plusieurs sites est bien plus pénalisant. En effet, même si deux sites créent un contenu similaire de façon accidentelle, les robots de crawl considèrent ceci comme du vol.
Parfois, il peut y avoir une erreur de jugement lorsqu’un site est abonné au flux RSS d’un autre. Le robot peut alors interpréter le flux RSS d’un autre site comme faisant partie du contenu du site actuel.
D’une façon générale, le but des moteurs de recherche est de punir les sites ayant plagié le contenu d’un autre. Généralement, ils déterminent la date de publication pour savoir qui est l’auteur original.
Quels sont les risques engendrés par le duplicate content en SEO ?
Comme nous venons de le voir, le contenu dupliqué peut avoir des effets catastrophiques sur votre référencement. On évalue ses impacts à deux niveaux :
L’expérience utilisateur
Lorsqu’un moteur de recherche indexe un site web dans ses résultats, il le fait avec l’intention de répondre précisément aux requêtes des internautes. Pour cela, il a besoin d’une grande quantité de contenus uniques et pertinents. Il fera ensuite le tri pour cibler au mieux l’intention de recherche.
En cas de contenus dupliqués, il est compliqué pour le moteur de montrer des résultats pertinents. Il en résulte ainsi une abondance d’informations similaires sur les différents résultats de recherche. Cela peut être perturbant pour l’utilisateur, qui ne sait plus où donner de la tête.
Le référencement naturel
Pour résoudre au mieux ce problème, les moteurs de recherche ont une solution radicale : punir les auteurs de contenu dupliqué. Comment ? En les privant de bon référencement !
Lorsqu’il détecte un contenu en double, le robot d’indexation essaye de déterminer qui est l’auteur original. Les pages présentant un contenu dupliqué vont se trouver ainsi loin en bas dans les SERP. Cela résulte en une perte de trafic non négligeable.
Il existe même des cas extrêmes dans lesquels le site peut disparaître totalement des résultats de recherche.
Comment éviter le duplicate content sur mon site internet ?
Vous pouvez suivre un ensemble de bonnes pratiques qui vont vous permettre d’éviter de créer du contenu dupliqué.
À l’intérieur de votre site
Tout d’abord, vous pouvez examiner régulièrement vos pages web afin de vérifier que vous ou votre CMS n’a pas copié un contenu ou une page. Vous pouvez aussi vous rendre dans la Google Search Console et vérifier le rapport d’erreurs dans l’onglet Couverture. De plus, si vous effectuez une refonte de votre site, utilisez des redirections 301 pour indiquer aux robots quelle page doit être indexée, et quelle page ne doit pas l’être.
Enfin, si deux pages au contenu similaire doivent rester en ligne (par exemple deux déclinaisons du même produit), utilisez la balise rel=”canonical” pour indiquer quelle page indexer.
Avec d’autres sites
Lorsque vous faites appel à une agence de content marketing et que vous achetez du contenu, assurez-vous que ce contenu est unique et qu’il le restera. Vous pouvez par exemple exiger dans le contrat une clause d’exclusivité pour ce contenu. Cela vous évitera la surprise de voir votre contenu se retrouver sur un autre site.
Vous pouvez aussi utiliser des outils comme SEMRush. Très utilisés par les agences digitales, ils vont vous aider à déterminer l’originalité de votre contenu.