Le duplicate content – ou contenu dupliqué en bon français – peut concerner quelques phrases, un paragraphe, voire une page complète que l’on retrouve à l’identique sur deux ou plusieurs sites. Parfois, le plagiat est flagrant, parfois plus subtil. Prenez garde pour votre propre site, vous ne devez jamais céder à la facilité du duplicate content. Ceci pour deux raisons majeures : votre lectorat et Google.
Les différents types de duplicate content
Il vous est probablement arrivé de lire un article et de sentir un parfum de déjà-vu. Vous ne savez pas si vous êtes en train de lire l’original ou la copie, sauf quand il s’agit de sources très populaires du type Wikipédia.
C’est un phénomène que l’on retrouve beaucoup – par exemple – dans les biographies. Vous recherchez des informations sur une personnalité et vous vous rendez compte que plusieurs sites ont copié/collé la biographie de Wikipédia, en la modifiant plus ou moins.
On peut aussi toujours trouver ce cas dans nos médias d’information : l’AFP émet une dépêche et tous les sites d’actualités reprennent en cœur les éléments de langage. C’est pourquoi, malgré la surmultiplication des sources d’information, on est face à la même actualité sans cesse rabâchée. La course au scoop et la paresse de certains journalistes sont les deux mamelles du plagiat dans la presse. 😠
Il existe aussi le plagiat pur et dur. Vous pouvez vous retrouver avec deux pages au contenu parfaitement identique. Seuls changent la mise en page, l’habillage du texte et les photos qui l’illustrent.
Il est fréquent de trouver du duplicate content au sein d’un même site. Ceci à cause d’une même page accessible depuis différentes URL. Ce « duplicate content interne » est souvent dû à une mauvaise gestion des URL : les adresses des pages.
Bien sûr, pour les moteurs de recherche ou les outils de détection de plagiat – du type SmallSEOTools– certains articles peuvent passer pour du duplicate content parce qu’ils contiennent des citations, des expressions, les mêmes caractéristiques produit (sur différents sites marchands), des titres… qui sont immuables.
Pourquoi épargner le contenu dupliqué à votre lectorat ?
Par respect. 🙏
D’abord pour l’auteur du contenu original. Il s’est cassé la tête pour effectuer des recherches, les structurer et les rédiger avec soin. Dupliquer son contenu n’est ni plus ni moins que du plagiat, donc du vol.
Ensuite, par respect pour vos visiteurs qui vous font l’honneur de visiter votre site. Il est hors de question de leur servir du réchauffé : vous devez apporter une plus-value à votre prose.
Comment Google va-t-il réagir si vous utilisez du duplicate content ?
Google n’aime pas du tout le duplicate content. Son petit robot veille au grain et sanctionne les fautifs… et parfois l’original.
Il faut comprendre que le but de Google est de toujours contenter ses utilisateurs. Ceci afin de soigner sa popularité et sa notoriété. Le moteur de recherche ne veut pas que le visiteur, en choisissant deux ou plusieurs liens sur sa page de résultats, soit déçu en tombant sur les mêmes textes.
Il s’applique donc à les filtrer et, en cas de contenu identique, n’en propose qu’un seul résultat, celui qui lui paraît le plus digne de confiance.
Comment Google distingue-t-il la copie de l’original ?
L’intention louable de Google est de toujours privilégier l’original. Pour cela, ses algorithmes tâchent de détecter la page canonique – au sens légal du terme – en analysant, entre autres, la date de parution et la popularité des sites.
Malheureusement, la méthode n’est pas infaillible et il arrive que de rusés copieurs volent la vedette à l’orignal.
Que se passe-t-il en cas de duplicate content constaté par Google ?
Google ne supprime pas les pages incriminées mais les rétrograde dans son classement. Cela s’apparente donc à une sanction. Passer de la première à la deuxième ou troisième page de résultats – voire beaucoup plus loin – équivaut à disparaître des radars. ⛔
Vous comprenez donc pourquoi vous ne devez pas utiliser le duplicate content. De toute façon, il est bien plus excitant et gratifiant de créer votre propre contenu, n’est-ce pas ?