Si vous copiez et collez un texte venant d’un autre site sur le vôtre, la légende raconte que vous serez maudit sur 13 générations et que vous ne pourrez jamais vendre quoi que ce soit sur internet !
Comme toutes les légendes urbaines, c’est faux bien évidemment, maaaaaaiiiis même dans les légendes les plus abracadabrantes, il y a souvent une infime part de vérité… 😉
Allez, venez, on démêle le vrai du faux ensemble sur le contenu dupliqué (ou duplicate content en anglais) !
Je vous donne quelques réponses concernant le contenu dupliqué mais si vous voulez en savoir plus, je vous invite à acheter le livre d’Olivier Andrieu, Le SEO en 500 questions.
Le contenu dupliqué, c'est quoi ?
Le contenu dupliqué, aussi appelé duplicate content en anglais, ce sont deux contenus textuels d’un ou plusieurs sites internet identiques.
Un moteur de recherche comme Google ne prendra en compte qu’un seul de ces contenus et délaissera l’autre.
En règle générale, c’est le contenu le plus ancien qui sera considéré comme original (ou canonique). C’est donc ce contenu qui bénéficiera de la visibilité escomptée.
Lire aussi : Optimiser sa fiche Google My Business
Comment Google repère le contenu plagié ?
Deux critères entrent en jeu pour que le moteur de recherche repère un contenu dupliqué :
- La date de première découverte : logiquement, Google se rendra sur la page originale avant les éventuelles copies (mais ce n’est pas toujours le cas avec les retards d’indexation de plus en plus fréquents…)
- La popularité de la page : plus une page aura des liens de qualité qui pointent vers elle, plus elle sera considérée comme la version originale par Google (d’où l’importance de travailler votre netlinking !)
On parle de contenu dupliqué d'un site vers un autre, mais deux contenus identiques provenant d'un même site, est-ce du duplicate content aussi ?
Le contenu dupliqué peut être externe (d’un site vers un autre) ou interne (au sein d’un même site, d’une page vers une autre).
Evitez donc de reprendre du contenu à l’identique depuis votre site pour alimenter une nouvelle page.
Ça peut vous intéresser : pourquoi utiliser la balise strong (le gras) en SEO ?
Si je copie-colle un paragraphe, est-ce considéré comme du contenu dupliqué ?
A priori, non.
Par exemple, si vous copiez-collez un paragraphe pour présenter vos services ou faire un appel à l’action dans chacun de vos articles de blog, ce ne sera pas considéré comme du contenu dupliqué.
A l’usage, on considère qu’il faut être en-dessous de 70 % de similarité entre deux textes pour éviter le contenu dupliqué.
Ainsi, si vous reprenez 3 phrases sur un contenu de 1000 mots, il n’y a aucune chance que ce soit considéré comme du duplicate content par Google.
Pour être sûr de vous, je vous conseille d’utiliser un outil de vérification comme Plagiarism Detector (il vous suffit de copier-coller votre texte et l’outil vérifiera son pourcentage de similarité avec d’autres textes sur internet).
Attention toutefois : ça reste un outil, parfois les résultats sont farfelus…
Est-on pénalisé pour du contenu dupliqué ?
La question qui vous intéresse sans doute le plus et qui fait couler beaucoup d’encre !
Et la réponse est non : vous ne serez pas puni par Google pour mauvaises pratiques.
En revanche, si vous faites du contenu dupliqué en interne, vous faites perdre du temps à Google pour rien quand il viendra visiter votre site (et ça peut vous pénaliser en termes de visibilité).
S’il s’agit de duplicate content externe, vous perdrez en visibilité et il sera difficile de vous positionner en première page de Google car vous aurez peu de chance d’être choisi comme page originale.
Et entre nous, ce n’est pas très éthique de voler le travail des autres… Faites bien la différence entre s’inspirer et copier purement et simplement.
Si je traduis un contenu, est-ce considéré comme du plagiat par Google ?
Non, peu importe la langue, Google ne considèrera pas cela comme du duplicate content.
Vous n’aurez aucun problème de visibilité si vous souhaitez traduire votre site dans une autre langue.
A découvrir : peut-on être pénalisé par Google pour suroptimisation ?
Un fichier PDF est-il considéré comme du duplicate content par rapport à un équivalent sur le web ?
Oui, car Google visite et classe les PDF de la même façon que les pages web. Vous avez probablement déjà cliqué sur un résultat de recherche et atterri sur un PDF, non ?
Si vous hésitez, mieux vaut enlever le PDF et reprendre ses éléments pour les mettre sur une page web, plus facilement optimisable pour le référencement naturel.