Le Duplicate content, aussi appelé contenu dupliqué ou contenu double, peut amener un contenu à ne pas apparaître dans résultats des moteurs de recherche. Il est fortement redouté des gestionnaires de sites. Les causes de ce contenu dupliqué sont multiples. Mais elles viennent tout simplement parfois de notre volonté de maximiser la visibilité de nos contenus en les publiant sur différentes plateformes. Voici comment éviter ce problème.
Le Duplicate Content inquiète beaucoup de monde. La règle donnée par Google est simple mais comme toujours elle garde un bonne part d’imprécision :
« généralement des blocs de contenu importants, appartenant à un même domaine ou répartis sur plusieurs domaines, qui sont identiques ou sensiblement similaires. »
Quelle est le degré de « sensiblement similaire ». Il est souvent admis 30% de différence mais cela reste une évaluation. Ce qui est sûr, c’est que Google fait la chasse au contenu dupliqué et va faire en sorte d’afficher le contenu qui lui semble original :
« Soyez prudent en diffusant votre contenu : si vous publiez votre contenu sur d’autres sites, nous afficherons systématiquement la version jugée la plus appropriée pour les internautes pour chaque recherche donnée, qui pourra correspondre ou non à celle que vous préférez. Cependant, il est utile de s’assurer que chaque site sur lequel votre contenu est diffusé inclut un lien renvoyant vers votre article original. Vous pouvez également demander à ceux qui utilisent votre contenu diffusé d’utiliser la balise Meta noindex pour empêcher les moteurs de recherche d’indexer leur version du contenu. »
Plusieurs causes
Il y a plusieurs formes de contenus dupliqués :
- internes : ils sont les plus faciles à résoudre car cela dépend de la conception, de la navigation ou de choix. On peut par exemple décider d’exclure certaines pages importantes pour l’internautes mais pouvant poser des problèmes de doublon. C’est le cas dans les boutiques en ligne avec les navigations par filtres ou facettes. Dans ce cas, la méta balise noindex va aider à résoudre le problème. Les outils de gestion de contenu peuvent aussi amener à générer du contenu dupliqué sans même s’en rendre compte. Je vous encourage à lire SeoMix pour creuser le référencement WordPress à compléter par le livre de son auteur, Daniel Roch, Optimiser son référencement WordPress. Je n’ai pas lu la 3ème édition mais la précédente regorgeait de bons conseils.
- externes : là encore plusieurs cas. On parle souvent du contenu volé, mais nous pouvons aussi être la cause de la duplication du contenu dans notre volonté de le faire connaître au maximum. C’est le sujet de cet épisode de podcast.
Attention à la réplication
Le cas du podcast est facile à comprendre. Pour chaque épisode, je publie le fichier mp3 sur Spreaker avec un descriptif. Le flux RSS est ensuite repris sur iTunes, Stitcher, le PlayStore, PodCloud…. Ainsi ce contenu se duplique sur de nombreux autres sites. Si je l’ajoute aussi tel quel sur mon blog, mon billet ne sera qu’une autre version de ce que l’on trouve ailleurs. Google tenant compte des dates de publication et de la popularité du site, il peut considérer mon propre site comme le duplicateur de mon propre contenu.
Le seul moyen de s’en sortir est de prévoir plusieurs versions de son contenu. La règle générale est de publier le meilleur contenu à l’endroit qui compte le plus pour vous. Pour moi, cela signifie privilégier le meilleur contenu pour mon propre espace personnel, mon site. Ce que vous êtes en train de lire donc. L’idée est de faire en sorte que vous êtes le seul à publier votre meilleur contenu. Si un contenu doit se répliquer autant qu’il soit de moins bonne qualité.
A côté vous devez prévoir d’autres versions de ce contenu pour le répliquer ou le faire connaître. Quelques exemples :
- Podcast : une description sommaire dans la description et un lien vers des notes plus complètes ou même la transcription de l’épisode sur votre site. Notez que pour référencer un podcast ou une vidéo, vous êtes obligé de faire du texte d’accompagnement. Vous pouvez faire un texte sommaire sur YouTube et un texte plus complet ou retravaillé sur votre blog.
- Commerce en ligne : le problème va se poser si vous publiez un produit sur votre site et que vous voulez le vendre aussi sur des places de marché comme Amazon ou le mettre sur Le bon coin. Là encore, créez une fiche idéale pour votre site, et des fiches pour les places de marché. Mais réservez le meilleur contenu à votre site.
- Biographie personnelle : si vous participez à d’autres sites, fournissez une bio différente de celle présente sur votre site. Il vaut mieux que ce soit votre page personnelle sur votre propre site qui soit référencée car vous pouvez la faire évoluer.
- Le cas Medium, LinkedIn Pulse et Facebook Articles : la règle est la même pour ces trois outils. Ils peuvent vous permettre de vous faire connaître mais peuvent aussi générer du Duplicate. Au minimum publiez d’abord sur votre site ou blog, puis attendez une semaine qu’il soit référencé pour le publier ailleurs. Pour Medium, utilisez l’outil d’import qui ajoute une balise canonical faisant référence au contenu de votre site comme étant original.
Mais l’idéal serait de ne pas dupliquer le contenu et faire un contenu original, il aura d’ailleurs plus de chance d’être vu sur ces outils : reformulez, publiez un condensé, un mini-dossier reprenant des éléments de plusieurs billets avec des liens vers votre site. Vous pouvez aussi créer une version opposée : « 5 bons conseils » sur votre site et « 5 pires conseils » sur Medium histoire d’accrocher les lecteurs.
Conclusion
Certes cela vous oblige à faire plusieurs versions d’un même contenu. Mais à quoi bon le produire si personne ne le lit ?! L’effet du Duplicate Content est de masquer un contenu dans une recherche Google. Tant qu’à le produire autant optimiser son potentiel.