Duplication de contenu et reproduction illicite de contenu : quelques explications
Par Eric,
22 juin 2009 à 10:11 :: Blogs
et faites-le connaître
Suite à ma note de service de samedi relative à la modification du serveur de Presse-citron en vue d’essayer de dissuader (un peu) les copieurs de dupliquer intégralement mon contenu, je constate que tout le monde ne connait pas forcément le sujet et ses implications, ce qui peut conduire à certaines confusions.
Il me paraît par conséquent intéressant d’essayer d’expliquer de quoi il retourne exactement. Vous allez voir, ce n’est pas très compliqué, donc je devrais y arriver
La duplication de contenu, qu’est-ce que c’est exactement ?
La duplication de contenu, en langage web, est la copie pure et simple d’un contenu et sa reproduction intégrale sur un autre site que celui d’origine. Que la source soit citée ou non ne change rien à l’affaire : la duplication c’est du vol, même s’il s’agit d’un contenu gratuit, et je dirais même surtout s’il s’agit d’un contenu gratuit. Car celui-ci relève de la propriété intellectuelle, et représente souvent un travail important pour son auteur.
Comment ça marche ?
Il y existe plusieurs façons de reproduire illicitement un contenu. Le web étant un média ouvert, c’est de surcroît extrêmement facile. La plus simple est à la portée de tout internaute : il suffit de copier-coller un article pour le reproduire sur un autre support, qu’il s’agisse d’un site web (ceci incluant toutes les formes de sites et je pense bien sûr en premier lieu à un blog) mais aussi pourquoi pas d’une présentation commerciale ou d’une publication quelconque.
L’autre méthode, la plus courante, consiste à installer un script sur un blog qui récupère automatiquement l’intégralité du contenu d’un autre blog en aspirant son flux RSS pour le reproduire dans ses propres pages. Cette méthode ne nécessite pas beaucoup de compétences supplémentaires puisqu’il s’agit simplement d’installer un plugin (avec WordPress par exemple) et de le paramétrer en quelques clics pour qu’il fasse le boulot automatiquement à votre place, et re-publie systématiquement tous les articles que vous écrivez.
Enfin, une autre technique, moins aisée car nécessitant des compétences en programmation, consiste à parser (parcourir) le contenu d’un blog pour en extraire les articles à l’aide d’un script automatisé.
Pourquoi et en quoi la duplication de contenu est-elle préjudiciable ?
Cette question revient souvent, avec les arguments qui l’accompagnent, souvent lus et entendus, et parmi les principaux, ceux-ci : « si tu te fais reproduire ton contenu, c’est plutôt flatteur, c’est un signe de reconnaissance, ça te fait de la publicité, ça te fait du backlink, tu en tires un avantage », etc. Ces arguments pourraient dans certains cas être légitimes, mais ils démontrent en fait une méconnaissance des problématiques liées au web et notamment au référencement dans les moteurs de recherche.
En effet, si on peut effectivement penser que la reprise non autorisée ou non déclarée d’une partie du contenu d’un site dans une présentation commerciale hors web ne pose en fait pas un gros problème (personnellement cela ne me dérange pas plus que cela et de toute façon il est difficile de contrôler cela), la duplication de contenu sur le web pose un sérieux problème de positionnement dans les moteurs de recherche. Car un article reproduit intégralement à l’identique sous 2 urls différentes peut être considéré comme du duplicate content (contenu dupliqué) par les moteurs de recherche, qui, ne sachant distinguer l’original de la copie risquent tout simplement de supprimer les deux de leur index, en vue de fournir des pages de résultats propres et pertinentes. Résultat : votre contenu peut disparaître du jour au lendemain des moteurs de recherche simplement parce-qu’un petit rigolo s’amuse à le reproduire. C’est injuste et pernicieux mais il faut faire avec. Et faire avec n’estpas facile, tant il paraît illusoire de faire une chasse systématique aux blogs qui pompent votre contenu.
D’où l’agacement, voire la colère des blogueurs et des éditeurs de contenu dont une grande partie du trafic, et donc, pour certains, des revenus, et pour d’autres, de la réputation et de la visibilité, sont assurés à la source par les moteurs de recherche, quand ils découvrent que leur articles sont pillés et reproduits sans scrupule sur d’autres sites. Cela d’autant plus si les sites en question sont des splogs (spam blogs) montés exclusivement pour reproduire illicitement et de façon automatisée le contenu de plusieurs blogs à fort trafic en vue de monétiser celui-ci à grands renforts d’encarts publicitaires. Il y a dans ce cas non seulement vol de contenu mais détournement de revenus, puisque l’on se sert du contenu produit par un tiers pour générer du chiffre d’affaires.
Mais alors, quelles sont les bonnes pratiques ?
J’ai aussi vu dans les commentaires, ici et sur Twitter, que si ces problèmes de contenu dupliqué restent relativement marginaux (mais peuvent être très pénalisants), certains blogueurs, de bonne foi, se posent la question de la meilleure façon de citer un autre blog. Là-dessus il n’y a aucune équivoque : l’un des principes fondateurs de la blogosphère repose sur le sourcing auprès d’autres blogs et la citation de ceux-ci, avec les liens qui vont bien. Quand on souhaite reprendre le contenu d’un blog, je conseille pour ma part de respecter ces 3 règles :
- ne reprendre texto qu’un court extrait de l’article cité, moins de 100 mots ou un paragraphe de 5 lignes
- citer nommément la source
- faire un lien direct vers l’article source
De cette façon la reprise d’un autre article devient cette fois un avantage pour celui qui est cité, sans le pénaliser.
Précision (je vous vois venir) : la reprise de contenu ne doit pas être confondue avec la citation de source. Voir à ce sujet cet article : Un blog doit toujours citer ses sources. Ou pas.
Que penser des sites comme les digg-like ou les agrégateurs en ligne ?
S’ils sont bien programmés (j’allais dire « programmés honnêtement ») les digg-like ne devraient pas poser de problème particulier. D’une part parce-qu’ils n’agrègent pas automatiquement le contenu, et d’autre part parce-qu’ils ne proposent qu’un court extrait des articles repris, avec un lien direct vers la source, sans redirection sournoise. C’est le cas de Fuzz, mais aussi d’autres digg-like : extrait de 2 lignes, lien direct vers l’article source, et lien direct vers l’url du site source, et ce dès la page d’accueil.
Pourquoi avoir mis un script qui protège seulement les images, qu’est-ce que le hotlinking, et comment ça marche ?
Voyant que de plus en plus de blogs à la con reproduisent intégralement le contenu de Presse-citron (mais je suis loin d’être le seul dans ce cas, en général les auteurs de ces sites reprennent les principaux blogs du top Wikio), j’ai de plus constaté que les images illustrant les articles dupliqués provenaient aussi directement de mon serveur. Ce qui signifie que non content de piquer mon contenu, ces blogs piquent aussi ma bande passante. C’est ce qu’on appelle le hotlinking. Comme nous n’avons pas les moyens de tout contrôler (la plupart de ces blogs sont injoignables et anonymes, et prennent la précaution de ne laisser aucune trace permettant d’identifier leurs auteurs), le seul procédé technique qui est à notre disposition consiste à mettre en place un script serveur qui interdit l’affichage des images de notre blog si elles apparaissent sur des sites autres que ceux que l’on a autorisés. Nous avons même la possibilité de demander au serveur d’afficher une image de notre choix sur les sites externes. C’est ce que j’ai fait, en utilisant la méthode décrite ici chez le camarade Alex de Tuxboard.
Je suis conscient que cette méthode un peu radicale peut poser un problème d’affichage dans les agrégateurs mais j’y travaille, afin que seuls les pillards soient pénalisés.
Cette méthode n’est qu’un pis-aller car elle n’empêche pas la duplication de contenu, mais elle peut dissuader les voleurs de le faire car chaque image reproduite illicitement peut contenir le message de votre choix, souvent peu flatteur à l’égard du copieur. Voici ci-dessous celle que j’utilise en ce moment et que vous avez peut-être aperçue dans votre agrégateur.

Y a -t-il d’autres moyens de lutter contre le vol de contenu ?
En fait quand je découvre (ou qu’on me signale, la plupart du temps) que mes articles sont dupliqués intégralement sans autorisation, j’applique la méthode suivante :
- je vais sur le blog en question
- je cherche la rubrique Contact
- si elle existe c’est que généralement le blogueur est de bonne foi et reproduit votre contenu sans volonté de nuire par simple méconnaissance des usages
- je lui envoie un message amiable lui rappelant les bonnes pratiques, et le plus souvent le problème est réglé sans délai, le contenu est supprimé et vous avez même droit à des excuses
- si la rubrique Contact n’existe pas, je cherche dans le Whois si je peux identifier le propriétaire du nom de domaine. Si j’arrive à le contacter, j’agis comme précédemment
- si le blog a blindé son anonymat, je poste un message en commentaire des articles piqués, d’abor amiable, plus plus menaçant, et je finis par une gosse insulte histoire de faire réagir le propriétaire du blog. Ca marche de temps en temps mais c’est très aléatoire
- dernier recours, que je n’ai pas encore employé : constat d’huissier et remise du dossier aux mains d’un avocat.
- d’autres utilisent un méthode intéressante, à condition de pouvoir contacter l’auteur du blog incriminé : ils envoient une facture (généralement assez lourde) avec le montant à payer pour les droits de reproduction, suivie d’un rappel puis d’une menace de mise au contentieux.
J’espère que ces explications un peu longues mais nécessaires permettront à ceux qui sont moins au fait de ces problématiques d’y voir un peu plus clair.



Commentaires
1. Le 22 juin 2009 à 10:23, par Tortue facile :: site
2. Le 22 juin 2009 à 10:23, par Pierre-Henri :: site
3. Le 22 juin 2009 à 10:27, par Xav :: site
4. Le 22 juin 2009 à 10:28, par Eric :: site
5. Le 22 juin 2009 à 10:29, par laurent :: site
6. Le 22 juin 2009 à 10:30, par laurent :: site
7. Le 22 juin 2009 à 10:35, par Pierre-Henri :: site
8. Le 22 juin 2009 à 10:35, par Al-Kanz :: site
9. Le 22 juin 2009 à 10:51, par Shoko :: site
10. Le 22 juin 2009 à 11:02, par Mélanie :: site
11. Le 22 juin 2009 à 11:09, par terminatotor :: site
12. Le 22 juin 2009 à 11:10, par Pakito :: site
13. Le 22 juin 2009 à 11:11, par petitchevalroux :: site
14. Le 22 juin 2009 à 11:21, par Pierre-Henri :: site
15. Le 22 juin 2009 à 11:37, par keeg :: site
16. Le 22 juin 2009 à 11:40, par Galdon :: site
17. Le 22 juin 2009 à 11:51, par M :: site
18. Le 22 juin 2009 à 11:52, par aalex57 :: site
19. Le 22 juin 2009 à 12:05, par Daniel :: site
20. Le 22 juin 2009 à 12:08, par David :: site
21. Le 22 juin 2009 à 12:08, par petitchevalroux :: site
22. Le 22 juin 2009 à 12:09, par JMC :: site
23. Le 22 juin 2009 à 12:12, par Greg-J :: site
24. Le 22 juin 2009 à 12:14, par Ricographik :: site
25. Le 22 juin 2009 à 12:17, par Eric :: site
26. Le 22 juin 2009 à 12:22, par oliv :: site
27. Le 22 juin 2009 à 12:30, par The mysterious masked man :: site
28. Le 22 juin 2009 à 12:33, par Le-Gritche :: site
29. Le 22 juin 2009 à 12:49, par Sarssipius :: site
30. Le 22 juin 2009 à 13:01, par Christophe :: site
31. Le 22 juin 2009 à 13:02, par Benoit :: site
32. Le 22 juin 2009 à 14:00, par H4mm3r :: site
33. Le 22 juin 2009 à 14:02, par ALLNews :: site
34. Le 22 juin 2009 à 14:05, par Alex :: site
35. Le 22 juin 2009 à 14:08, par Mute :: site
36. Le 22 juin 2009 à 14:14, par Mark :: site
37. Le 22 juin 2009 à 14:17, par websylvain :: site
38. Le 22 juin 2009 à 14:20, par Oweia :: site
39. Le 22 juin 2009 à 14:20, par Actalex :: site
40. Le 22 juin 2009 à 14:20, par James :: site
41. Le 22 juin 2009 à 14:24, par Green Islam :: site
42. Le 22 juin 2009 à 14:27, par A La French :: site
43. Le 22 juin 2009 à 14:32, par petitchevalroux :: site
44. Le 22 juin 2009 à 14:35, par James :: site
45. Le 22 juin 2009 à 14:41, par benoit :: site
46. Le 22 juin 2009 à 14:51, par A+La+French :: site
47. Le 22 juin 2009 à 14:56, par Eric :: site
48. Le 22 juin 2009 à 15:46, par karim :: site
49. Le 22 juin 2009 à 15:56, par kala :: site
50. Le 22 juin 2009 à 15:57, par Kiffe Grave :: site
51. Le 22 juin 2009 à 16:21, par Thor :: site
52. Le 22 juin 2009 à 16:40, par A+La+French :: site
53. Le 22 juin 2009 à 16:50, par Thor :: site
54. Le 22 juin 2009 à 16:56, par emmanuel :: site
55. Le 22 juin 2009 à 16:59, par petitchevalroux :: site
56. Le 22 juin 2009 à 17:02, par Eric :: site
57. Le 22 juin 2009 à 17:15, par James :: site
58. Le 22 juin 2009 à 17:18, par Emmanuel :: site
59. Le 22 juin 2009 à 17:26, par A+La+French :: site
60. Le 22 juin 2009 à 17:44, par petitchevalroux :: site
61. Le 22 juin 2009 à 17:51, par JUL :: site
62. Le 22 juin 2009 à 17:53, par Liliandev :: site
63. Le 22 juin 2009 à 18:02, par pressekiwi :: site
64. Le 22 juin 2009 à 18:03, par thebloom :: site
65. Le 22 juin 2009 à 18:09, par A+La+French :: site
66. Le 22 juin 2009 à 18:15, par Mark :: site
67. Le 22 juin 2009 à 18:21, par petitchevalroux :: site
68. Le 22 juin 2009 à 18:23, par petitchevalroux :: site
69. Le 22 juin 2009 à 18:28, par A+La+French :: site
70. Le 22 juin 2009 à 18:35, par Eric :: site
71. Le 22 juin 2009 à 18:46, par Mark :: site
72. Le 22 juin 2009 à 20:40, par Alias+Docteur+House :: site
73. Le 22 juin 2009 à 20:43, par petitchevalroux :: site
74. Le 22 juin 2009 à 21:51, par Mox Folder :: site
75. Le 22 juin 2009 à 21:56, par Gautier :: site
76. Le 23 juin 2009 à 0:35, par Kiffe Grave :: site
77. Le 23 juin 2009 à 5:36, par MarieBo :: site
78. Le 23 juin 2009 à 6:03, par robson :: site
79. Le 23 juin 2009 à 18:10, par FraGG :: site
80. Le 23 juin 2009 à 18:15, par Peter :: site
81. Le 23 juin 2009 à 22:41, par Cyber mendiant :: site
82. Le 24 juin 2009 à 0:55, par moses k :: site
83. Le 24 juin 2009 à 9:02, par Bizbiz :: site
84. Le 24 juin 2009 à 9:52, par FraGG :: site
85. Le 25 juin 2009 à 23:12, par Thierry :: site
86. Le 25 juin 2009 à 23:21, par Cyber+mendiant :: site
87. Le 25 juin 2009 à 23:23, par Eric :: site
88. Le 27 juin 2009 à 1:11, par semageek :: site
89. Le 30 juin 2009 à 14:18, par David :: site
90. Le 5 juillet 2009 à 16:15, par Joe+HANK :: site
91. Le 5 juillet 2009 à 22:28, par David :: site
92. Le 10 juillet 2009 à 18:06, par MonProprePatron :: site
93. Le 27 juillet 2009 à 13:52, par keul :: site
94. Le 8 août 2009 à 15:22, par STREAMING+Addict :: site
95. Le 10 août 2009 à 21:05, par ALLNews :: site
96. Le 11 septembre 2009 à 23:44, par MarieBo :: site
97. Le 10 janvier 2010 à 14:23, par Mapics :: site
98. Le 13 janvier 2010 à 17:06, par David :: site
99. Le 13 janvier 2010 à 17:51, par Mapics :: site
100. Le 14 janvier 2010 à 11:51, par David :: site
Ajouter un commentaire