C’est un événement qui n’est clairement anodin pour Wikipédia. L’encyclopédie collaborative en ligne a en effet décidé de supprimer tous les liens (soit 695 000 en tout) vers le site Archive.today et ses variantes .ph et .is, ce service d’archivage souvent utilisé pour contourner les paywalls.
Selon Techcrunch : « Il y a consensus pour déprécier immédiatement archive.today et, dès que possible, l’ajouter à la liste noire des sites de spam […] et supprimer sans délai tous les liens y menant. »
C’est pourtant un outil important pour les citations dans les articles de Wikipédia afin de trouver des sources pertinentes et de permettre aux rédacteurs comme aux lecteurs de vérifier un fait. Mais il y a, selon les discussions internes à l’encyclopédie, un souci avec ce portail.
D’ailleurs, Archive.today avait déjà été placé sur une liste noire par l’encyclopédie en 2013 avant d’être de nouveau autorisé en 2016. Quels sont les griefs reprochés à ce site ? D’après la page de discussions relayée par nos confrères :
Wikipédia ne devrait pas orienter ses lecteurs vers un site web qui pirate les ordinateurs des utilisateurs pour mener une attaque DDoS. (…) Les preuves ont été présentées indiquant que les opérateurs d’archive.today ont modifié le contenu des pages archivées, le rendant ainsi non fiable.
Que va faire Wikipédia ?
Il nous faut ici détailler ces deux accusations. En 2023, le blogueur Jani Patokallio avait publié un article analysant Archive.today sur son blog Gyrovaque, Il qualifiait alors la propriété d’Archive.today « mystère opaque ». Bien qu’il n’ait pas réussi à identifier le propriétaire, il estimait que ce dernier était probablement « un projet personnel, mené par un Russe talentueux et ayant accès à l’Europe ».
Par la suite, le blogueur a accusé Archive.today d’une attaque par déni de service. Selon Techcrunch : « Les utilisateurs qui chargeaient la page CAPTCHA de l’archive exécutaient, à leur insu, un code JavaScript envoyant une requête de recherche à son blog Gyrovague, dans le but manifeste d’attirer son attention et d’augmenter sa facture d’hébergement ».
Il précisait alors que le webmaster d’Archive.today lui a demandé de retirer son article pendant deux ou trois mois. Dans les e-mails rendus publics, ce dernier arguait : « L’article ne me dérange pas, mais le problème est le suivant : des journalistes de grands médias (Heise, The Verge, etc.) sélectionnent quelques mots de votre blog et construisent des récits très différents en ne citant que votre article ; ils se citent ensuite entre eux et produisent un résultat médiocre à présenter à un large public ».
L’affaire n’en est pas restée là et, captures d’écran d’Archive.today à l’appui, des contributeurs de Wikipédia ont pu repérer des pages web qui semblaient modifiées dans le but d’ajouter le nom de Patokallio. Ce qui augmente les doutes quant à la fiabilité du site.
L’encyclopédie en ligne réfléchit donc désormais à plusieurs options selon Techspot. Elle pourrait maintenir le statu quo et supprimer tous les liens, ou décourager de futures citations en conservant les liens existants. D’autres rédacteurs jugent plus prudent de chercher des alternatives à Archive.today en raison de sa précarité à terme. Son propriétaire a d’ailleurs déjà reconnu qu’il était « condamné à disparaître à un moment ou un autre. »
📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.
