Connect with us

Internet

Comment Wikipédia lutte contre les liens morts

Les liens morts peuvent très vite devenir un problème lorsque l’on dispose d’un site composé de milliers de pages. Il n’y a aucune raison pour que cela soit différent sur Wikipédia, qui doit faire face à de nombreux liens morts et oblige à un travail de fourmi pour traiter ces liens.

Il y a

le

Comment Wikipédia lutte contre les liens morts

9 millions de liens concernés

L’erreur 404, aussi connue comme un lien mort, est une hantise pour de nombreux webmasters. On déteste tout simplement cela. Alors certes, comme nous l’écrivions dès 2008, l’erreur 404 est humaine. De nombreux sites s’en servent même comme d’un outil marketing quand on parle de liens internes. Mais, pour une page comme Wikipédia, il s’agit tout autant de liens externes. Le site qui innove de façon régulière comme avec son système de preview par exemple, s’est lancé cette fois dans un projet d’une échelle complètement différente.

Pour lutter contre ce phénomène de « pourrissement des liens », comme on le décrit, Wikipédia a lancé une initiative très particulière visant à ressusciter les liens. On parle ici de milliers de liens, un travail titanesque et bien souvent réalisé à la main. Il faut donc tenter d’automatiser le processus. C’est ce qu’a réussi à faire la fondation Wikimédia qui gère Wikipédia avec l’organisation Internet Archive. Le résultat ? 9 millions de liens morts sont de retour.

> Lire aussi :  Amazon se rattrape et donne un million de dollars à Wikimédia

Un enjeu vital pour Wikipédia

Si vous ne connaissez pas Internet Archive, c’est un outil qui sert à sauver la mémoire du web avec le service Wayback Machine. Appliquée à Wikipédia, cette fonctionnalité a un effet incroyable.

 Depuis trois ans, nous utilisons un logiciel appelé IABot sur 22 éditions linguistiques de Wikipédia à la recherche de liens cassés (des URLs qui renvoient une erreur 404 ou la mention ‘Page Not Found’)

explique ainsi Internet Archive. Concrètement, quand le robot détecte un lien mort, il cherche une archive correspondante sur Wayback Machine et des outils similaires.

Pour Wikipédia, une telle fonctionnalité est tout simplement indispensable. La fiabilité du site est basée sur ses sources, ses preuves. Ce robot aurait pu vérifier à lui tout seul 6 million de liens. Les autres trois millions auraient été sauvés par la communauté. Cocorico, sur les 22 éditions concernées, on trouve la Française !

Source

Cliquez pour commenter

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Dernières news

Les bons plans

Les tests