Si de nouvelles pages web apparaissent sur la toile chaque jour, d’autres disparaissent. Et la vitesse à laquelle ces pages sont retirées est plus rapide que vous le pensez. En tout cas, c’est ce qui est suggéré par une étude réalisée par Pew Research Center, qui évoque même une “dégradation numérique”. En effet, d’après celle-ci, 38 % des pages web qui existaient en 2013 ne sont plus accessibles aujourd’hui.
Et cette dégradation ne concerne pas que les pages qui étaient en ligne il y a dix ans. “Nous avons constaté que 25 % de toutes les pages collectées entre 2013 et 2023 n’étaient plus accessibles à partir d’octobre 2023”, indique Pew Research Center. 16 % de ces pages ont été retirées de sites web encore fonctionnels. Mais 9 % des liens proviennent de domaines qui ne sont plus fonctionnels. L’étude indique aussi qu’un cinquième des pages web collectées en 2021 n’étaient plus accessible deux ans plus tard.
L’étude s’est appuyée sur les archives de Common Crawl, un service qui collecte des captures d’internet à un instant donné. Pew Research Center a collecté, de manière aléatoire, un échantillon de près d’un million de pages web datant de 2013 à 2023, soit environ 90 000 pages par année étudiée.
Une dégradation qui s’observe un peu partout
D’autres analyses montrent par ailleurs que cette dégradation d’internet peut être observée un peu partout. Par exemple, Pew Research Center a observé les liens externes de 500 000 pages de médias, appartenant à 2 063 sites différents, sur l’archive Common Crawl de mars-avril 2023. Et 5 % de ces liens externes pointaient vers des pages qui n’existent plus. Et 23 % des articles analysés contenaient au moins un lien cassé. “Les liens brisés sont aussi répandus sur les sites d’information les plus fréquentés que sur les sites les moins fréquentés”, peut-on aussi lire dans la publication.
Dans une autre analyse, PRC a collecté, de manière aléatoire, 50 000 pages Wikipédia afin d’examiner les liens externes utilisés comme références pour ces articles. Et d’après l’étude, 11 % du million de liens de références trouvés dans ces articles étaient inaccessibles. Et en utilisant l’API de X (ancien Twitter), Pew Research Center a analysé près de 5 millions de publications datant du 8 mars au 27 avril 2023. Après la période d’observation qui s’est achevée le 15 juin, les chercheurs ont découvert que 18 % des publications n’étaient plus accessibles publiquement.
- Pour Pew Research Center, on assiste à une dégradation numérique
- Celle-ci publie les résultats d’une étude sur les pages web qui disparaissent d’internet et indique que 38 % des pages qui existaient en 2013 n’existent plus aujourd’hui
- Pour Pew Research Center a également observé un très grand nombre de liens externes morts sur les articles de presse, et sur les références de Wikipédia
📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Se contentent de l’url ?
J’ai un site que je faisais pour ma mairie qui est depuis que je ne suis plus élu en état de mort cérébrale sur mes pages perso, il n’évolue plus mais existe toujours au complet alors qu’avant il avait une url propre et que depuis il a été remplacé par un autre site à une autre url en reprenant une part de l’historique. Donc au final les mêmes pages existent en plus grand nombre :o)
Vous allez nous saouler encore longtemps avec “X ancien twitter”.. c’est bon tout le monde le sait. Et même si il y en a qui ne le saurait pas que X s’appelait avant twitter, ça n’a aucun rapport avec le sujet de l’article. Mais apparement le changement déstabilise les journalistes de tous médias. Vous êtes des conservateurs en fait !
Je plains votre petite vie, si le moindre petit changement vous effraye à ce point