"Vous les lisez tous les jours" : comment ces sites générés par IA qui enregistrent des millions de vues tuent les médias en ligne

“Vous les lisez tous les jours” : comment ces sites générés par IA qui enregistrent des millions de vues tuent les médias en ligne

Ils s’invitent dans vos fils d’actualité, apparaissent en tête des résultats de recherche et vous les consultez peut-être sans même vous en rendre compte. Ces nouveaux acteurs de l’information ne sont pourtant ni des journaux traditionnels, ni des médias légitimes. Entièrement ou partiellement générés par intelligence artificielle, ils pillent le contenu des médias établis pour engranger trafic et revenus publicitaires, bien aidés par Google.

Publié le 7 mai 2025 à 13 h 19 min

Par Romain Vitt

Le constat est pour le moins alarmant : plus de 3 500 sites en français sont suspectés d’utiliser l’IA pour produire du contenu, selon une enquête de Next. À l’échelle mondiale, la start-up NewsGuard, qui lutte contre la désinformation, a identifié 1 254 sites “non fiables” générés par IA dans 16 langues différentes, dont une trentaine de sites francophones.

“Une grande partie émane de professionnels du référencement”, explique Jean-Marc Manach, journaliste ayant mené une vaste enquête sur le sujet pour Next et Libération. Ces sites se caractérisent par une production de contenu 24h/24, des tournures de phrases spécifiques (comme des conclusions moralisatrices), des régies publicitaires communes, et souvent des profils de journalistes fictifs.

Le modèle économique est simple mais redoutablement efficace : utiliser l’IA pour réécrire ou traduire des articles déjà publiés par des médias légitimes, attirer du trafic grâce à un bon référencement, puis monétiser ces visites via la publicité programmatique. Résultat : ces faux sites d’information entièrement générés par IA sont mis en avant par Google sur Discover (le fil d’actualités que l’on trouve dans le volet tout à gauche des smartphones) et dans ses résultats de recherche.

Modèle économique et désinformation

Le préjudice pour les médias traditionnels est double. D’abord économique : “ils sont souvent bien référencés, certains même mieux que les médias qu’ils plagient”, souligne Chine Labbé, rédactrice en chef de NewsGuard. Environ la moitié des sites identifiés par NewsGuard diffusent de la publicité programmatique, détournant des revenus qui auraient dû revenir aux médias ayant réellement produit l’information.

Mais le préjudice est aussi informationnel. En introduisant des erreurs ou des “hallucinations” dans les articles copiés, ces sites abîment la marque d’un média. Ils contribuent à polluer l’écosystème de l’information en ligne et à renforcer la fatigue informationnelle des lecteurs. De son côté, Google dit avoir pris toutes les mesures nécessaires pour éviter la désinformation et continuer à mettre en avant des médias sérieux. “Nos systèmes antispams luttent contre la production de masse de contenus de faible qualité” explique un porte-parole aux Echos.

En réalité, il suffit d’analyser les tendances françaises pour savoir que les professionnels du référencement à l’origine de ces sites créés par IA ont réussi à dompter les algorithmes de Google. Il n’est pas rare que ces sites prennent les premières positions des sites les plus lus sur une journée grâce à une actualité bien ciblée propulsée par IA. Et le phénomène ne touche pas que la France. Aux États-Unis, le nombre de sites se présentant comme de l’information mais qui sont en réalité des sites partisans générés par IA dépasse désormais le nombre de sites de journaux locaux, selon NewsGuard !

Les médias se mobilisent

Face à cette menace grandissante, les médias traditionnels commencent à réagir. Ce mercredi 7 mai, le tribunal de justice de Paris devrait rendre une décision très attendue concernant le site News.DayFr.com, poursuivi par une quarantaine de journaux français qui l’accusent de “dérober” leurs articles en ligne pour les reproduire automatiquement. “Le site n’ayant pas de mentions légales, on a assigné les fournisseurs d’accès Internet pour qu’ils le bloquent, en mettant en avant la contrefaçon”, précise Charles-Emmanuel Soussen, l’un des avocats du dossier.

Une action qui pourrait faire jurisprudence, alors que “les éditeurs prennent le sujet au sérieux” et que “d’autres actions pourraient être envisagées”, selon Pierre Petillault, directeur de l’Alliance de la presse d’information générale (Apig). Certains sites auraient même réussi à passer entre les mailles du filet de la Commission paritaire des publications et agences de presse (CPPAP), bénéficiant ainsi indûment de taux de TVA réduits normalement réservés aux médias légitimes.

L’Europe tente d’apporter une réponse à ce fléau. À partir de l’été 2026, la loi européenne sur l’IA (IA Act) imposera que les contenus générés ou manipulés par l’intelligence artificielle soient clairement identifiés comme tels, ce qui pourrait théoriquement assainir la situation. Mais d’ici là, le mal pourrait être fait, avec un paysage médiatique numérique profondément transformé. Comble de l’ironie, le texte original des autorités européennes explique qu’à l’avenir, l’exception devienne de préciser “cet article a été écrit par un humain” plutôt que par une IA…

Plus de 3 500 sites en français utilisent l’IA pour copier et réécrire des articles de médias légitimes, générant ainsi du trafic et des revenus publicitaires au détriment des créateurs originaux.
Ces sites causent un double préjudice : économique en détournant des revenus publicitaires, et informationnel en introduisant des erreurs qui nuisent à la qualité de l’information en ligne.
La justice commence à s’emparer du problème, et l’Europe prévoit d’imposer un étiquetage obligatoire des contenus générés par IA à partir de l’été 2026.

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.