Plagiat : l'erreur coupable de cette IA rappelle pourquoi il faut toujours tout vérifier

Plagiat : l’erreur coupable de cette IA rappelle pourquoi il faut toujours tout vérifier

Le chat Perplexity AI vient d’être pris la main dans le sac pour une histoire de plagiat.

Publié le 10 juin 2024 à 18 h 52 min

« Vous avez récupéré et réutilisé des rapports d’enquête collectés sur plusieurs mois, les avez étoffés avec des reprises du même article par d’autres médias, et n’avez même pas pris la peine de nous mentionner dans votre post régurgité », explique John Paczkowski, éditeur de Forbes cité par nos confrères de 01Net.

La startup Perplexity AI vient d’être mise à l’index par un journaliste de Forbes qui lui reproche des reprises telles quelles de passages d’articles, sans dûment citer le texte en question. Les robots crawlers qui servent à entraîner l’IA phare de l’entreprise, spécialisée dans le résumé d’actualités, semblent procéder à une collecte particulièrement large, tandis que le modèle actuel procède à des reprises sans les différencier de ses textes réellement générés de façon automatisée.

Pourquoi les textes générés par les IA sont à vérifier systématiquement

Dans certains cas, les reprises concernent même des contenus protégés par un paywall. De quoi susciter les foudres de Forbes, même si la publication note dans le même temps que Perplexity met clairement en avant ses sources dans sa rubrique Pages, contrairement à d’autres concurrents comme OpenAI (chatGPT), Google (Gemini) et Microsoft (Copilot).

La reprise d’articles protégés et la question du droit d’auteur et des accords indispensables avec les plateformes IA revient régulièrement dans l’actualité. Le projecteur étant surtout centré sur chatGPT et OpenAI dont certaines réponses génératives ont été les premières à soulever le problème.

Depuis OpenAI fait tout en coulisses pour nouer des accords financiers avec les plus grands groupes de presse. Une stratégie qui débouche pour l’instant par des résultats en demi-teinte. Quelques accords ont en effet été noués, mais pour l’essentiel, de nombreux grands journaux refusent encore catégoriquement toute collaboration avec OpenAI.

Ce qui, n’est pas forcément toujours dans leur intérêt. La presse est en effet à la fois plongée dans un monde qui évolue très vite autour des textes générés par des LLM toujours plus sophistiquées, et des comportements des lecteurs sur internet qui semblent dénoter des changements pas toujours vertueux dans leur interaction avec les sources d’actualité.

Le tout dans un contexte où l’information “gratuite” reste largement prévalente et le point de revenu publicitaire en baisse constante. De quoi suggérer de grandes mutations à venir pour le secteur. En plus d’obtenir un accord pour utiliser des textes sous droit d’auteur, OpenAI propose ainsi dans le cadre de ses accords des outils indispensables à certaines rédaction pour rester toujours plus agiles et rapides dans leur publication d’actualités.

Ou pour aider leurs lecteurs à s’y retrouver plus vite dans des bases de données complexes à appréhender, en particulier dans le secteur de la presse économique. À date, une poignée de grands groupes ont signé un accord avec OpenAI. On peut citer Le Monde en France, Prisa Media, News Corp (Wall Street Journal), The Atlantic, Vox Media, Associated Press ou encore Axel Springer. Les accords concernent également des plateformes telles que le site Reddit.

Dans tous les cas, cette histoire rappelle autant aux éditeurs qu’aux utilisateurs qu’il faut toujours bien vérifier ce que régurgitent les IA. Pour les utilisateurs, le risque de commettre sans le savoir du plagiat pur est simple reste très important.

Le journal Forbes met à l’index Perplexity AI après la découverte de textes plagiés à partir de son site.
Ces textes sont présentés sans distinctions avec d’autres parties générées automatiquement.
Dans certains cas, l’IA semble même se servir de passages d’articles derrière un paywall.

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.