Quelles sont ces données (personnelles) que les IA de Google peuvent utiliser ?

Google a récemment mis à jour ses règles de confidentialité. Celles-ci indiquent que la firme peut exploiter des données publiquement accessibles pour entraîner ses IA.

Publié le 5 juillet 2023 à 9 h 00 min

Par Setra

La politique de confidentialité de Google a été mise à jour le 1er juillet
La nouvelle version indique que des données publiquement accessibles peuvent être utilisées pour entraîner l’intelligence artificielle Bard
Une clarification apportée à un moment où l’entraînement des IA suscite des interrogations

Les intelligences artificielles telles que ChatGPT ou Bard ont besoin de données pour s’améliorer. Et en ce qui concerne Google, celui-ci a récemment publié une mise à jour de ses règles de confidentialité. En résumé, cette mise à jour précise que si des informations vous concernant sont disponibles sur des sources publiques, elles peuvent être utilisées pour entraîner les intelligences artificielles de Google, dont Bard ou l’IA de son service Cloud.

Google est très transparent lorsqu’il modifie sa politique de confidentialité, puisque les anciennes versions sont archivées et consultables. Ainsi, on a la possibilité de constater les modifications apportées par la firme. Le 1er juillet, justement, a apporté quelques changements sur ce document. La nouvelle version indique toujours que “dans certains cas, Google collecte aussi des informations sur vous auprès de sources accessibles publiquement.”

Des données publiques

L’exemple classique : si votre nom apparaît dans un article de journal, le moteur de recherche de Google peut indexer cet article et afficher celui-ci si un internaute saisit votre nom dans la barre de recherche. Mais depuis la mise à jour de juillet, la firme indique également que ce genre d’information publiquement accessible peut être utilisé pour entraîner ses IA.

Voici, plus exactement, ce qu’on peut lire dans la nouvelle politique de confidentialité : “Par exemple, nous pouvons collecter des informations disponibles publiquement en ligne ou auprès d’autres sources publiques pour contribuer à l’entraînement des modèles d’IA de Google, et concevoir des produits et des fonctionnalités comme Google Traduction, Bard et les capacités d’IA de Cloud.”

Google Privacy — Capture d’écran sur les Règles de confidentialité de Google. © Google

Google clarifie les choses

Sur la précédente version de sa politique de confidentialité, Google ne parlait pas de modèle d’IA, mais plutôt de “modèles linguistiques”. De plus, cette précédente version ne citait que Google Traduction comme exemple (normal, puisque l’ancienne version datait de 2022). Il semblerait que le document a récemment mis à jour pour apporter plus de clarté.

Mais en tout cas, ce changement fait couler beaucoup d’encre, à un moment où la façon dont les données sont utilisées pour entraîner des IA fait débat. D’ailleurs, l’un des concurrents de Google dans l’intelligence artificielle, OpenAI, est actuellement attaqué en justice à cause de données qu’il a utilisées pour entraîner ses IA.

Et récemment, Twitter a imposé de nouvelles limites de lecture sur sa plateforme. Dans son annoncé, Elon Musk indique que c’est pour “faire face aux niveaux extrêmes de récupération de données et de manipulation du système.” Les comptes vérifiés sont limités à la lecture de 6000 publications par jour, les comptes non vérifiés jusqu’à 600 publications par jour et les nouveaux comptes non vérifiés à 300 par jour. Selon nos confrères de The Verge, suite à cette mise à jour de Twitter, les tweets apparaissent moins souvent sur le moteur de recherche de Google.

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Youtube

Par : Google LLC

4.2 / 5

M174.6 avis

App Store Play Store Actualités