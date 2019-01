C’est le « meme » du moment. Si vous utilisez les médias sociaux, et notamment Facebook, vous ne pourrez pas y échapper : vous avez probablement remarqué depuis le début de la semaine que nombre de membres affichent les photos de leur profil d’il y a 10 ans comparées à leur visage actuel. Si ce « challenge », dont on ne connait pas l’origine, peut paraitre aussi amusant qu’anodin, il pourrait faire la joie des développeurs d’algorithmes d’intelligence artificielle à base de reconnaissance faciale. C’est en tout cas le point de vue développé par une auteure, qui s’en explique dans une très longue tribune dans Wired, suite à un tweet ayant déclenché de nombreuses réactions.

« Imaginez que vous vouliez former un algorithme de reconnaissance faciale sur les caractéristiques liées à l’âge et, plus précisément, sur la progression de l’âge (par exemple comment les gens sont susceptibles d’être plus âgés). Idéalement, cela nécessiterait un ensemble de données large et rigoureux avec beaucoup de photos des personnes en question. Il serait également nécessaire de savoir qu’elles ont été prises à un nombre fixe d’années d’intervalle, disons, 10 ans. Bien sûr, vous pouvez explorer Facebook pour trouver des photos de profil et consulter les dates d’affichage ou les données EXIF. Mais toute cette série d’images de profil pourrait finir par générer beaucoup de bruit inutile. Les gens ne téléchargent pas les photos dans l’ordre chronologique, et il n’est pas rare que les utilisateurs publient des photos de quelque chose d’autre qu’eux-mêmes sous forme d’image de profil. Un coup d’œil rapide aux photos du profil de mes amis sur Facebook montre le chien d’un ami qui vient de mourir, plusieurs dessins animés, des images de mots, des motifs abstraits, et plus encore. En d’autres termes, il serait utile d’avoir un ensemble de photos propres, simples et faciles à étiqueter à l’époque et maintenant. »

Une masse de données clairement renseignées (ou pas)

Kate O’Neill explique également que pour les photos de profil sur Facebook, la date d’affichage de la photo ne correspondrait pas nécessairement à la date à laquelle la photo a été prise. Grâce au meme Facebook, la plupart des gens ont ajouté ce contexte (par exemple « moi en 2008 et moi en 2018 »), ainsi que d’autres informations, dans de nombreux cas, sur le lieu de la photo et la façon sont elle a été prise. En d’autres termes, grâce à ce challenge, les algorithmes disposent désormais d’un très grand nombre de données de photos de personnes d’il y a environ 10 ans et des mêmes personnes aujourd’hui.

A ce sujet, l’auteur rappelle aussi que les dernières années ont été riches en exemples de jeux sociaux et de memes conçus spécifiquement en vue d’extraire et collecter des données, l’exemple venant à l’esprit étant celui du scandale Cambridge Analytica, avec l’extraction massive de données de plus de 70 millions d’utilisateurs américains de Facebook.

Alors bien sûr, on peut se demander à qui profite le crime, et quelles données pertinentes ressortent de ce type de données. Car l’analyse des photos postées dans le cadre du #10yearschallenge de Facebook pourrait quand même poser quelques problèmes aux intelligences artificielles et les faire un peu transpirer sur des cas atypiques dans lesquels les internautes s’amusent à publier à peu près n’importe-quoi. Mais c’est aussi le rôle de l’apprentissage machine, et même son essence : forger sa compétence sur la donnée, et in fine être capable de faire le tri. Dans ce contexte, on peut imaginer que les personnes qui postent des photos de leur hamster participent aussi à renforcer les algorithmes.

Source