Connect with us
Bouygues

Internet

Un nouvel algorithme devine votre sexe en analysant vos Tweets !

L’anonymat sur Internet vient va en prendre un coup du côté de Twitter à cause d’un nouvel algorithme. Des chercheurs, en analysant le contenu d’un grand nombre de Tweets; ont trouvé un moyen efficace de déterminer votre sexe depuis ce que vous partagez sur le réseau social.

Il y a

le

L’anonymat sur Internet vient va en prendre un coup du côté de Twitter à cause d’un nouvel algorithme. Des chercheurs, en analysant le contenu d’un grand nombre de Tweets, ont trouvé un moyen efficace de déterminer votre sexe depuis ce que vous partagez sur le réseau social.

Ce sont des chercheur de la Mitre corporation qui ont mis au point l’agorithme pour déterminer avec une certitude assez satisfaisante le sexe d’un utiilisateur grâce à un de ses Tweet, de sa description ou de toute sa timeline. Twitter ne demande pas le sexe sur les profils, ce qui a expliqué le choix de ce réseau pour tester l’algorithme. Une première équipe a collecté la localisation, le nom du profil (le @JBPresse pour moi par exemple) le vrai nom de tous, puis le sexe de 184,000 compte (de manière externe à l’algorithme). Ainsi, tous les Tweets de ces 184,000 personnes ont été analysés et les chercheurs ont essayé de voir les caractéristiques inhérentes aux comptes féminins et masculins qui permettraient de les discriminer.

> Lire aussi :  Twitter a testé des recommandations de comptes à ne plus suivre

Une première phase de test a été de déterminer si l’algorithme pouvait retrouver le sexe grâce au nom du profil, ce qui était possible dans 89% des cas ! Plus dur maintenant, en analysant le contenu d’un simple Tweet prit au hasard, l’algorithme retrouve dans 66% des cas le sexe de l’utilisateur, ce qui n’est pas très précis mais assez impressionnant sur si peu d’information. En analysant tous les Tweets sur une timeline, la précision augmente à 75% d’identité et 77% en analysant simplement la description. En prenant en compte les Tweets, le nom et la description en même temps, la précision de l’algorithme monte à 92% !

La ponctuation s’est souvent avéré être un très bon indicateur du sexe. L’usage du smiley souriant ou une utilisation abusive des points s’exclamation semble être typiquement corrélé avec des utilisateurs féminins (ne vous offusquez pas, c’est de la science !). Le vocabulaire est aussi un bon discriminant des mots comme « amour », « mignon », « heureux », « maman », « dormir », « école », « bébé », « lit », « chocolat » ont tendance à indiquer également un profil féminin alors que les mots discriminants masculins trouvés par l’algorithme sont seulement « http » et « google » (ainsi que la non-utilisation des mots pour les filles) ! Ça peut paraître bizarre et/ou stéréotypé … mais apparemment ça marche !

> Lire aussi :  Voici comment fonctionne l’algorithme de recherche de Twitter

Il est certain que ce genre d’algorithme risque d’intéresser Twitter puisque grâce à une analyse rapide du sexe probable de l’utilisateur, la plate-forme de micro-blogging pourra affiner ses publicités ciblées, une fonctionnalité très recherchée par les annonceurs. En attendant ne croyez plus à votre anonymat de genre sur Twitter, vous vous trahissez à chaque Tweet ! 😉

32 Commentaires

32 Commentaires

  1. Pourquoi

    28 juillet 2011 at 10 h 02 min

    Quelqu’un a le twitter de vincent mc doom? J’suis curieux de voir le resultat :-p

    • Jean-Baptiste

      28 juillet 2011 at 10 h 06 min

      @pourquoi : juste lol 🙂 (j’ai utilisé lol et un smiley dans ce commentaire, je suis probablement une fille…)

  2. Sqeelzh

    28 juillet 2011 at 10 h 11 min

    Ou sinon il suffit d’analyser les accords de genre… (ne marche que pour les langues latines, j’en conviens)

  3. Création site Internet Avignon

    28 juillet 2011 at 10 h 13 min

    Ils doivent vraiment s’ennuyaient ces chercheurs…lol mais la prouesse technique est intéressante, bien que le but final ne serve à rien 🙂

  4. Christophe Largilliere

    28 juillet 2011 at 10 h 21 min

    Oui enfin y a rien de révolutionnaire je pense, c’est comme si on analysait des tweets d’enfants (en imaginant que ca existe, c’est histoire d’illustrer ;p) en selectionnant sur « barbie, copine, corde à sauter » et « superman, copain, bagarre » :]

  5. Pingback: Un nouvel algorithme devine votre sexe en analysant vos Tweets ! | Stratégie So Me | Scoop.it

  6. TechMeOut

    28 juillet 2011 at 10 h 42 min

    Je peux me tromper, mais il me semble que la proportion d’hommes sur twitter est de plus de 70%
    Comme ils n’ont qu’une chance sur deux de se tromper, tout n’est plus qu’affaire de statistiques.
    Ca me semble fumeux cette histoire, après on peut effectivement analyser les tweets, mais comme un homme finira forcément par faire une blague sexiste, ou sortir un truc de type « je ne suis pas homme à… »
    Ca me semble à la portée de n’importe qui.

    • Jean-Baptiste

      28 juillet 2011 at 10 h 47 min

      @TechMeOut : Non tu te trompes, la proportion sur Twitter contrairement aux attentes est estimée à 55% de femmes ! (voir l’étude ici) donc au niveau stats ça devient nettement plus compliqué 🙂

  7. Pingback: Un nouvel algorithme devine votre sexe en analysant vos Tweets ! | Les scoop à CZERO | Scoop.it

  8. Romain

    28 juillet 2011 at 10 h 53 min

    Disons que s’ils arrivent à deviner votre sexe, ils peuvent également deviner vos centres d’intérêts, vos habitudes de consommation, vos périodes de vacances, vos revenus, vos opinions politiques, etc.

    • Jean-Baptiste

      28 juillet 2011 at 10 h 55 min

      @Romain : Oui exact, c’est là que ça devient puissant, d’ailleurs dans l’étude ils essayent de déterminer l’orientation politique, ça marche pas mal apparemment !

  9. TechMeOut

    28 juillet 2011 at 10 h 56 min

    Ok, mais à priori personne ne semble d’accord sur le sujet:
    http://gigaom.com/2010/03/04/who-uses-social-media-more-men-or-women/

    • Jean-Baptiste

      28 juillet 2011 at 11 h 01 min

      @TechMeOut : Tout à fait c’est pour ça d’ailleurs que ce nouvel algorithme est pas totalement inutile, il faut bien mettre les gens d’accord 🙂

  10. Reka

    28 juillet 2011 at 12 h 14 min

    Je trouve ça tout de même violent comme analyse. Même si c’est de la science (je ne démens pas, je vois comment mes prochains et prochaines s’expriment par écrit, globalement), on passe, en tant que femmes pour de fichues hystériques, tout de même.
    Parce que je suis amatrice de NTIC et que je déteste la surponctuation (entre autres), je serais prête à parier que Twitter se tromperait sur mon sexe ! 😉 (petit smiley quand même)

  11. @giniouxe

    28 juillet 2011 at 12 h 54 min

    Ce serait intéressant qu’ils créent une appli permettant de pouvoir tester son propre profil Twitter pour savoir s’il est stéréotypé ou non. Pour voir si on fait partir des 8% indécelables…

  12. Artus @ Lillungallad

    28 juillet 2011 at 15 h 00 min

    Juste pour info, google fait cela depuis très longtemps en analysant vos requêtes tapées (d’ailleurs je n’ai plus l’url sous la main mais il est possible d’avoir accès à ces infos). Il liste également les centres d’intérêt.

  13. sebastien

    28 juillet 2011 at 15 h 23 min

    mouais, si ça les intéressait chez twitter ils demanderaient simplement le sexe de l’utilisateur lors de la création du compte…

  14. Cuisine

    28 juillet 2011 at 16 h 46 min

    Ca ne me parait pas fantastique comme découverte. Du moment, où tu as un échantillon assez grand tu peux facilement mettre au point ce genre d’algorithme et les sociétés qui vendent de la publicité ciblée doivent avoir une armée de mathématiciens qui doivent en développer des beaucoup plus impressionnants.

    • Jean-Baptiste

      28 juillet 2011 at 16 h 52 min

      @cuisine : Pour travailler dans le domaine au jour le jour, l’analyse de texte humain (natural language processing) ça parait pas très compliqué vu de loin mais en fait arriver à des algo qui discriminent à plus de 90% c’est plutôt très très bien !

  15. Arnaud

    28 juillet 2011 at 19 h 55 min

    Depuis l’arrivé de facebook il n’y a déjà plus d’anonymat sur internet. Il est possible d’avoir des informations sur qui on veut sur le net donc je ne vois pas trop l’interet de ce truc …

  16. moué

    28 juillet 2011 at 22 h 14 min

    Me suis planté d’article donc je réitère.. c pas comme si la langue française regorgeait d’indicateurs concernant le sexe… Un peu sensationnaliste à mon goût :p

  17. Abel Carballiño

    29 juillet 2011 at 0 h 45 min

    Je ne peux pas y croire… sauf pour les blogs mode-tendances,etc…
    J’aime votre site. Merci

  18. Lionel

    29 juillet 2011 at 10 h 13 min

    Reste plus qu’à déterminer l’âge avec la même méthode… voire même les centres d’intérêt (ce qui paraît naturel)

  19. Le blog de clara

    29 juillet 2011 at 10 h 59 min

    Je relève dans cet article une utilisation abusive de points d’exclamation, nous cacheriez vous quelque chose Jean Baptiste ?

    • Jean-Baptiste

      29 juillet 2011 at 11 h 20 min

      @Le blog de clara : J’avoue tout… mon vrai prénom c’est Jeanne-Baptistinne… 🙂

  20. Pingback: Twitter : un algorithme pour détermier le sexe des utilisateurs | Geeko

  21. blog marketing

    29 juillet 2011 at 15 h 25 min

    ah c’est bien peut être qu’on pourra bientôt classer les gens, et détecter toute sortes d’anomalies chez les gens suite à leur tweet. Comme ca on fera des groupes de gens en fonction de leur tweet…dsl mais je ne vois pas vraiment l’interet de ce genre de choses.

  22. Pingback: Un nouvel algorithme devine votre sexe en analysant vos Tweets ! | Ma veille TIC | Scoop.it

  23. Liv

    1 août 2011 at 16 h 46 min

    Ah bah si le principe est de déterminer le bord politique via les tweets, cela va peut être nous permettre de savoir quoi voter pour 2012…

  24. Auteur en vie

    2 août 2011 at 13 h 48 min

    Mouai, mouai…on ne parvient à détecter les hommes que s’ils ne prononcent pas ces stupides mots qui caractérisent les femmes. La gente féminine en prend un coup, mon vieux.

  25. forfait iphone

    3 août 2011 at 8 h 53 min

    Reste encore à déterminer l’âge, les centres d’intérêt, le bord politique et big brother is watching you 😀

  26. Gourmet

    10 août 2011 at 14 h 56 min

    Mouarf,
    je faisais ça du temps des messageries Minitel.
    Ca fait un bail !
    Et je me trompais rarement.
    En revanche, chapeau pour mettre ça en équation.

    db

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Dernières news

Les bons plans

Les tests