Identifier une langue facilement avec Polyglot 3000

Quand on recherche de l’information sur internet, il arrive que l’on trouve une source intéressante sur un site écrit dans une langue inconnue ou difficile à identifier. Pour cela il existe une fonction d’identification automatique dans les outils de traduction Google, mais cela ne suffit pas si vous voulez indiquer l’origine géographique de votre source.

Quand on recherche de l’information sur internet, il arrive que l’on trouve une source intéressante sur un site écrit dans une langue inconnue ou difficile à identifier.

Pour cela il existe une fonction d’identification automatique dans les outils de traduction Google, mais cela ne suffit pas si vous voulez indiquer l’origine géographique de votre source.

Pour cela il existe un logiciel gratuit, Polyglot 3000, qui fait le boulot : vous collez du texte saisi sur un site en langue inconnue et celui-ci va en identifier la langue. Le logiciel reconnaît plus de 400 langues et affiche un indicateur de précision en pourcentage vous permettant d’affirmer avec une certaine marge de sécurité que le site visité est plutôt vietnamien que vraiment argentin (ça c’est si vous êtes vraiment inculte).

Polyglot 3000 est disponible pour Windows XP et précédents (Vista n’est pas mentionné ?)


Nos dernières vidéos

4 commentaires

  1. @Matthieu : oui on pourrait très facilement transposer ce produit en service en ligne : tout est déjà là et en open source.
    J’en parlais déjà en 2005 : http://motrech.blogspot.com/20.....2796180000
    Et depuis, ce plugin d’analyse de la langue de Nutch est maintenant dans une lib autonome Tika : http://lucene.apache.org/tika/
    Donc y’a plus qu’à….
    Sinon, il y a aussi cette démo de TextCat en ligne : http://odur.let.rug.nl/~vannoord/TextCat/Demo/
    Et quelques autres produits commerciaux ou non : http://odur.let.rug.nl/~vannoo.....itors.html

  2. Pingback: Identificateur de langue: Polyglot 3000 « :: Le dico dans la peau ::

  3. Ouais pareil que Matthieu… Je préfèrerais une solution en ligne. La démo de TextCat conseillée par Jérôme m’a fait le boulot mais le site en frames est tout simplement hideux 🙂

Répondre