Bientôt la reconnaissance de caractères (OCR) dans Google Docs
Par Eric,
1 octobre 2009 à 07:51 :: Web
et faites-le connaître
Nous recevons fréquemment des documents scannés ou au format image contenant du texte que nous souhaiterions extraire pour l’éditer ou le copier dans un autre document.
Pour cela il existe des logiciels de reconnaissance optique de caractères OCR) (Optical Character Recognition), fournis la plupart du temps avec votre scanner, ou des services web comme ABBYY FineReader.
Google a eu la bonne idée de développer une option pour Google Docs qui fait le job, à savoir reconnaître du texte dans une image et le convertir d’un clic en nouveau document de votre bibliothèque Google Docs, prêt à être édité.
Le service est pour le moment en cours d’expérimentation et la conversion comporte encore quelques erreurs, mais le résultat sur un long document texte scanné dans une qualité très moyenne est très satisfaisant.
Les formats acceptés sont sans surprise JPG, PNG et GIF, et il faut compter entre 15 et 40 secondes pour obtenir la conversion d’un document, selon sa taille.
Petite déception : le service ne semble pas pour le moment fonctionner avec du texte en français (ou non anglais). J’ai testé et obtenu… une page blanche. Mais connaissant Google et sa pratique avancée des langues exotiques, ceci devrait être implanté très rapidement.
Si vous possédez un compte Google Docs, vous pouvez tester l’application ici : http://googlecodesamples.com/docs/php/ocr.php
(source)





Commentaires
1. Le 1 octobre 2009 à 8:36, par jcfrog :: site
2. Le 1 octobre 2009 à 8:37, par ramzalelfe :: site
3. Le 1 octobre 2009 à 8:51, par Monsieur+Buzz :: site
4. Le 1 octobre 2009 à 17:21, par mathbruyen :: site
5. Le 1 octobre 2009 à 19:07, par Baptiste :: site
6. Le 2 octobre 2009 à 12:14, par Love Shopping :: site
Ajouter un commentaire