Google Docs teste l'OCR, reconnaissance optique de caractères

Bientôt la reconnaissance de caractères (OCR) dans Google Docs

Nous recevons fréquemment des documents scannés ou au format image contenant du texte que nous souhaiterions extraire pour l’éditer ou le copier dans un autre document….

Publié le 1 octobre 2009 à 7 h 51 min

Par Eric DUPIN

Nous recevons fréquemment des documents scannés ou au format image contenant du texte que nous souhaiterions extraire pour l’éditer ou le copier dans un autre document.

Pour cela il existe des logiciels de reconnaissance optique de caractères OCR) (Optical Character Recognition), fournis la plupart du temps avec votre scanner, ou des services web comme ABBYY FineReader.

Google a eu la bonne idée de développer une option pour Google Docs qui fait le job, à savoir reconnaître du texte dans une image et le convertir d’un clic en nouveau document de votre bibliothèque Google Docs, prêt à être édité.

Le service est pour le moment en cours d’expérimentation et la conversion comporte encore quelques erreurs, mais le résultat sur un long document texte scanné dans une qualité très moyenne est très satisfaisant.

Les formats acceptés sont sans surprise JPG, PNG et GIF, et il faut compter entre 15 et 40 secondes pour obtenir la conversion d’un document, selon sa taille.

Petite déception : le service ne semble pas pour le moment fonctionner avec du texte en français (ou non anglais). J’ai testé et obtenu… une page blanche. Mais connaissant Google et sa pratique avancée des langues exotiques, ceci devrait être implanté très rapidement.

Si vous possédez un compte Google Docs, vous pouvez tester l’application ici : http://googlecodesamples.com/docs/php/ocr.php

(source)

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Opera One - Navigateur web boosté à l’IA

Par : Opera

Télécharger gratuitement

7 commentaires

jcfrog dit :

1 octobre 2009 à 8 h 36 min

good news! 🙂

Répondre
ramzalelfe dit :

1 octobre 2009 à 8 h 37 min

Bonjour Éric,

Une question : un tel service n’annoncerait-il pas la fin de l’anti spam par images ? En effet, si un robot peut enregistrer la photo, l’envoyer à ce service et ensuite mettre dans le champ approprié le texte extrait de l’image, il est bien probable qu’il faille trouver autre chose…

Répondre
Monsieur+Buzz dit :

1 octobre 2009 à 8 h 51 min

Depuis le temps qu’on attends un outil efficace de ce type…

Répondre
mathbruyen dit :

1 octobre 2009 à 17 h 21 min

L’achat de reCAPTCHA semble vite intégré!

Pour éviter les usages abusifs il y a une limitation sur le nombre de requètes par compte google (cependant des news un peu vieillotes et que je ne retrouve pas affirmaient cependant qu’une bonne partie des robots passaient la captcha google, ce qui voudrait dire qu’obtenir des comptes est facile).

Cependant pour moi la plus grosse limitation est que le robot ne peut pas se permettre d’analyser toutes les images présentes sur un site (il ne peut pas à priori savoir que l’adresse est dans telle image).

Répondre
Baptiste dit :

1 octobre 2009 à 19 h 07 min

Chez moi, ça fonctionne en français 🙂

Répondre
Love Shopping dit :

2 octobre 2009 à 12 h 14 min

Super ce truc.. Raaaaaah la technologie, quand tu nous tiens !

Répondre

Les commentaires sont fermés.