PDFTextOnline, pour extraire facilement le texte d’un document PDF

Il n’est pas toujours très aisé (et même parfois impossible) de récupérer le texte inclus dans un fichier au format PDF. PDFTextOnline apporte une solution gratuite, immédiate, et ne nécessitant pas d’installation de logiciel puisqu’il s’agit d’un webware (service en ligne) comme on les aime, sauf si on est très à cheval sur la confidentialité

Il n’est pas toujours très aisé (et même parfois impossible) de récupérer le texte inclus dans un fichier au format PDF.
PDFTextOnline apporte une solution gratuite, immédiate, et ne nécessitant pas d’installation de logiciel puisqu’il s’agit d’un webware (service en ligne) comme on les aime, sauf si on est très à cheval sur la confidentialité de ses données bien sûr.

PDF Text Online

Avec PDFTextOnline, il vous suffit de sélectionner un document PDF sur votre disque dur, et celui-ci s’affiche au format texte dans une interface en Ajax très simple. Vous pouvez même choisir votre mise en forme (visuelle ou sémantique), les bookmarks si le document en contient, et la police de caractère de sortie, et vous récupérez l’intégralité du texte  dans un fichier au format .txt lui-même contenu dans un dossier zippé.

Le service ne requiert même pas d’inscription, mais vous demander d’accepter pour chaque nouveau document ses conditions générales d’utilisation, dont le premier alinéa indique laconiquement mais clairement « Any PDF document you upload will be stored, retained, and possibly reviewed by SNOWTIDE for quality control purposes only » (tout document téléchargé sera stocké, conservé et possiblement vérifié par Snowtide pour des raisons de contrôle de qualité).

Pratique et efficace, mais à réserver en dépannage pour les documents non sensibles, donc.


Nos dernières vidéos

8 commentaires

  1. L’idée est bonne, après, comme tu le dis, il faut se méfier de se que l’on envoie vers le serveur…
    Dommage que l’interface soit un peu austère…

  2. Bonjour,
    pour ceux qui ne veulent pas utiliser un document en ligne, il existe un petit outil fort pratique qui extrait le texte et les images d’un fichier pdf, avec possibilité de sélectionner aussi la/les pages à extraire :

    http://www.foolabs.com/xpdf/

    Le tout en mode console (pas d’interface graphique)

    Bonne journée
    Emilio

    PS : il s’agit en fait d’un sous-ensemble d’un visualisateur de documents pdf sous X Window

  3. Arf, j’ai essayé avec FF 3 et Opéra, et après avoir cliqué sur « select PDF document » rien ne se passe alors que j’imagine qu’une boîte de dialogue devrait s’ouvrir pour uploader le fichier quoi. :/

  4. Je me permet de signaler également puisqu’on parle de PDF que acrobat reader propose un service en ligne de création et de stockage de documents PDF(5go d’espace) le service en est encore en béta j’ai tester sur mon blog l’affiage de document PDF et sa fonctionne plutôt bien avec possibilité pour les lecteurs de télécharger le PDF.Voila Eric si ta l’occasion de tester ce service proposé par acrobat fait nous part de ton avis.

  5. c’est trop facile finalement, ouvrez le pdf online, esseyez de l’inprimer avec chrome ie online aussi, vous aurez un aperçu et c’est possible de copier le texte
    bon vent

Répondre