Connect with us
Bouygues

Internet

PDFTextOnline, pour extraire facilement le texte d’un document PDF

Il y a

le

Il n’est pas toujours très aisé (et même parfois impossible) de récupérer le texte inclus dans un fichier au format PDF.
PDFTextOnline apporte une solution gratuite, immédiate, et ne nécessitant pas d’installation de logiciel puisqu’il s’agit d’un webware (service en ligne) comme on les aime, sauf si on est très à cheval sur la confidentialité de ses données bien sûr.

PDF Text Online

Avec PDFTextOnline, il vous suffit de sélectionner un document PDF sur votre disque dur, et celui-ci s’affiche au format texte dans une interface en Ajax très simple. Vous pouvez même choisir votre mise en forme (visuelle ou sémantique), les bookmarks si le document en contient, et la police de caractère de sortie, et vous récupérez l’intégralité du texte  dans un fichier au format .txt lui-même contenu dans un dossier zippé.

Le service ne requiert même pas d’inscription, mais vous demander d’accepter pour chaque nouveau document ses conditions générales d’utilisation, dont le premier alinéa indique laconiquement mais clairement « Any PDF document you upload will be stored, retained, and possibly reviewed by SNOWTIDE for quality control purposes only » (tout document téléchargé sera stocké, conservé et possiblement vérifié par Snowtide pour des raisons de contrôle de qualité).

Pratique et efficace, mais à réserver en dépannage pour les documents non sensibles, donc.

8 Commentaires

8 Commentaires

  1. Matt L.

    23 juin 2008 at 13 h 52 min

    L’idée est bonne, après, comme tu le dis, il faut se méfier de se que l’on envoie vers le serveur…
    Dommage que l’interface soit un peu austère…

  2. Mademoiselle

    23 juin 2008 at 14 h 10 min

    Ahhhh, ça c’est hyper chouette !
    Ca va changer la vie de beaucoup de gens 🙂

    Mademoiselle.

  3. emilio

    23 juin 2008 at 15 h 17 min

    Bonjour,
    pour ceux qui ne veulent pas utiliser un document en ligne, il existe un petit outil fort pratique qui extrait le texte et les images d’un fichier pdf, avec possibilité de sélectionner aussi la/les pages à extraire :

    http://www.foolabs.com/xpdf/

    Le tout en mode console (pas d’interface graphique)

    Bonne journée
    Emilio

    PS : il s’agit en fait d’un sous-ensemble d’un visualisateur de documents pdf sous X Window

  4. Touvert

    23 juin 2008 at 20 h 09 min

    Arf, j’ai essayé avec FF 3 et Opéra, et après avoir cliqué sur « select PDF document » rien ne se passe alors que j’imagine qu’une boîte de dialogue devrait s’ouvrir pour uploader le fichier quoi. :/

  5. Japan

    23 juin 2008 at 21 h 13 min

    Je me permet de signaler également puisqu’on parle de PDF que acrobat reader propose un service en ligne de création et de stockage de documents PDF(5go d’espace) le service en est encore en béta j’ai tester sur mon blog l’affiage de document PDF et sa fonctionne plutôt bien avec possibilité pour les lecteurs de télécharger le PDF.Voila Eric si ta l’occasion de tester ce service proposé par acrobat fait nous part de ton avis.

  6. gderidet

    27 juin 2008 at 17 h 34 min

    Le résultat est un fichier texte à retravailler car les sauts de page ne sont pas respectés (même en Utf-8) Pas terrible.

  7. gael

    18 février 2009 at 18 h 15 min

    Difficile de trouver un logiciel qui enlève les espaces en « trop » et qui gère les retours à la ligne des PDF…
    C’est dommage !

  8. jingle

    20 novembre 2011 at 13 h 08 min

    c’est trop facile finalement, ouvrez le pdf online, esseyez de l’inprimer avec chrome ie online aussi, vous aurez un aperçu et c’est possible de copier le texte
    bon vent

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Dernières news

Les bons plans

Les tests