Passer au contenu

PDFTextOnline, pour extraire facilement le texte d’un document PDF

Il n’est pas toujours très aisé (et même parfois impossible) de récupérer le texte inclus dans un fichier au format PDF. PDFTextOnline apporte une solution gratuite,…

Il n’est pas toujours très aisé (et même parfois impossible) de récupérer le texte inclus dans un fichier au format PDF.
PDFTextOnline apporte une solution gratuite, immédiate, et ne nécessitant pas d’installation de logiciel puisqu’il s’agit d’un webware (service en ligne) comme on les aime, sauf si on est très à cheval sur la confidentialité de ses données bien sûr.

PDF Text Online

Avec PDFTextOnline, il vous suffit de sélectionner un document PDF sur votre disque dur, et celui-ci s’affiche au format texte dans une interface en Ajax très simple. Vous pouvez même choisir votre mise en forme (visuelle ou sémantique), les bookmarks si le document en contient, et la police de caractère de sortie, et vous récupérez l’intégralité du texte  dans un fichier au format .txt lui-même contenu dans un dossier zippé.

Le service ne requiert même pas d’inscription, mais vous demander d’accepter pour chaque nouveau document ses conditions générales d’utilisation, dont le premier alinéa indique laconiquement mais clairement “Any PDF document you upload will be stored, retained, and possibly reviewed by SNOWTIDE for quality control purposes only” (tout document téléchargé sera stocké, conservé et possiblement vérifié par Snowtide pour des raisons de contrôle de qualité).

Pratique et efficace, mais à réserver en dépannage pour les documents non sensibles, donc.

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

Opera One - Navigateur web boosté à l’IA
Opera One - Navigateur web boosté à l’IA
Par : Opera
8 commentaires
8 commentaires
  1. L’idée est bonne, après, comme tu le dis, il faut se méfier de se que l’on envoie vers le serveur…
    Dommage que l’interface soit un peu austère…

  2. Bonjour,
    pour ceux qui ne veulent pas utiliser un document en ligne, il existe un petit outil fort pratique qui extrait le texte et les images d’un fichier pdf, avec possibilité de sélectionner aussi la/les pages à extraire :

    http://www.foolabs.com/xpdf/

    Le tout en mode console (pas d’interface graphique)

    Bonne journée
    Emilio

    PS : il s’agit en fait d’un sous-ensemble d’un visualisateur de documents pdf sous X Window

  3. Arf, j’ai essayé avec FF 3 et Opéra, et après avoir cliqué sur “select PDF document” rien ne se passe alors que j’imagine qu’une boîte de dialogue devrait s’ouvrir pour uploader le fichier quoi. :/

  4. Je me permet de signaler également puisqu’on parle de PDF que acrobat reader propose un service en ligne de création et de stockage de documents PDF(5go d’espace) le service en est encore en béta j’ai tester sur mon blog l’affiage de document PDF et sa fonctionne plutôt bien avec possibilité pour les lecteurs de télécharger le PDF.Voila Eric si ta l’occasion de tester ce service proposé par acrobat fait nous part de ton avis.

  5. Le résultat est un fichier texte à retravailler car les sauts de page ne sont pas respectés (même en Utf-8) Pas terrible.

  6. c’est trop facile finalement, ouvrez le pdf online, esseyez de l’inprimer avec chrome ie online aussi, vous aurez un aperçu et c’est possible de copier le texte
    bon vent

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *