Passer au contenu

Compiler efficacement des pages web sous forme de documents PDF à lire sur tablette

Il arrive parfois que dans notre veille nous ayons besoin, à l’occasion d’un évènement particulier (conférence…), de compiler rapidement de nombreuses informations variées sur un sujet…

Il arrive parfois que dans notre veille nous ayons besoin, à l’occasion d’un évènement particulier (conférence…), de compiler rapidement de nombreuses informations variées sur un sujet donné, en provenance de plusieurs sources web, pour une lecture ultérieure.

Il existe évidemment de nombreux moyens de le faire, le plus simple et le moins écologique consistant à imprimer des pages et à les emporter avec soi pour les lire et les annoter pendant un trajet en métro, en train, en avion ou – si vous êtes riche et important ou ministre – confortablement calé à l’arrière de votre limousine avec chauffeur.

Mais quand on est un peu geek, qu’on a fait le pari du zéro papier, que l’on a envie d’amortir le 499 euros investis dans son iPad et qu’en même temps la petite voix de la raison environnementale qui résonne en nous nous fait hésiter à faire tourner l’imprimante, il existe d’autres solutions, pratiques, simples et gratuites pour lire du contenu web hors ligne, quand on ne dispose pas d’un accès à internet (en avion par exemple).

Voici celle que j’utilise, qui fait appel à trois logiciels sur mon PC et/ou deux applications sur mon iPad (ou mon iPhone), et voici comment je m’y prends.

1. Sélection des sources

Mettons que je me rende demain à une conférence sur l’avenir du futur des tablettes, et que je souhaite avoir les dernières informations en vue de participer à ce panel avec quelques arguments. Je vais donc identifier quelques-uns des derniers articles parus sur le web sur la question. Comme on n’est jamais si bien servi que par soi-même, je vais donc commencer par une sélection de mes derniers billets sur les tablettes. Ce qui va donner par exemple :

C’est un exemple, généralement quand je compile des informations sur un sujet, c’est plutôt entre 20 et 30 liens ou pages que je sélectionne. Maintenant, voyons ce que je fais avec ces sources.

2. Mise en forme des sources

Je rappelle que je veux donc mettre ces sources de côté afin de les lire hors ligne plus tard à tête reposée dans de bonnes conditions de confort, comme si je les imprimais, mais sans les imprimer. Or l’on sait que l’impression d’une page web n’est jamais facile ni très favorable à la lecture du fait de la structure même de celle-ci mais également des nombreux éléments qui deviennent inutiles et indésirables en format “papier” (menus, boutons, pubs, etc…).


La page web standard d’origine

C’est là qu’intervient ma première application magique, qui est en fait un bookmarklet ou une extension à installer dans son navigateur : Readbility. Cette extension transforme toute page web, même la plus chargée en un rêve de lecteur en supprimant tous les éléments inutiles et nuisibles à la lecture et en ne gardant que l’essentiel : le texte. Texte que vous pouvez en outre mettre en forme à votre convenance. Bref, Readability transforme une page web en page de livre (le site propose des options payantes sur abonnement). Reste à convertir le résultat en eBook afin de le lire sur iPad, ou autre tablette ou smartphone. C’est ce que nous allons voir maintenant.

La même page traitée par Readability

3. Transfert ou synchronisation des sources sur l’iPad

Nous avons maintenant notre belle page au format “eBook”. Il reste à la transférer sur l’iPad pour une lecture ultérieure offline (hors connexion). Pour cela, si nous souhaitons continuer à utiliser des solutions simples et gratuites, rien de tel que de convertir la page au format PDF. Pour ceci j’utilise PDFCreator, une application gratuite sous Windows qui s’installe comme une imprimante, ce qui évite d’avoir à faire plusieurs manipulations puisqu’il suffit de faire “Imprimer…” et votre page web devient un joli fichier PDF. Attention cependant : PDFCreator est horriblement gourmand en ressources (en tout cas sur ma machine, qu’il met à genoux à chaque lancement). Vous l’avez compris, une fois que vous avez converti toutes les pages souhaitées (créez un dossier sur votre bureau pour vous y retrouver plus facilement), il ne vous reste plus qu’à les transférer sur votre iPad via iTunes. Mais avant il reste une petite intervention à effectuer.

4. Lecture des pages

Si vous avez compilé une vingtaine de pages, l’idéal est de les réunir dans un seul document. PDFCreator permet cela. Une fois la manipulation- simple – faite, vous synchronisez le document PDF créé avec votre iPad en le faisant glisser dans “Livres” et le tour est joué : vous avez votre eBook sur mesure rien que pour vous que vous allez pouvoir lire tranquillement n’importe-où. Il ne vous reste plus alors qu’à lancer iBooks sur votre iPad et à vous la lecture dans des conditions d’ergonomie optimales.

Il existe une alternative, qui peut paraître plus simple : utiliser un service comme Evernote ou Read It Later dans leur version gratuite. Je les utilise aussi. Ces services offrent de nombreuses possibilités de compilation, de stockage dans le nuage et de synchronisation entre plusieurs terminaux, mais vous devrez être certain d’avoir une connexion pour récupérer les documents que vous avez mis de côté sinon vous ne pourrez rien en faire. Ma solution offre l’avantage d’être vraiment “web proof” et de pouvoir aussi être appliquée avec une vraie liseuse d’eBook compatible PDF de type Kindle par exemple.

La solution que j’utilise et décris ici demande un peu de temps (si peu en fait) mais je pense que c’est un bon investissement en regard de la qualité obtenue et du service que l’on se rend à soi-même.

Elle est pas belle la vie du veilleur lecteur numérique ?

📍 Pour ne manquer aucune actualité de Presse-citron, suivez-nous sur Google Actualités et WhatsApp.

35 commentaires
35 commentaires
  1. pour lire sur iPad (et sur d’autres tablettes), je préférerais le format epub (donc directement à la sortie de readability), qui est lisible dans iBooks entre autres et qui est plus adapté et surtout plus adaptable que le PDF, qui lui, est figé.

  2. je viens de tester le bookmarklet sous Chrome et je n’ai pas réussi à l’enregistrer dans un format utilisable dans iBooks :-/ si quelqu’un sait comment créer un epub depuis Readability je suis preneur 🙂

  3. À l’inverse de ragmaxone, je préfère le PDF qui respecte la mise en page, la (et même, les…) typo(s), les ligatures, les approches et même des choses inutiles comme les fines, les variantes OpenType (Caption, Display et compagnie).
    Et même, c’est fou, ne limite pas une typo à romain, italique, gras et gris-italique…
    Vive le figé foisonnant à l’adaptable “rikiki”…!

  4. l’avantage indéniable de l’adaptable (et c’est là toute sa force) c’est qu’il reste lisible sur tous les écrans, 3, 7 ou 10″. le PDF est illisible sur un écran 3,5″. le format epub ne limite pas à une seule police.

  5. Calibre fait tout ça automatiquement; Récupération des flux, mise en page et transfert vers la tablette dans le format de son choix (pdf, ePub…). Avec la possibilité de le faire tous les jours avant de partir bosser si on le désire.

  6. Sur un site bien fait avec une CSS print optimisée (qui masque les menus inutiles etc), il suffirait simplement de lancer une impression et de choisir l’imprimante PDF qui va bien pour générer automatiquement un PDF adapté non ?

  7. @Eric : Une fois transformé en ePub, met tes fichiers dans Dropbox. Comme ça, tu les as sur tous tes outils. Avec ton iPad, ouvre Dropbox, ouvre ton document et il te sera proposé de l’importer directement dans iBooks. C’est ce que fais avec mes PDF.

  8. pour alléger le tout, c’est pas mal du tout. si l’on veut générer un pdf fidèle à ce qui s’affiche, il y a l’extension firefox http://pdfcrowd.com/save-as-pdf-addon/

    il y a pas mal de préférences disponible qui sont intéressantes, et surtout, il génère directement le pdf sans passer pas une étape tierce, ce qui est un gain de temps.

  9. Bonjour, il existe aussi la solution “Print what you like” (http://www.printwhatyoulike.com/home/index3) qui permet de sélectionner directement dans la page internet les zones à conserver et celles à supprimer (les boutons, pubs et autres informations superflues).
    Pour les utilisateurs sous Mac OSX, Aperçu permet (par un simple glisser/déposer) de fusionner des PDFs en ajoutant les pages les unes à la suite des autres.

    Personnellement j’utilise alternativement Readbility et Print what you like qui sont, je trouve, des solutions complémentaires.

    Bien cordialement,

  10. En même temps, Readibility n’est pas toujours nécessaire, quand l’auteur de ta source a pris la peine de prévoir un media print dans sa CSS, ce qui se fait de plus en plus maintenant, et ne ferait pas de mal à Presse-Citron… :-p Dans ces cas-là, une simple impression en PDF depuis le navigateur est déjà correcte (avec PDFCreator ou autre…).

  11. Bonjour. Comme imprimante virtuelle, PDF Creator m’a toujours planté à un moment ou à un autre. Par-contre, jamais aucun souci avec Bullzip PDF Printer.
    Je l’utilise en parallèle avec le service en ligne PDFmyurl, très fiable, sous forme de bookmarklet dans la barre des favoris, qu’on peut associer avec PDFjoin pour réunir plusieurs PDF en un seul. Pratique si on n’est pas sur son PC, d’autant qu’une imprimante virtuelle reste lourd comme logiciel.
    Sinon, il y a toujours la solution copier/coller dans Google Doc, faire une mise en page rapide, et télécharger en PDF.

  12. @Eric (DM) Puis-je rebondir sur ces échanges en tant que Joliprint pour annoncer en avant première notre service “joliprint by mail” ?

    Conscient que c’est un peu du communiqué déguisé, que tu as fermé il y a quelques jours, je préfère te demander avant ;o) (En même temps c’est tout à fait dans le contexte du post et des commentaires)

    Let me know …

  13. Pour ma part (ce qui suit n’engage que moi)… j’utilise DropBox (Eric, vous avez une option de 2 Go de stockage qui vous est proposée gratuitement) et d’autres emplacements sur lesquels j’entrepose mes PDF.
    Du coup, quand je suis sur mon iPad (vous avez raison de noter que c’est une expérience qu’il faut faire avant de juger), je télécharge via GoodReader les PDF que je souhaite consulter (et qui peuvent également se situer sur mes propres FTP ou sur MobileMe). À la fin de la lecture, poubelle (les originaux, eux, sont toujours en place).

    J’ajoute que j’utilise également JoliPrint qui fonctionne très bien sur mon site pour lire en différé des médias qui m’intéressent…
    Voilà Eric. Bonne soirée.

  14. Je suis surpris, personne n’a mentionné Instapaper… Je pense qu’Instapaper sauve plusieurs clicks par rapport à la solution proposée ici. Instapaper va faire la même chose que Readability, mais propose une version offline. Assez génial avec l’iPad, puisque ces pages sauvées sont dispos, et en plus, Instapaper retient quelles pages sont lues en offline pour re-synchroniser les pages une fois online à nouveau..

  15. je viens de trouver service très intéressant (à priori) : dotEPUB.com
    ça permet de convertir les articles au format EPUB depuis un bookmarlet par exemple (ça marche très bien dans iOS, on peut ouvrir le livre dans iBooks)

    seul inconvénient : apparemment il supprime les images 🙁
    je vais tester plus en profondeur 🙂 mais si y’a pas les images ça craint 🙁

  16. Personnellement comme il l’a été dis un peu plus , je trouve que le format epub est peut être un peu plus adapté, apres faut maîtrisér les subtilités de calibre qui n’est pas user friendly pour ne pas qu’il y de problemes dans la structure

  17. Donc les écrivains peuvent se réjouir : le livre numérique avance ! Et les écrivains qui sauront le proposer à un tarif décent (selon moi, 5 euros) parviendront à vivre le virage du web ? C’est un espoir, ce livre numérique, pour les écrivains…

  18. @h, c’est complique quand on peut “keep it simple” avec une selection de source blog wordpress et un plugin wordpress adapte, on est bien servi quand meme.

    Je m’explique, j’ai developpe un plugin qui permet de convertir immediatement (sans aucune attente) vos articles de blog en PDF. Ainsi que la mise en page voulue avec meme des liens en interne pour surfer efficacement sur iPad et autres smartphone.

    AMHA, C’est beaucoup mieux d’avoir ce button “Version PDF sur presse citron” parce que j’aime bien lire aussi souvent que possible les news de @eric.

    hehehe
    Ami Calmant

  19. @Alain : Calibre le fait, mais j’ai déjà eu des soucis avec par exemple des encadrés de code source qui ne sont pas lisibles une fois transformé en epub.
    l’inconvénient majeur je dirais c’est qu’on ne peut pas créer les epub depuis iOS par exemple, ni depuis le navigateur (ça doit être faisable avec un script).
    pour l'”envoi” vers iOS (ou autre mobile), la synchronisation est trop lourde à mon goût, je préfère passer par un mail ou par DropBox.

  20. Je ne connaissais pas Readbility qui est super pratique même sans utiliser de tablettes ! Merci pour cette découverte qui va me faciliter la lecture de documents sur Internet 🙂

  21. Il y a aussi ces 4 autres outils que j’évoquais récemment pour nettoyer des pages web et les transformer en pdf :
    Readable
    Readabillity (donc)
    Instapaper
    Joliprint
    et iReader, un plugin Chrome proposé par un lecteur qui est de très bonne qualité.

  22. Maintenant qu’on a des tablettes, il nous faut des outils pour fabriquer notre contenu !
    Après se pose le problème des droits… car c’est tentant de communiquer ce contenu…

  23. [Disclaimer (habituel désormais ;o)) : je fais partie de l’équipe Joliprint !]

    Joliprintbymail est sorti !

    1/ Sélectionnez vos sources
    2/ Copiez les dans un mail (10 urls max pour l’instant)
    3/ Envoyez le mail à mypdf@joliprint.com
    4/ Recevez un joli PDF mis en page en réponse
    5/ Dégustez le dans iBooks

  24. Eric,

    Pour ma part j’utilise Instapaper qui m’offre la possibilité de télécharger alors toutes les pages web sauvegardées en ePub avec Index. Webproof aussi et à priori plus simple.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *