Créer un PDF avec des images JPG

Hier, j’ai reçu mon magazine Imagine du réseau des ingénieurs du Québec et il y avait un petit papier disant que les prochaines parutions seront électroniques seulement à moins de spécifier que je désire recevoir la version papier. Cette version électronique peut être vue sur le iPad ou autre. Par contre, il n’y a pas de fichier à télécharger! Il faut absolument aller sur le site web. Cela veut dire qu’il n’est pas possible de le lire dans le métro hors des ondes cellulaires. C’est pourquoi j’ai tenté de trouver comment facilement obtenir ce magazine dans un format facile à utiliser avec un e-book.

Pour ce faire, je suis allé sur leur site principal http://www.reseauiq.qc.ca/fr/imagine.html et j’ai cliqué sur le numéro 11 d’automne. Cela m’a amené sur http://www.vdocshop.com/doc/imagine1/imagine—automne-2011/2011090101/#0. À partir de cette page, je peux voir leur logiciel s’ouvrir. Puis, avec Google Chrome dans le panneau pour les développeurs, l’onglet « Ressources » montre que les pages sont en JPG comme la première ici: http://cdn-as3.myvirtualpaper.com/i/imagine1/imagine—automne-2011/2011090101/zoom/page1_v1.jpg et la dernière là: http://cdn-as3.myvirtualpaper.com/i/imagine1/imagine—automne-2011/2011090101/zoom/page68_v1.jpg.

Les étapes étaient donc très simples: télécharger les pages en format JPG avec « wget » et les convertir avec PDF avec ImageMagick.

Le téléchargement avec « wget » se fait avec des lignes de commandes comme:

Ensuite, la conversion se fait avec:
  • convert -compress jpeg page1_v1.jpg page2_v1.jpg page3_v1.jpg magazine.pdf
J’ai tout mis cela dans un script Perl grab_imagine.pl. Il suffit d’écrire
  • ./grab_imagine.pl (Url de la page où vous voyez l’application avec le magazine)
  • ./grab_imagine.pl http://www.vdocshop.com/doc/imagine1/imagine—automne-2011/2011090101/#0
Et cela va obtenir toutes les pages tant qu’il y en a et ensuite convertir le tout en PDF.