Images et graphiques pour le web: L'image vectorielle et le format PDF

Un peu d'histoire

Le format PDF naît en 1991 d'une idée de J. Warnock (l'un des fondateurs de l'éditeur informatique Adobe) : créer un format permettant de faire circuler dans l'entreprise des documents numérisés (comportant du texte et des images) consultables quelle que soit la plate-forme (ordinateur plus système d'exploitation) utilisée, en préservant la mise en forme, les polices de caractères, les couleurs et les graphiques du document source. Pour atteindre ce but, Adobe dispose de deux atouts :

A partir de ces bases, la mise au point du nouveau format (PDF), ainsi que celle du logiciel associé (Acrobat), dure environ deux ans. Le format est présenté au public au Comdex de l'automne 1992, et la première version du logiciel permettant de créer des documents au format PDF (Acrobat) est mise sur le marché en juin 1993.

Pendant trois années environ, le succès n'est pas au rendez-vous. D'abord, Adobe fixe un prix trop élevé pour Acrobat, et le lecteur lui-même (Acrobat Reader) n'est pas gratuit, ce qui constitue une grosse maladresse. Ensuite, le produit vise un public trop large : malgré les beaux discours traitant du bureau sans papier, il est difficile au début des années 1990 de faire circuler l'information sous forme dématérialisée dans l'entreprise. A cette époque en effet, on ne trouve pas un ordinateur sur chaque bureau, les réseaux locaux ne pénètrent pas partout dans l'entreprise, et l'Intranet n'est pas encore né. Il en résulte que Warnock a bien du mal à persuader les administrateurs d'Adobe de ne pas abandonner le projet, dont la rentabilité ne paraît pas assurée.

La version 2 d'Acrobat est publiée en septembre 1994, avec la version 1.1 du format PDF. Ce dernier bénéficie de plusieurs améliorations : possibilité de créer des liens hypertextes, d'utiliser plusieurs espaces de couleur et d'ajouter des notes. Mais le principal client du format reste.. la société Adobe elle-même, où toute l'information circule au format maison.

La version 3 d'Acrobat est publiée en 1996, avec la version 1.2 de PDF. Cette fois, Adobe cible deux segments précis du marché : le prépresse et Internet. Dans le prépresse, Adobe vise à long terme le remplacement de PostScript par PDF. Pour ce faire, il dote PDF des attributs nécessaires (compatibilité serveur OPI, espace de couleur CMJN, prise en compte des demi-tons, etc.). Le monde des industries graphiques s'intéresse peu à peu au nouveau format, qui commence à être utilisé pour l'impression en noir et blanc. L'éditeur joue également la carte Internet, car la toile se développe rapidement. Il semble même qu'Adobe ait espéré que le format PDF supplanterait le format HTML pour la diffusion de l'information sur le web. On sait aujourd'hui qu'il n'en sera rien, et nous verrons pourquoi au paragraphe suivant.

La version 4 d'Acrobat est publiée en avril 1999, accompagnée de la version 1.3 de PDF. Désormais, Adobe perfectionne le logiciel pour son usage dans le prépresse principalement. La version 5 est publiée en mai 2001, accompagnée de la version 1.4 de PDF, et la version 6 en avril 2033, accompagnée de la version 1.5 de PDF.

Désormais, tout ce qui tourne autour de PDF représente plus du tiers des revenus d'Adobe. Dans les industries graphiques, PDF supplante peu à peu PostScript. Dans les entreprises, on utilise de plus en plus PDF pour dématérialiser et faire circuler les documents. Quant aux formats rivaux apparus au début des années 90, ils ont complètement disparu. Après douze ans, J. Warnock peut se dire que son idée initiale était juste, même s'il est parti à la retraite entre temps.

 

Le format PDF sur le web

Pour le web, le format PDF présente trois avantages importants :

Mais le format PDF n'est pas sans inconvénients :

Enfin, le format PDF est arrivé sur le web alors que le format HTML était déjà bien implanté. Il est toujours difficile de refouler hors du marché un concurrent bien établi.

Avec leurs avantages et leurs inconvénients, les deux formats HTML et PDF coexistent sur le web. Pour nous faire une idée de leurs importances respectives, nous avons utilisé le moteur de recherche Google avec les mots-clés (en langue anglaise) rassemblés dans le tableau 1 ci-dessous. Pour compter les pages au format PDF nous avons rajouté l'expression "filetype:pdf" (sans les guillemets) au mot-clé.

Tableau 1
Mot-clé Réponses (Total) Réponses (PDF) % PDF
Web 276 000 000    3 170 000 1,15
Health 121 000 000    3 180 000 2,63
Book 109 000 000    3 390 000 3,11
Computer 98 300 000 3 560 000 3,62
Movie 95 600 000    859 000 0,90
Shopping 95 000 000 1 430 000 1,50
Travel 88 500 000 3 390 000 3,83
Media 76 400 000 3 000 000 3,93
Science 61 700 000 2 270 000 3,68
Food 55 700 000 3 000 000 5,39
Sport 49 800 000 2 260 000 4,54
Bdsm 14 300 000           466 0,00

Mettre une page sur le web est une chose, et faire en sorte qu'elle soit visitée en est une autre. Si les pages PDF représentent quelques pourcents de toutes les pages du web (comme semble l'indiquer le tableau 1 ci-dessus), le trafic qu'elles engendrent n'est pas en proportion, tant s'en faut. Pour le vérifier, nous avons pris comme point de départ une liste "top 50" qui n'avait pas l'air trop minable, et nous sommes partis surfer sur le web en tâchant de toucher un peu à tous les sujets. L'expérience (résumée dans le tableau 2 ci-dessous) révèle qu'il faut vraiment s'enfoncer très profondément dans un site pour avoir une chance de rencontrer un page au format PDF.

Tableau 2
Extension Type de fichier Nombre
.gif images GIF 1844
.jpg images JPEG 1190
.htm, html pages HTML 341
.js scripts javascript externes 47
.css feuilles de style externes 36 
.php, .php3 fichiers PHP (HTML) 30
.swf animations flash 26
.png images PNG 11
- r?ponses de moteurs 9
  fichiers son 8
.bmp images bitmap 6
.class applets 4
.txt fichiers texte 3
.asp fichier ASP (HTML) 1
.pdf fichier PDF 1
.xml fichier XML 1

Tous les webmestres qui ont fait l'expérience le savent : à contenu égal, une page au format PDF est beaucoup moins consultée qu'une page au format HTML. J. Nielsen a eu des mots très durs à ce sujet. C'est pourquoi :

Il est bien clair que les pages au format HTML et celles au format PDF ne jouent généralement pas le même rôle sur le web, si bien que les deux formats sont plus complémentaires que concurrents. Sur la toile, le format PDF est essentiellement utilisé dans les deux cas suivants :

En résumé : pour toucher le plus grand nombre possible d'internautes, il faut se fatiguer à créer une page HTML ; pour faire vite, pas cher et facilement imprimable, mieux vaut créer une page PDF, en acceptant d'être moins consulté. L'audience a un coût.

Remarque : le format PDF convient bien aux intranets, sur lesquels le poids des fichiers ne compte guère (comparé à Internet, un intranet est un très gros tuyau), et où l'indépendance vis à vis de la plate-forme est importante (sur un même réseau local, on trouve souvent des Macs et des PC, parfois même des postes Unix).

 

Le format PDF et l'image vectorielle

PDF ne constitue pas un format d'image reconnu comme tel par les navigateurs. On peut cependant songer à l'utiliser pour afficher une image dans une fenêtre séparée quand besoin est (figure agrandie obtenue en cliquant sur une vignette, par exemple).

Il existe plusieurs voies de communication entre le logiciel Acrobat et les logiciels de dessin :

Acrobat enregistre les images matricielles au format JPEG, en donnant à l'opérateur le choix entre cinq qualités. A titre d'exemple, nous avons enregistré dans Acrobat, en qualité moyenne, l'image de la boîte de dialogue représentée ci-dessous, dont le fichier natif (format PNG-24, compression non dégradante) pèse 4310 octets. En cliquant sur l'image, on obtient l'ouverture de la même image au format PDF dans une fenêtre séparée. Le fichier correspondant pèse 7091 octets, minimum de ce que l'on peut obtenir dans le format PDF en utilisant toutes les options par défaut. En utilisant le zoom d'Acrobat Reader, on observe les défauts caractéristiques du format JPEG autour du texte et des contours. Ainsi, en utilisant le format PDF pour enregistrer une image matricielle, nous sommes perdants à la fois sur le poids du fichier et sur la qualité de l'image.

Boîte de dialogue
Image PNG-24 (4310 octets)

Mais le format PDF offre au web une possibilité dont on parle -- et que l'on utilise -- à peine, celle de transmettre les images vectorielles sans les pixelliser. En effet, dans un document PDF, une telle image est enregistrée dans le format vectoriel propre à PDF, dérivé de celui du logiciel Illustrator. L'internaute peut alors modifier la taille de l'image qu'il reçoit sans en dégrader la qualité, que ce soit pour l'imprimer ou pour l'examiner à loisir.

Nous avons testé cette possibilité sur le dessin au trait représenté ci-dessous. Ce graphe a été dessiné dans Illustrator (version 9), puis "imprimé" à l'aide d'Acrobat Distiller (version 5), avec l'option de conversion "Écran" qui convient au web. La page PDF résultante (qui est consultable dans une fenêtre séparée) pèse 8017 octets.

GIF : 1443 octets
(PDF : 8017 octets)

Comme on peut le constater en utilisant le zoom d'Acrobat Reader, l'image garde toute sa qualité quand on fait varier sa taille. Cette propriété peut présenter de l'intérêt pour l'internaute qui veut étudier l'image dans le détail. Il peut aussi l'imprimer en format pleine page, à condition d'utiliser l'option "Ajuster au format du papier" de la rubrique "Mise à l'échelle" (Acrobat Reader version 6.0). Mais, comme nous l'avons vu au chapitre 6, nous pouvons obtenir le même résultat avec le format SWF en bénéficiant d'un poids de fichier moindre (2593 octets pour la même image). La question se pose alors de savoir si le plug-in Acrobat Reader est plus répandu chez les internautes que le plug-in Flash Player...

 

Conclusion

Le format PDF n'est pas destiné à remplacer le format HTML sur le web. Il est utile comme format de complément, permettant de mettre en ligne rapidement et à moindre coût des documents dont l'intérêt n'est pas primordial, ou dont il faut absolument conserver la présentation (mise en page, polices de caractères, couleurs).

Le format PDF permet également de mettre en ligne des images vectorielles, mais le poids des fichiers correspondants est nettement plus élevé que celui résultant de l'utilisation du format SWF (Flash).