Images et graphiques pour le web: L'image vectorielle et le format PDF
Un peu d'histoire
Le format PDF naît en 1991 d'une idée de J. Warnock (l'un des
fondateurs de l'éditeur informatique Adobe) : créer un format
permettant de faire circuler dans l'entreprise des documents numérisés
(comportant du texte et des images) consultables quelle que soit la plate-forme
(ordinateur plus système d'exploitation) utilisée, en préservant
la mise en forme, les polices de caractères, les couleurs et les graphiques
du document source. Pour atteindre ce but, Adobe dispose de deux atouts :
- le langage de description de document PostScript, déjà développé sur plusieurs plates-formes ;
- le logiciel de dessin Illustrator, pour la mise au point duquel l'éditeur
a acquis de l'expérience en matière d'image vectorielle.
A partir de ces bases, la mise au point du nouveau format (PDF), ainsi que
celle du logiciel associé (Acrobat), dure environ deux ans. Le format
est présenté au public au Comdex de l'automne 1992, et la première
version du logiciel permettant de créer des documents au format PDF
(Acrobat) est mise sur le marché en juin 1993.
Pendant trois années environ, le succès n'est pas au rendez-vous.
D'abord, Adobe fixe un prix trop élevé pour Acrobat, et le lecteur
lui-même (Acrobat Reader) n'est pas gratuit, ce qui constitue une grosse
maladresse. Ensuite, le produit vise un public trop large : malgré les
beaux discours traitant du bureau sans papier, il est difficile au début
des années 1990 de faire circuler l'information sous forme dématérialisée dans l'entreprise. A cette époque en effet, on ne trouve pas un ordinateur sur chaque bureau, les réseaux locaux ne pénètrent pas partout dans l'entreprise, et l'Intranet n'est pas encore né. Il en résulte que Warnock a bien du mal à persuader les administrateurs d'Adobe de ne pas abandonner le projet, dont la rentabilité ne paraît pas assurée.
La version 2 d'Acrobat est publiée en septembre 1994, avec la version
1.1 du format PDF. Ce dernier bénéficie de plusieurs améliorations
: possibilité de créer des liens hypertextes, d'utiliser plusieurs
espaces de couleur et d'ajouter des notes. Mais le principal client du format
reste.. la société Adobe elle-même, où toute l'information
circule au format maison.
La version 3 d'Acrobat est publiée en 1996, avec la version 1.2 de
PDF. Cette fois, Adobe cible deux segments précis du marché :
le prépresse et Internet. Dans le prépresse, Adobe vise à long
terme le remplacement de PostScript par PDF. Pour ce faire, il dote PDF des
attributs nécessaires (compatibilité serveur OPI, espace de couleur
CMJN, prise en compte des demi-tons, etc.). Le monde des industries graphiques
s'intéresse peu à peu au nouveau format, qui commence à être
utilisé pour l'impression en noir et blanc. L'éditeur joue également
la carte Internet, car la toile se développe rapidement. Il semble même
qu'Adobe ait espéré que le format PDF supplanterait le format
HTML pour la diffusion de l'information sur le web. On sait aujourd'hui qu'il
n'en sera rien, et nous verrons pourquoi au paragraphe suivant.
La version 4 d'Acrobat est publiée en avril 1999, accompagnée
de la version 1.3 de PDF. Désormais, Adobe perfectionne le logiciel
pour son usage dans le prépresse principalement. La version 5 est publiée
en mai 2001, accompagnée de la version 1.4 de PDF, et la version 6 en
avril 2033, accompagnée de la version 1.5 de PDF.
Désormais, tout ce qui tourne autour de PDF représente plus
du tiers des revenus d'Adobe. Dans les industries graphiques, PDF supplante
peu à peu PostScript. Dans les entreprises, on utilise de plus en plus
PDF pour dématérialiser et faire circuler les documents. Quant
aux formats rivaux apparus au début des années 90, ils ont complètement disparu. Après douze ans, J. Warnock peut se dire que son idée initiale était juste, même s'il est parti à la retraite
entre temps.
Le format PDF sur le web
Pour le web, le format PDF présente trois avantages importants :
- Le coût. Rien de plus aisé -- et donc de moins coûteux -- que de créer un fichier PDF à partir d'un document numérique issu d'un traitement de texte, d'un tableur ou d'un logiciel de dessin ;
- L'imprimabilité. Une page PDF s'imprime généralement sans
problème, alors qu'on ne peut pas en dire autant de toutes les pages
HTML. Le format PDF est donc préférable au format HTML chaque
fois qu'un document est destiné à être imprimé avant
d'être consulté, ou si le respect de la présentation initiale
est impératif (formulaire administratif par exemple) ;
- La visibilité sur le web. Les principaux moteurs de recherche indexent
les pages publiées au format PDF (alors qu'ils n'indexent pas les pages
flashées).
Mais le format PDF n'est pas sans inconvénients :
- Le poids du fichier. A contenu égal, une page PDF pèse plus
lourd qu'une page HTML, et la différence peut être importante
;
- L'ergonomie. A l'origine, le format PDF n'a pas été conçu
pour le web -- il a été adapté au web après coup
-- si bien que son ergonomie n'est pas celle du web. L'internaute est habitué à consulter un document d'un seul tenant, et non divisé en pages (avec un saut brutal d'une page à l'autre si l'on utilise la barre de défilement verticale
au lieu de la main et des flèches). La présentation des pages
PDF est celle de l'imprimé, pas celle du web ; le texte en colonnes,
par exemple, ne convient pas à la consultation à l'écran.
Même remarque en ce qui concerne les polices de caractères, etc.
Il en résulte que la majorité des internautes trouve les pages
HTML plus agréables à consulter à l'écran que les
pages PDF. En matière d'audience, il est donc préférable
d'utiliser le HTML plutôt que le PDF ;
- L'éditabilité. Rien de plus facile à modifier qu'une page
web dans un éditeur ad hoc -- à tel point que les humoristes
disent qu'une page web est toujours en travaux. Dans une page au format PDF
par contre, on ne peut faire que des modifications mineures. Si une page est
susceptible d'être mise à jour, le format PDF ne lui convient
pas ;
- L'hypertexte. On peut créer un lien hypertexte vers un document PDF,
mais quand le document comporte plusieurs pages, il n'est pas possible de préciser à laquelle
s'applique le lien ;
- Le plug-in Acrobat Reader. Selon l'éditeur Adobe, ce plug-in a été déchargé 500
millions de fois, ce qui constitue probablement un record mondial. Et comme
il existe sur notre planète environ 600 millions de micros en fonctionnement,
nous sommes tentés d'en conclure que presque tout le monde peut lire
du PDF ou presque. C'est aller un peu vite en besogne, car les 500 millions
de téléchargement précités concernent 5 versions
distinctes d'Acrobat Reader, et que certains internautes ont certainement utilisé plusieurs versions successivement. Un document au format PDF n'est donc pas visible par
la totalité des internautes.
Enfin, le format PDF est arrivé sur le web alors que le format HTML était
déjà bien implanté. Il est toujours difficile de refouler
hors du marché un concurrent bien établi.
Avec leurs avantages et leurs inconvénients, les deux formats HTML
et PDF coexistent sur le web. Pour nous faire une idée de leurs importances
respectives, nous avons utilisé le moteur de recherche Google avec les
mots-clés (en langue anglaise) rassemblés dans le tableau 1 ci-dessous.
Pour compter les pages au format PDF nous avons rajouté l'expression "filetype:pdf" (sans les guillemets) au mot-clé.
| Tableau 1 |
| Mot-clé |
Réponses (Total) |
Réponses (PDF) |
% PDF |
| Web |
276 000 000 |
3 170 000 |
1,15 |
| Health |
121 000 000 |
3 180 000 |
2,63 |
| Book |
109 000 000 |
3 390 000 |
3,11 |
| Computer |
98 300 000 |
3 560 000 |
3,62 |
| Movie |
95 600 000 |
859 000 |
0,90 |
| Shopping |
95 000 000 |
1 430 000 |
1,50 |
| Travel |
88 500 000 |
3 390 000 |
3,83 |
| Media |
76 400 000 |
3 000 000 |
3,93 |
| Science |
61 700 000 |
2 270 000 |
3,68 |
| Food |
55 700 000 |
3 000 000 |
5,39 |
| Sport |
49 800 000 |
2 260 000 |
4,54 |
| Bdsm |
14 300 000 |
466 |
0,00 |
Mettre une page sur le web est une chose, et faire en sorte qu'elle soit visitée
en est une autre. Si les pages PDF représentent quelques pourcents de
toutes les pages du web (comme semble l'indiquer le tableau 1 ci-dessus), le
trafic qu'elles engendrent n'est pas en proportion, tant s'en faut. Pour le
vérifier, nous avons pris comme point de départ une liste "top
50" qui n'avait pas l'air trop minable, et nous sommes partis surfer sur
le web en tâchant de toucher un peu à tous les sujets. L'expérience
(résumée dans le tableau 2 ci-dessous) révèle qu'il
faut vraiment s'enfoncer très profondément dans un site pour
avoir une chance de rencontrer un page au format PDF.
| Tableau 2 |
| Extension |
Type de fichier |
Nombre |
| .gif |
images GIF |
1844 |
| .jpg |
images JPEG |
1190 |
| .htm, html |
pages HTML |
341 |
| .js |
scripts javascript externes |
47 |
| .css |
feuilles de style externes |
36 |
| .php, .php3 |
fichiers PHP (HTML) |
30 |
| .swf |
animations flash |
26 |
| .png |
images PNG |
11 |
| - |
r?ponses de moteurs |
9 |
| |
fichiers son |
8 |
| .bmp |
images bitmap |
6 |
| .class |
applets |
4 |
| .txt |
fichiers texte |
3 |
| .asp |
fichier ASP (HTML) |
1 |
| .pdf |
fichier PDF |
1 |
| .xml |
fichier XML |
1 |
Tous les webmestres qui ont fait l'expérience le savent : à contenu égal, une page au format PDF est beaucoup moins consultée qu'une page au format HTML. J. Nielsen a eu des mots très durs à ce sujet. C'est pourquoi
:
- on ne rencontre pas de site dont la page d'accueil soit au format PDF.
Même
remarque en ce qui concerne les pages de niveau élevé, celles
que l'on atteint assez directement depuis la page d'accueil. Inversement, on
ne rencontre pas sur le web de document PDF contenant une barre de navigation
vers le reste du site. Les pages PDF ne sont pas vraiment intégrées
aux sites qui les contiennent, elles sont traitées comme des compléments
;
- les sites de commerce électronique, et d'une manière générale tous les sites qui vendent quelque chose sur Internet, ne se servent pratiquement pas du format PDF. L'exemple le plus frappant est celui des sites pornographiques, qui usent de tous les moyens possibles et imaginables pour attirer l'internaute, et n'utilisent pas le format PDF. Le dernier mot-clé du tableau 1, qui
est issu du vocabulaire de la sexualité, illustre cette situation (même
si tous les sites auxquels il conduit ne sont heureusement pas de nature
pornographique) ;
- les logiciels de gestion de contenu, qui génèrent des pages web à partir de données numérisées, créent des fichiers ASP,
PHP, etc. lesquels utilisent tous le format HTML ;
- pour bon nombre des pages PDF qu'il indexe, le moteur de recherche Google
propose à l'internaute
une version HTML de contenu équivalent (mais la mise en page du document
original est perdue), etc.
Il est bien clair que les pages au format HTML et celles au format PDF ne
jouent généralement pas le même rôle sur le web, si bien
que les deux formats sont plus complémentaires que concurrents. Sur
la toile, le format PDF est essentiellement utilisé dans les deux
cas suivants :
- le document est destiné à être imprimé avant d'être consulté. C'est le cas des notices techniques, des formulaires devant être remplis manuellement, des documents à la lecture laborieuse nécessitant l'usage du crayon et/ou du marqueur, etc.
- le document est d'un intérêt secondaire, si bien que sa diffusion ne vaut pas le coût d'un montage HTML. Les webmestres sérieux
optimisent le rapport audience/coût lorsqu'ils mettent en ligne un document.
La création d'une page PDF à partir d'un document numérisé étant très rapide -- et donc peu coûteuse -- pourquoi se priver ?
C'est toujours mieux que rien !
En résumé : pour toucher le plus grand nombre possible d'internautes, il faut se fatiguer à créer une page HTML ; pour faire vite,
pas cher et facilement imprimable, mieux vaut créer une page PDF, en
acceptant d'être moins consulté. L'audience a un coût.
Remarque : le format PDF convient bien aux intranets, sur lesquels le poids
des fichiers ne compte guère (comparé à Internet, un intranet
est un très gros tuyau), et où l'indépendance vis à vis
de la plate-forme est importante (sur un même réseau local, on
trouve souvent des Macs et des PC, parfois même des postes Unix).
Le format PDF et l'image vectorielle
PDF ne constitue pas un format d'image reconnu comme tel par les navigateurs.
On peut cependant songer à l'utiliser pour afficher une image dans
une fenêtre séparée quand besoin est (figure agrandie
obtenue en cliquant sur une vignette, par exemple).
Il existe plusieurs voies de communication entre le logiciel Acrobat et les
logiciels de dessin :
- dans Acrobat, la fonction "Ouvrir au format PDF..." permet d'importer
une image possédant l'une des extensions suivantes : BMP, GIF, JPEG,
PCX, PNG et TIFF. La fonction "Ouvrir..." possède une option "Tous
les fichiers (*.*)" que l'on peut toujours essayer ;
- l'installation d'Acrobat sur un poste de travail crée une imprimante
virtuelle appelée "Acrobat Distiller". Cette imprimante est
visible à travers la fonction "Imprimer..." de tous les logiciels
de dessin présents sur le poste de travail. Son usage crée un
fichier PDF contenant l'image dont on a demandé l'impression. Par exemple,
le système d'exploitation Windows XP possède un "Assistant
Impression de photographies" qui permet d'atteindre Acrobat Distiller
en utilisant les dimensions habituelles du tirage des photos. Il est rare
qu'on ne soit pas en mesure d'enregistrer une image au format PDF ;
- en dernier ressort, on peut tenter sa chance via un copier-coller.
Acrobat enregistre les images matricielles au format JPEG, en donnant à l'opérateur le choix entre cinq qualités. A titre d'exemple, nous avons enregistré dans Acrobat, en qualité moyenne, l'image de la boîte de dialogue représentée ci-dessous, dont le fichier natif (format PNG-24, compression non dégradante) pèse 4310 octets. En cliquant sur l'image, on obtient l'ouverture de la même image au format PDF dans une fenêtre séparée. Le fichier correspondant pèse 7091 octets, minimum de ce que l'on peut obtenir dans le format PDF en utilisant toutes les options par défaut.
En utilisant le zoom d'Acrobat Reader, on observe les défauts caractéristiques du format JPEG autour du texte et des contours. Ainsi, en utilisant le format PDF pour enregistrer une image matricielle, nous sommes perdants à la
fois sur le poids du fichier et sur la qualité de l'image.
 |
|
| Image PNG-24 (4310 octets) |
Mais le format PDF offre au web une possibilité dont on parle -- et
que l'on utilise -- à peine, celle de transmettre les images vectorielles
sans les pixelliser. En effet, dans un document PDF, une telle image est enregistrée dans le format vectoriel propre à PDF, dérivé de celui du logiciel Illustrator. L'internaute peut alors modifier la taille de l'image
qu'il reçoit sans en dégrader la qualité, que ce soit
pour l'imprimer ou pour l'examiner à loisir.
Nous avons testé cette possibilité sur le dessin au trait représenté ci-dessous. Ce graphe a été dessiné dans Illustrator (version 9), puis "imprimé" à l'aide d'Acrobat Distiller (version 5), avec l'option de conversion "Écran" qui convient au web.
La page PDF résultante (qui est consultable dans une fenêtre séparée) pèse 8017 octets.
 |
|
GIF : 1443 octets (PDF : 8017 octets) |
Comme on peut le constater en utilisant le zoom d'Acrobat Reader, l'image
garde toute sa qualité quand on fait varier sa taille. Cette propriété peut présenter de l'intérêt pour l'internaute qui veut étudier l'image dans le détail. Il peut aussi l'imprimer en format pleine page, à condition d'utiliser l'option "Ajuster au format du papier" de la rubrique "Mise à l'échelle" (Acrobat Reader version 6.0). Mais, comme nous l'avons vu au chapitre 6, nous pouvons obtenir le même résultat avec le format SWF en bénéficiant d'un poids de fichier moindre (2593 octets pour la même image). La question se pose alors de savoir si le plug-in Acrobat Reader est plus répandu chez les internautes que le plug-in Flash Player...
Conclusion
Le format PDF n'est pas destiné à remplacer le format HTML sur
le web. Il est utile comme format de complément, permettant de mettre
en ligne rapidement et à moindre coût des documents dont l'intérêt n'est pas primordial, ou dont il faut absolument conserver la présentation (mise en page, polices de caractères, couleurs).
Le format PDF permet également de mettre en ligne des images vectorielles,
mais le poids des fichiers correspondants est nettement plus élevé que
celui résultant de l'utilisation du format SWF (Flash).
| |
|