DE  |  FR  |  IT

PDF/A-2 contenant des images

Certains documents sauvegardés dans un format image ont cependant une fonction plutôt textuelle. On pensera notamment ici à des documents numérisés issus d'imprimés officiels ou d’ensembles de fiches en papier. Dans cette configuration, le choix du format d'archivage doit prendre en compte la nature particulière de ces documents. On trouvera donc ci-dessous des éléments d'évaluation relatifs aux choix du format PDF/A-2 dans ce cas de figure. Cette solution apporte deux avantages essentiels : mettre à disposition une séquence de pages de manière simple et compréhensible tout en utilisant un format d'archivage permettant également l'affichage.
Le format PDF/A-2 peut contenir des images sous plusieurs formes de codages et de compressions dont le potentiel en matière d'archivage doit être évalué. Pour le type de documents mentionnés, la possibilité d'une compression avec perte ne doit cependant pas être écartée pour les raisons suivantes :
  1. Toute numérisation – quelle que soit sa résolution – provoque une perte d'information. Par conséquent, son résultat ne peut être considéré comme un original. La compression avec perte du résultat doit donc être évaluée en tenant compte de cette limitation. (Pour une comparaison des écarts résultants d'une numérisation recourant à une compression modérée avec pertes, voir le rapport du colloque du CECO sur la compression des données images, audio et vidéo, https://kost-ceco.ch/cms/index.php?compression_fr).
  2. Les caractéristiques essentielles des imprimés officiels et des fiches sont le texte lui-même et sa disposition sur la page; un rendu en haute résolution n'est pas reconnu comme étant la règle.

Les propriétés techniques du PDF/A-2 sont décrites en détail dans le chapitre sur les données textuelles. Une comparaison plus détaillée avec les versions 1 et 3 du format PDF est également possible. La version 2 est particulièrement recommandée comme format d'archivage pour les images, car elle permet l'utilisation de la compression JPEG2000 qui est expressément recommandée.
On trouvera ici une brève évaluation du PDF/A-2 pour son utilisation comme format d’archivage pour les données graphiques.

Evaluation

Ouverture du format: 4
Le format PDF/A est une norme ISO.

Licence libre: 3
Ce critère est rempli pour le PDF/A-2; il faut toutefois veiller à n’utiliser aucune police sous licence, aucun algorithme de compression ou de chiffrement.

Diffusion: 4
Le PDF/A-2 s'est largement répandu au cours de ces dernières années dans le monde des archives publiques et d'entreprises. PDF/A-2 a entretemps remplacé en grande partie PDF/A-1 pour la production.

Fonctionnalités: 3
En principe, la fonctionnalité du PDF/A-2 en tant que format d'archivage pour les images dépend du format graphique encapsulé et des éventuels algorithmes de compression utilisés. Le PDF/A reproduit idéalement les caractéristique d'originaux basés sur des pages, comme les livres, les imprimés officiels ou les fiches. JPEG2000 est recommandé comme algorithme de compression.

Implémentation: 4
Il existe de nombreux outils permettant de créer des documents PDF/A-2. Les fichiers PDF/A-2 peuvent être lus au moyen de tous les lecteurs dédiés au format PDF (p. ex. Adobe Reader).

Densité de mémorisation: 3
PPDF/A-2 sert de conteneur pour divers formats graphiques et algorithmes de compressions. En principe, une compression avec ou sans pertes peut être acceptée pour l'archivage de documents textuels numérisés organisés page par page. La densité de mémorisation peut, en conséquence, être relativement élevée.

Vérifiabilité: 3
Les fichiers PDF/A-2 peuvent être reconnus avec un haut taux de succès par des logiciels de reconnaissance automatique de format. Il existe plusieurs validateurs pour ce format, KOST-Val étant le seul qui puisse valider en plus les images intégrées.

Bonnes pratiques: 3
Ce format souvent utilisé pour l’archivage et il est accepté par de nombreux services d'archives. Il n’a certes pas encore pris une importance significative dans le domaine de la photographie numérique, mais il est pionnier en matière de rétronumérisation

Perspectives: 3
Ce format a été conçu comme format d’archivage et son développement se poursuit dans cette direction.

Classe de formats: B
Ce format est en usage actuellement.

Conclusion
Le format PDF/A-2 est adapté à l'archivage d'images numériques. Nous le recommandons en particulier pour l'archivage de documents textuels numérisés sous la forme de pages, comme les imprimés officiels ou les fiches de catalogues de bibliothèques. Le PDF/A-2 permet l'utilisation de divers formats graphiques et d'algorithmes de compressions qui influent de manière importante sur les propriétés archivistiques. Ceux-ci doivent donc être choisis avec soin. L'utilisation de PDF/A-2 avec la compression JPEG2000 est recommandée.

Planification de la pérennisation

La méthode de compression JBIG2 autorisée dans le PDF/A sauvegarde une seule fois des symboles d’égale valeur et les utilise à plusieurs reprises dans tout le document. Ce procédé appelé pattern matching and subsititution (PMS) a pour conséquence, lors de certaines implémentations et configurations, de remplacer des signes par d’autres dans les textes. Comme l’erreur est irréversible et qu’il est impossible d’établir si le procédé PMS erroné a été utilisé ou pas, le CECO recommande de renoncer pour le moment à la compression JBIG2 lors de la création de fichiers PDF. Pour plus de détails, voir https://kost-ceco.ch/cms/index.php?jbig2-compression_fr.

Catalogue des formats de fichiers pour l'archivage version 6.2, décembre 2021