Logo der Koordinationsstelle
deutsch


Validateurs PDF/A

Comment se définit le PDF/A? Quelles difficultés sont à prendre en compte? Quels validateurs PDF/A courants existe-t-il? Quel est le degré de précision de ces validateurs PDF/A?

1. Introduction

Le format PDF/A est très répandu dans les archives et est un format d’archivage incontesté. Mais il se pose de plus en plus souvent la question de savoir quand un PDF/A est vraiment un PDF/A, quelles ressources permettent de le vérifier et pourquoi les validations ne peuvent pas donner des résultats stricts.
Ce récapitulatif des différents programmes de validation des fichiers PDF/A pourra servir d’aide aux archives à deux égards: premièrement, il montre quels validateurs existent pour la conversion de fichiers en PDF/A au stade actuel des connaissances; deuxièmement, il peut servir de base à une première évaluation par les différentes archives.

 

2. Définition du PDF/A

PDF/A est un format de document destiné à l’échange (Portable Document Format) et qui a été créé pour l’archivage à long terme. Ce format a été standardisé dans la norme «ISO-19005-1 - Document management – Electronic document file format for long-term preservation». Cette norme correspond à la version PDF 1.4. La norme ne fait qu’énumérer quelles fonctions des différentes versions de PDF sont obligatoires, recommandées, restreintes ou interdites.
Le PDF/A existe en deux variantes:

§         PDF/A 1a: concordance parfaite avec la norme

§         PDF/A 1b: exigences de base de PDF/A satisfaites (critères d'accessibilité non satisfaits)

 

3. Problèmes généraux pour la validation

Le PDF/A a certes sa norme ISO, mais celle-ci ne fait qu’énumérer quelles fonctions de la version 1.4 de PDF sont obligatoires, recommandées, restreintes ou interdites. Dans les détails, ces fonctions sont interprétées individuellement de manière différenciée. En outre, tous les documents [i] qui définissent conjointement la norme PDF/A sont très volumineux et très techniques. Il s’ensuit que seuls des experts disposant de solides connaissances des langages de description de pages tels que PostScript et PDF peuvent procéder à une évaluation complète sans l’aide de validateurs PDF/A.
Adobe Reader n'affiche pas des résulats suffisamment concluants. Il ne vérifie que quelques caractéristiques principales de PDF/A. Si on ouvre les documents non conformes de la suite des essais Bavaria avec le logiciel Adobe Reader 9.3.3, celui-ci reconnaît seulement 4 des 226 documents non conformes à PDF/A (<2%). Cet affichage peut également faire partie d'Adobe Acrobat et ne correspond pas avec les résultats du Preflight [ii].
On ne devrait donc pas renoncer à une validation systématique avec des validateurs spécialisés. 

 

4. Evaluation des validateurs PDF/A 

Etant donné la problématique mentionnée ci-dessus, il n’est pas facile d’évaluer les validateurs PDF/A existants. Le CECO ne serait pas en mesure de le faire tout seul. C’est pourquoi il s’appuie sur les travaux préliminaires de l’entreprise PDFlib [iii], qui a non seulement fourni une évaluation publique, mais également mis en ligne les fondements contenant ce savoir-faire sous forme du « Bavaria-Testsuite » [iv].
Avec ces bases et l’accord obtenu de PDFlib, le CECO est en mesure d’évaluer d’autres validateurs et de développer l’évaluation existante. En outre, les différents résultats des tests ont été résumés et sommairement évalués, comme on peut le voir dans le tableau ci-après. 

 

5. Commentaires sur le rapport et la suite des essais Bavaria de PDFlib

En tant que fabricant du rapport et de la suite des essais Bavaria, PDFlib tient à rendre les utilisateurs attentifs des points suivants: 

§         Les données d'essai pour le rapport Bavaria ne suffisent pas pour vérifier toutes les violations concevables du standard PDF du à la complexité de ce dernier.

§         Il serait certes souhaitable et intéressant d'étendre la suite des essais Bavaria. Cependant, PDFlib GmbH n'a pas l'intention d'élargir les tests pour le rapport Bavaria afin d'examiner d'autres éléments de PDF.

§         En raison de la disponibilité des données d'essai depuis la publication du rapport Bavaria (avril 2009) les fabricants de logiciels PDF/A pourraient théoriquement traiter les documents PDF du rapport Bavaria de manière séparée et donc se limiter à chercher les documents du test au lieu de chercher tous les éléments critiques. Ceci aboutirait en effet à un bon résultat de test, mais qui ne serait pas forcément suffisamment précis dans la pratique.

§         Pour des raisons financières PDFlib GmbH n'est pas capable d'assister les utilisateurs pour la suite des essais Bavaria et son application aux validateurs de PDF/A. 

 

6. Nouvelles versions ou autres programmes

Comme les tests sont très coûteux, le CECO renonce à tester séparément chaque nouvelle version. Il ne nous est pas non plus possible de représenter tous les validateurs existants. Le CECO procède cependant volontiers à des actualisations ou à des ajouts sur demande. 

 

7. Récapitulatif des produits

 


[i] La norme ISO 19005-1, référence PDF 1.4 (env. 1'000 pages), plus les documents qui y sont référencés, tels que formats de polices, spécification XML, formats de compression, RFC etc.

[ii] Le validateur Preflight est intégré dans Adobe Acrobat et a été développé par callas software GmbH.

[iii] Les fondements de l’entreprise PDFlib sont dignes de confiance, car elle est membre du « PDF/A Competence Center » et a en outre besoin de cette évaluation pour ses propres produits (création de documents PDF/A).

[iv] www.pdflib.com/knowledge-base/pdfa/validation-report   

[v] Pour la précision, le résultat (réussi/échoué) n’est pas seulement essentiel; en outre, le message d’erreur doit décrire au moins une erreur réelle. 

 

 

 

 

 

 

La présente étude sous forme de fichier PDF

PDFA-Validateurs_v2.1.pdf 43.25 KB
Validateurs PDF/A

Pour une analyse plus détaillée de PDF/A voir le Catalogue de formats de données d'archivage:

PDF/A-1
PDF/A-2
PDF/A-3

Dernière mise à jour: 2015/01/22 - © kost-ceco
haut de page retour imprimer rechercher sitemap