Die KOST-Träger wissen schon lange: Archivtaugliche Dateiformate einzufordern, ohne ihre Einhaltung zu überprüfen, ist nicht einmal die halbe Miete.
Deshalb beschränkt sich die KOST nicht darauf, ihren Katalog archivischer Dateiformate KaD laufend zu aktualisieren, sondern beschäftigt sich seit Jahren intensiv mit der Formatvalidierung. Grundsätzliche Überlegungen, wie sie in der Studie „Formaterkennung und Formatvalidierung: Theorie und Praxis“ von 2012 angestellt wurden, bilden das theoretische Fundament, das im Multi-Format-Validator KOST-Val konkretisiert wird.
Von besonderer Bedeutung ist die Validierung bei dem für die digitale Archivierung zentralen Format PDF/A. Aus diesem Grund hat die KOST bereits 2010 sieben Validatoren für PDF/A getestet und analysiert und die Resultate als Studie veröffentlicht. Nach sieben Jahren schien eine komplette Überarbeitung dieser Untersuchung angebracht. Wir freuen uns, Ihnen die neue KOST-Studie zu PDF/A-Validatoren vorstellen zu können. Sie umfasst noch fünf auf dem Markt wichtige Produkte, darunter neu den im Rahmen des PREFORMA-Projekts entwickelten Open-Source-Validator veraPDF.
Eine vollständige Analyse von PDF/A-Validatoren erfordert ein umfassendes, korrektes und möglichst unpubliziertes Testset von Dateien, die die separate Analyse sämtlicher interessierender Anforderungen erlauben. Ein solches Testset stand 2010 mit der „Bavaria-Testsuite“ zur Verfügung. Diese ist jedoch inzwischen nicht nur nicht mehr aktuell, sondern auch zu gut bekannt. Ein neues Testset zu erarbeiten, übersteigt die gegenwärtigen Möglichkeiten der KOST. Deshalb beruht die Neuauflage der PDF/A-Validatoren-Studie auf einem Validatoren-Benchmarking. Dafür wurde ein Testset von 2980 verschiedenen realen PDF-Dateien aus dem Umfeld der KOST und der nestor-Arbeitsgruppe Formaterkennung verwendet, die allen untersuchten Validatoren als Input dienten.
Die folgenden Aspekte wurden festgehalten (neben der Version, dem Tester und dem Testzeitpunkt):
Die Analyseergebnisse sind in der folgenden Tabelle zusammengestellt. Bitte beachten Sie, dass von veraPDF drei verschiedene Versionen getestet wurden.
PDFA-Validatoren_2018.04_v1.0.pdf, 173.7K, 23.04.18
PDF/A-Validatoren-Studie von 2018.04
PDFA-Validatoren_v2.1.pdf, 42.6K, 08.12.10
PDF/A-Validatoren-Studie von 2010