DE  |  FR  |  IT

PDF/A-2 bei Bilddaten

Gewisse Archivalien sind zwar dem Format nach Bilder, der Funktion nach jedoch vielmehr Texte. Dies gilt in erster Linie für Retrodigitalisate von seitenbasierten Vorlagen wie Amtsdruckschriften oder Karteikarten. Für solche Unterlagen empfiehlt sich die Wahl eines Archivformats, welches ihrer Funktion Rechnung trägt. Aus diesem Grund wird hier die Möglichkeit der Verwendung von PDF/A-2 als Archivformat für solche Unterlagen untersucht. Damit können zwei wesentliche Vorteile erreicht werden: Eine Abfolge von Seiten kann auf einfache und direkt verständliche Art abgebildet werden und das Archivformat kann gleichzeitig als Zugangsformat dienen.
PDF/A-2 kann Bilddaten in einer Vielzahl von Codierungen und Komprimierungen enthalten, welche ihrerseits auf ihre Archivtauglichkeit hin untersucht werden müssen. Für die erwähnten Arten von Unterlagen kann auch eine verlustbehaftete Komprimierung in Betracht gezogen werden, und zwar aus zwei Gründen:
  1. Auch ein hochaufgelöstes Retrodigitalisat ist nicht das Original, sondern weist gegenüber diesem einen Informationsverlust auf. (Für einen Vergleich der im Scan-Prozess entstehenden und der durch eine massvolle Komprimierung erzeugten Varianzen siehe der Bericht zum KOST-Kolloquium Datenkomprimierung bei Bild, Audio und Video, https://kost-ceco.ch/cms/index.php?compression_de.)
  2. Die wesentlichen signifikanten Eigenschaften von Druckschriften oder Karteikarten sind der Text und seine Anordnung; eine detaillierte fotografische Rekonstruktion wird in der Regel nicht angestrebt.

Die technischen Eigenschaften von PDF/A-2 sind im Kapitel zu den Textformaten ausführlich beschrieben. Dort ist auch ein detaillierter Vergleich mit den Versionen 1 und 3 möglich. Für die Verwendung als Archivformat für Bilddaten empfiehlt sich Version 2 insbesondere deshalb, weil sie die Verwendung der JPEG2000-Komprimierung erlaubt, welche ausdrücklich empfohlen wird.
Hier erfolgt einzig die Kurzbewertung von PDF/A-2 für die Verwendung als Format zur Archivierung von Bilddaten.

Bewertung

Offenheit: 4
PDF/A-2 ist ein ISO-Standard.

Lizenzfreiheit: 3
Dieses Kriterium ist erfüllt für PDF/A-2; es ist jedoch darauf zu achten, dass keine lizenzierten Schriften, Kompressionsalgorithmen oder Verschlüsselungsalgorithmen verwendet werden.

Verbreitung: 4
PDF/A-2 hat in den letzten Jahren in den Archiven und der Geschäftswelt stark an Verbreitung gewonnen. Bei der Produktion hat PDF/A-2 inzwischen PDF/A-1 grösstenteils abgelöst.

Funktionalitaet: 3
Grundsätzlich hängt die Funktionalität von PDF/A-2 als Archivformat für Bilddaten vom eingebetteten Bildformat und dem allfällig verwendeten Kompressionsalgorithmus ab. PDF/A bildet insbesondere die Funktionalität seitenbasierter Originale wie Bücher, Amtsdruckschriften oder Karteikarten ideal ab. Als Kompressionsalgorithmus wird JPEG2000 empfohlen.

Implementierung: 4
Es existieren viele Tools zur Erzeugung von PDF/A-2-Dokumenten. Gelesen werden können die PDF/A-2-Dateien mit allen PDF-Readern (z. B. Adobe Reader).

Speicherdichte: 3
PDF/A-2 dient als Container für diverse Bildformate und Kompressionsalgorithmen. Für die Archivierung von retrodigitalisierten Unterlagen in Seitenform kann in der Regel eine verlustfreie oder verlustbehaftete Komprimierung in Kauf genommen werden. Entsprechend kann die Speicherdichte relativ hoch sein.

Verifizierbarkeit: 3
PDF/A-2-Dateien können von Formaterkennungssoftware erkannt werden. Es existieren mehrere Validatoren für das Format, wobei lediglich KOST-Val die integrierten Bilder zusätzlich validieren kann.

Best Practice: 3
Das Format wird in Archiven häufig eingesetzt und hat eine sehr hohe Akzeptanz als Archivformat. Im Bereich der digitalen Fotografie hat es zwar bis jetzt keine Bedeutung erlangt; es ist jedoch im Bereich der Retrodigitalisierung führend.

Perspektive: 3
Das Format wurde als Archivformat entwickelt und wird archivisch begleitet weiterentwickelt.

Formatklasse: B
Das Format ist aktuell im Gebrauch.

Fazit

PDF/A-2 ist für die Archivierung von Bilddaten geeignet. Speziell empfohlen wird es für die Archivierung retrodigitalisierter Unterlagen in Seitenform wie Amtsdruckschriften und Karteikarten. Innerhalb von PDF/A-2 sind verschiedene Bildformate und Komprimierungsalgorithmen möglich, welche die archivischen Eigenschaften massgeblich mitbestimmen und sorgfältig ausgewählt werden müssen. Empfohlen wird die Verwendung von PDF/A-2 mit der JPEG2000-Komprimierung.

Preservation Planning

Die in PDF/A erlaubte Komprimierungsart JBIG2 speichert gleichwertige Symbole nur einmal ab und verwendet diese mehrfach im ganzen Dokument. Dieses Verfahren nennt sich "Pattern matching and substitution" (PMS) und führt bei bestimmten Implementierungen und Einstellungen dazu, dass in Textdokumenten einzelne Zeichen durch andere ersetzt werden. Da der Fehler irreversibel ist und nicht festgestellt werden kann, ob das verlustbehaftete PMS-Verfahren eingesetzt wurde oder nicht, empfiehlt die KOST, beim Erstellen von PDF-Dateien vorerst auf die Kompressionsart JBIG2 zu verzichten. Für Details siehe https://kost-ceco.ch/cms/index.php?jbig2-compression_de.

Katalog archivischer Dateiformate Version 6.2, Dezember 2021