DE  |  FR  |  IT

PDF/A-2

Allgemeine Informationen

 

Titel Portable Document Format (Archival)
Kategorie Textformate
Abkürzung PDF/A, PDF/A-2, PDF/A-2a, PDF/A-2b, PDF/A-2u
Dateiendung .pdf
Mime Type application/pdf
Pronom PUID fmt/476, fmt/477, fmt/478
Version PDF/A-2 (entspricht ISO-32000-1 respektive PDF-Version 1.7) mit PDF/A-2a, PDF/A-2b und PDF/A-2u (2011) – Zusätzlich sind PDF/A-1 und PDF/A-3 publiziert. Da keine PDF/A-Version eine andere ablöst, sind alle Versionen gleichermassen gültig.

 

Beschreibung

PDF/A-2 ist ein Portable Document Format, das für die Archivierung geschaffen wurde. Das Format wurde im Standard "ISO-19005-2 - Document management – Electronic document file format for long-term preservation" genormt. Dieser Standard beruht auf der PDF-Version ISO 32000-1. Im Standard wird nur aufgelistet, welche Funktionen der zugrundeliegenden PDF-Version obligatorisch, empfohlen, eingeschränkt oder verboten sind. Werden die Funktionalitäten Layer oder PDF-Portfolio verwendet, kann nicht ausgeschlossen werden, dass Informationen beim Drucken verloren gehen.
Man unterscheidet zwischen
PDF/A-2a: vollständige Übereinstimmung mit dem Standard PDF/A;
PDF/A-2b: Mindestanforderungen von PDF/A erfüllt (Barrierefreiheit gemäss Abschnitt 508 des US Rehabilitation Act nicht erfüllt);
PDF/A-2u: wie PDF/A-2b, aber zusätzlich wird der gesamte Text in Unicode abgebildet, so dass er indexiert und dargestellt werden kann.

Bewertung

Offenheit: 4
PDF/A-2 beruht auf der Version ISO-32000-1 der PDF-Spezifikation, die ihrerseits auf der von der Firma Adobe Systems entwickelten Version 1.7 beruht. PDF/A-2 ist als ISO-Standard 19005-2 publiziert und somit offengelegt.

Lizenzfreiheit: 3
Das Kriterium Lizenzfreiheit ist erfüllt; insbesondere weil u.a. nicht alle Kompressionsalgorithmen verwendet werden dürfen.

Verbreitung: 4
Bei der Produktion hat PDF/A-2 inzwischen PDF/A-1 grösstenteils abgelöst.

Funktionalitaet: 3
Im Gegensatz zur PDF-Version ISO-32000-1 sind Ton-/Videoproduktion und JavaScript-Objekte nicht erlaubt. Strukturierte Objekte (Texte, Vektorgraphiken, Rasterbilder) bleiben erhalten, sofern sie eingebettet werden. Visuelle Reproduzierbarkeit und natürliche Leseordnung sind garantiert. WYSIWYG ist mit kleineren Einschränkungen gewährleistet.
Im Gegensatz zu PDF/A-1 sind Transparenz, JPEG2000-Komprimierung, Layer und PDF-Portfolio respektive eingebettete PDF/A-1 oder PDF/A-2 Dateien erlaubt.
Bei PDF/A-2a und PDF/A-2u bleiben Textextraktion und Durchsuchbarkeit erhalten, bei PDF/A-2b sind sie nicht gewährleistet.

Implementierung: 4
Es existieren verschiedene Tools zur Erzeugung von PDF/A-Dokumenten, auch Open-Source-Produkte. Gelesen werden können die PDF/A-Dateien mit allen PDF-Readern (z.B. Adobe Reader).

Speicherdichte: 3
PDF/A-2 ist in der Regel kompakt. Im Gegensatz zu PDF/A-1 ist die JPEG2000-Komprimierung erlaubt, und entsprechend kann die Speicherdichte auch höher sein. Die Einbettung der Schriftarten verursacht jedoch gegenüber PDF einen zusätzlichen Speicherbedarf.

Verifizierbarkeit: 4
PDF/A-2-Dateien können mittels Bytesequenz erkannt werden. Es existiert eine Vielzahl von Validatoren.

Best Practice: 4
PDF/A-2u wird von vielen Archiven als Archivformat gefordert und auch bereits archiviert.
PDF/A-2 eignet sich besonders gut für die dauerhafte Archivierung.

Perspektive: 4
Der Standard PDF/A-2 hat sich für die Langzeitarchivierung neben PDF/A-1 durchgesetzt.
Neuentwicklungen finden in neuen Versionen statt, welche jedoch diese Version nicht ausser Kraft setzen.

Formatklasse: B
Das Format ist aktuell im Gebrauch.

 

Fazit

PDF/A-2 ist als Format für die Langzeitarchivierung sehr geeignet.
Archive sollten darauf hinwirken, dass Dokumente in der Verwaltung im Standard PDF/A-2u gespeichert werden. Die Best Practice im Bereich PDF/A zeigt, dass nicht nur die visuelle Reproduzierbarkeit, sondern auch die Durchsuchbarkeit und Extraktion vorausgesetzt werden, weshalb der Konformitätslevel U gegenüber B bevorzugt werden sollte. Sollten Dokumente als PDF/A-2-Portfolio gespeichert werden, muss darauf geachtet werden, dass keine inhaltlich wichtige Struktur verwendet wird.

Preservation Planning

Die in PDF und PDF/A erlaubte Komprimierungsart JBIG2 speichert gleichwertige Symbole nur einmal ab und verwendet diese mehrfach im ganzen Dokument. Dieses Verfahren nennt sich "Pattern matching and substitution" (PMS) und führt bei bestimmten Implementierungen und Einstellungen dazu, dass in Textdokumenten einzelne Zeichen durch andere ersetzt werden. Da der Fehler irreversibel ist und nicht festgestellt werden kann, ob das verlustbehaftete PMS-Verfahren eingesetzt wurde oder nicht, empfiehlt die KOST, beim Erstellen von PDF-Dateien vorerst auf die Kompressionsart JBIG2 zu verzichten. Für Details siehe https://kost-ceco.ch/cms/index.php?jbig2-compression_de.

Referenz

ISO 19005-2:2011
Document management — Electronic document file format for long-term preservation — Part 2: Use of ISO 32000-1 (PDF/A-2)
https://www.iso.org/standard/50655.html
[kostenpflichtig]
ISO 32000-1:2008
Document management — Portable document format — Part 1: PDF 1.7
http://www.iso.org/standard/51502.html
[kostenpflichtig]

Literatur

KOST
PDF/A-2 und PDF/A-3: Was ist neu?
KOST-Studie, 2013
https://kost-ceco.ch/cms/index.php?pdf-a-2_3_study_de
PDF Tools AG (ed)
White Paper: PDF/A - der Standard für die Langzeitarchivierung
https://www.pdf-tools.com/public/downloads/know-how/whitepaper-pdfa-standard-iso-19005-de.pdf
PDF Association
https://www.pdfa.org/

Verbindungen

PDF, PDF/A-1, PDF/A-3

Katalog archivischer Dateiformate Version 6.2, Dezember 2021