Katalog archivischer Dateiformate Version 5.1, Dez. 2017

PDF/A-3



Preservation Planning


Kategorie

Textformate

Abkürzung

PDF/A, PDF/A-3, PDF/A-3a, PDF/A-3b, PDF/A-3u
.pdf
application/pdf
fmt/479, fmt/480, fmt/481

Titel

Portable Document Format (Archival)

Version

PDF/A-3 (entspricht ISO-32000-1 respektive PDF-Version 1.7) mit PDF/A-3a, PDF/A-3b und PDF/A-3u (2012)
Zusätzlich sind PDF/A-1 und PDF/A-2 publiziert. Da keine PDF/A-Version eine andere ablöst, sind alle Versionen gleichermassen gültig.

Beschreibung

PDF/A-3 ist ein Portable Document Format, das für die Archivierung geschaffen wurde. Das Format wurde im Standard "ISO-19005-3 - Document management – Electronic document file format for long-term preservation" genormt. Dieser Standard beruht auf der PDF-Version ISO 32000-1. Im Standard wird nur aufgelistet, welche Funktionen der einzelnen PDF-Versionen obligatorisch, empfohlen, eingeschränkt oder verboten sind.
Man unterscheidet zwischen
PDF/A-3a: vollständige Übereinstimmung mit dem Standard PDF/A;
PDF/A-3b: Mindestanforderungen von PDF/A erfüllt (Barrierefreiheit gemäss Abschnitt 508 des US Rehabilitation Act nicht erfüllt);
PDF/A-3u: wie PDF/A-3b, aber zusätzlich wird der gesamte Text in Unicode abgebildet, so dass er indexiert und dargestellt werden kann.

Bewertung



Offenheit: 4

PDF/A-3 beruht auf der Version ISO-32000-1 der PDF-Spezifikation, die ihrerseits auf der von der Firma Adobe Systems entwickelten Version 1.7 beruht. PDF/A-3 ist als ISO-Standard 19005-3 publiziert und somit offengelegt.

Lizenzfreiheit: 1

Das Kriterium Lizenzfreiheit ist nur für die PDF/A-3-Datei erfüllt; insbesondere weil u.a. nicht alle Kompressionsalgorithmen verwendet werden dürfen. Die eingebetteten Dateien können jedoch Lizenzen enthalten.

Verbreitung: 1

PDF/A-3 entspricht der PDF-Version ISO-32000-1 (mit gewissen Vorbehalten). Der Einsatz dieser Version ist nach wie vor zunehmend. PDF/A-3 selber ist noch wenig verbreitet und bekannt.

Funktionalitaet: 3

Die Funktionalität ist mit einer Ausnahme identisch mit jener von PDF/A-2.
Im Gegensatz zu PDF/A-2 sind alle eingebetteten Dateien erlaubt.

Implementierung: 3

Es existieren verschiedene Tools zur Erzeugung von PDF/A-Dokumenten, auch Open-Source-Produkte. Gelesen werden können die PDF/A-Dateien mit allen PDF-Readern (z.B. Adobe Reader). Jedoch existieren nur sehr wenige Reader, welche die Struktur eines PDF-Portfolios wiedergeben können.

Speicherdichte: 2

PDF/A-3 ist in der Regel kompakt. Im Gegensatz zu PDF/A-2 verursachen die eingebetteten Dateien jeglicher Art jedoch einen höheren Speicherbedarf.

Verifizierbarkeit: 2

PDF/A-3-Dateien können mittels Bytesequenz erkannt werden. Es existiert eine Vielzahl von Validatoren. Die eingebetteten Dateien können jedoch nicht erkannt und validiert werden.

Best Practice: 1

PDF/A-3 wird noch sehr wenig verwendet und von vielen Archiven als Archivformat nicht akzeptiert.
PDF/A-3 eignet sich nicht für die dauerhafte Archivierung respektive öffentliche Archive. Es kann aber für andere Archive wie z.B. Firmenarchive mit beschränkter Archivierungsdauer interessant sein.

Perspektive: 1

Der Standard PDF/A-3 wird sich höchstwahrscheinlich für die Langzeitarchivierung nicht durchsetzen.
Neuentwicklungen finden in neuen Versionen statt, welche jedoch diese Version nicht ausser Kraft setzen.

Formatklasse: Ø

PDF/A-3 ist im Hinblick auf die Archivierung spezifiziert worden, widerspricht aber den Anforderungen an die dauerhafte Archivierung.


Fazit

PDF/A-3 ist als Format für die Langzeitarchivierung nicht geeignet.
Archive sollten darauf hinwirken, dass Dokumente in der Verwaltung im Standard PDF/A-1 oder PDF/A-2 gespeichert werden. Sollten Dokumente als PDF/A-2-Portfolio gespeichert werden, muss darauf geachtet werden, dass keine inhaltlich wichtige Struktur verwendet wird. Die Best Practice im Bereich PDF/A zeigt, dass nicht nur die visuelle Reproduzierbarkeit, sondern auch die Durchsuchbarkeit und Extraktion vorausgesetzt werden, weshalb der Konformitätslevel U gegenüber B bevorzugt werden sollte.

Preservation Planning

Die in PDF/A erlaubte Komprimierungsart JBIG2 speichert gleichwertige Symbole nur einmal ab und verwendet diese mehrfach im ganzen Dokument. Dieses Verfahren nennt sich "Pattern matching and substitution" (PMS) und führt bei bestimmten Implementierungen und Einstellungen dazu, dass in Textdokumenten einzelne Zeichen durch andere ersetzt werden. Da der Fehler irreversibel ist und nicht festgestellt werden kann, ob das verlustbehaftete PMS-Verfahren eingesetzt wurde oder nicht, empfiehlt die KOST, beim Erstellen von PDF-Dateien vorerst auf die Kompressionsart JBIG2 zu verzichten. Für Details siehe https://kost-ceco.ch/cms/index.php?jbig2-compression_de.

Referenzen

ISO 19005-3:2012
Document management — Electronic document file format for long-term preservation — Part 3: Use of ISO 32000-1 with support for embedded files (PDF/A-3)
https://www.iso.org/standard/57229.html
[kostenpflichtig]

ISO 32000-1:2008
Document management — Portable document format — Part 1: PDF 1.7
https://www.iso.org/standard/51502.html
[kostenpflichtig]

Literatur

KOST
PDF/A-2 und PDF/A-3: Was ist neu?
KOST-Studie, 2013
https://kost-ceco.ch/cms/index.php?pdf-a-2_3_study_de
PDF Tools AG (ed)
White Paper: PDF/A - der Standard für die Langzeitarchivierung
https://www.pdf-tools.com/public/downloads/know-how/whitepaper-pdfa-standard-iso-19005-de.pdf
PDF Association
https://www.pdfa.org/

Verbindungen

PDF, PDF/A-1, PDF/A-2

last update: georg.buechler - Wed, 22 Nov 2017 [11:26:50]
Copyright © by Koordinationsstelle für die dauerhafte Archivierung elektronischer Unterlagen
Copyright © by Centre de coordination pour l'archivage à long terme de documents électroniques