Unter "Text" verstehen wir Daten zur Repräsentation von wenig strukturiertem Text, wie sie u.a. von Textverarbeitungssoftware oder Texteditoren erzeugt werden. Zur Archivierung von Textdaten wird herkömmlicherweise vorgeschlagen, die nativen Formate dieser Software in besser geeignete Archivformate zu konvertieren, z.B. idealerweise PDF/A-2u oder PDF/A-1. Mit dem Wechsel zu offenen, XML-basierten Dateiformaten in Textverarbeitungssoftware stellt sich die Frage, ob diese sich auch als Archivformate eignen würden.
Zu beachten ist der grundsätzliche Unterschied zwischen seitenbasierten und nicht-seitenbasierten Formaten. Seitenbasierte Formate wie PDF und PDF/A sind für den Ausdruck optimiert, weswegen Seitenumbruch und Layout fixiert sind. Bei nicht-seitenbasierten Formaten wie allen Textverarbeitungsformaten steht der Text selber im Mittelpunkt; der Seitenumbruch wird erst beim Ausdruck (bzw. bei der Konvertierung in ein seitenbasiertes Format) fixiert. Ebenfalls zu den Textdaten gehören als Subtypus die Präsentationsdaten (z.B. PowerPoint).
Textdaten sollen möglichst bereits in der aktiven Phase in ein PDF-Format (idealerweise PDF/A-2u) umgewandelt und so archiviert werden.
Eine Konvertierung von PDF-Dateien in ein PDF/A-Format ist zu einem späteren Zeitpunkt meist problemlos möglich.
Katalog archivischer Dateiformate | Version 7.0, Juni 2024 |