DE  |  FR

Empfehlung

Der Katalog archivischer Dateiformate (KaD) kann von Archiven und verwandten Institutionen als Grundlage für die Formulierung eigener Formatempfehlungen benutzt werden. Aufgrund der im KaD detailliert erläuterten Analysen, Bewertungen und Schlussfolgerungen empfiehlt die KOST für die verschiedenen Formatkategorien die folgenden Dateiformate als gegenwärtig archivtauglichste Lösung:
Text soll möglichst bereits im Amt in ein PDF-Format (PDF/A-1, PDF/A-2 oder PDF) umgewandelt und so archiviert werden.
Eine Konvertierung von PDF-Dateien in ein PDF/A-Format ist zu einem späteren Zeitpunkt meist problemlos möglich.

Es gibt nicht ein einziges ideales Archivformat für Bilddaten. Es ist im Gegenteil unerlässlich, den konkreten Anwendungsfall und die archivische Bewertung in den Formatentscheid mit einzubeziehen:
  • PDF/A-2 erfüllt die archivischen Anforderungen an ein Bildformat in idealer Weise, ist jedoch in erster Linie geeignet für die Archivierung retrodigitalisierter Unterlagen in Seitenform wie Amtsdruckschriften und Karteikarten. Für diese Unterlagenkategorie ist auch eine massvolle Komprimierung empfehlenswert.
  • JPEG gilt gemeinhin sowie als Resultat der Analyse des KaD nicht als Archivformat. In der Praxis übernehmen viele Archive allerdings grosse Bildbestände im JPEG-Format. Eine Konvertierung in ein Archivformat macht hier nur in den wenigsten Fällen Sinn: JPEG ist weit verbreitet und stabil, der Informationsverlust durch die Komprimierung ist bereits geschehen und nicht rückgängig zu machen.
  • PNG kann in der Regel nicht als Zielformat für Migrationen gelten, wird jedoch bei der Archivierung von Webinhalten voraussichtlich in grossen Mengen übernommen werden.
  • DNG kann in Betracht gezogen werden bei der Archivierung von digitalen Fotos, falls der Zugriff auf die RAW-Daten möglich ist.
In einem allgemeinen Sinn kann immer noch TIFF als hauptsächliches Archivformat für Rasterbilder gelten. Die Verwendung von JPEG2000 mit seinen Vorteilen in der Speicherplatzökonomie ist alternativ ebenfalls möglich, erfordert vom Archiv jedoch ein bewusstes Bekenntnis zu diesem ausserhalb der Archivwelt immer noch wenig verbreiteten Format.

Für die Archive empfiehlt es sich, entweder die anfallenden Audiodateien unkomprimiert im WAV-Format (genauer: WAVE PCM) oder als FLAC verlustfrei komprimiert zu archivieren.

Für die Archivierung von Video sollte folgendes erwogen werden:
  • Die übernommenen Videos sollten wenn möglich die ursprünglich erzeugten und wenn nicht, so doch die mit möglichst wenig Konvertierungsschritten entstandenen Daten sein.
  • Die geringe Erfahrung im archivischen Bereich mit der Langzeitarchivierung von Video sollte uns davon abhalten, vorschnell Formatmigrationen in Erwägung zu ziehen. Eine Ausnahme ist der Fall, wo Videos von ephemeren Datenträgern (Kassetten, Minidisks etc.) übernommen werden müssen.
  • Es ist abzuwägen, ob es der Umfang der zu archivierenden Videos erlaubt, diese in unkomprimierter oder verlustfrei komprimierter Form zu speichern.
  • Der Entscheid für eine Komprimierung ist aus archivischer Sicht ein Bewertungsentscheid: In vielen Fällen muss mit Komprimierung auf bestimmte Aspekte (Qualität, zukünftige Benutzung etc.), ohne Komprimierung auf eine Überlieferung gänzlich verzichtet werden.
  • Es muss ein besonderes Augenmerk auf möglichst lange Migrationszyklen gelegt werden.
  • Deshalb ist für Video die Migrationsvermeidung höher zu gewichten als die Reduktion der Formatanzahl im Archiv, und es können mehr Formate als (mindestens provisorisch) archivtauglich akzeptiert werden als für andere Formatkategorien.
Daraus ergibt sich folgende Schlussfolgerung: Videoformate können nicht per se als archivtauglich oder nicht archivtauglich klassifiziert werden. Vielmehr ist je nach Entstehungszusammenhang, Archivauftrag und Bewertungsentscheid jeweils ein bestimmtes Format das in diesem Fall am besten geeignete.

Es existiert kein aus archivischer Sicht ideales Format für strukturierte Daten aus Tabellenkalkulation. Als provisorische Lösung sollen Tabellenkalkulationsdaten im Originalformat archiviert werden, also in der Regel in XLS, ODF oder OOXML. Die Alternativen dazu, nämlich die Archivierung in Datenbank-Archivformaten oder die Konvertierung in PDF/A, können nicht als Best Practice gelten und müssen kritisch beurteilt werden.

Datenbanken können nur unter Vorbehalt in ein archivisches Dateiformat überführt werden. Die Übernahme von Datenbanktabellen im CSV-Format ist bislang ein verbreitetes Vorgehen in den Archiven. Angesichts der Limiten von CSV, insbesondere der fehlenden Dokumentation und Metainformationen, kann dieses Format inzwischen nur noch als Notlösung gelten. Es wird empfohlen, ein umfassenderes, spezifisch für die Datenbank-Archivierung entwickeltes Format wie SIARD zu verwenden.

Die Webarchivierung bzw. die Archivierung von Hypertext stellt bezüglich Bewertung und Übernahme aber auch bei der Formatwahl besondere Anforderungen (siehe dazu die Studie zur Webarchivierung). Obwohl WARC das eingeführte Format der Webarchivierung ist, kann es als Langzeitformat nicht empfohlen werden: Die Vielzahl möglicher eingebetteter Formate und die Schwierigkeit, diese zu migrieren, sprechen dagegen. Für die Archivierung eines gesamten Webauftritts empfiehlt sich längerfristig eindeutig eine Umwandlung in PDF/A.

Im GIS-Bereich empfiehlt sich in der Schweiz für die Vektordaten INTERLIS 1. Längerfristig ist die Entwicklung und Verbreitung von GeoPackage, dem Standard des Open Geospatial Consortium zur Archivierung von Daten aus Geoinformationssystemen, als Alternative zu beobachten; im Augenblick unterstützen die Produkte des Marktführers für GIS-Systeme, ESRI, das Format noch nicht. Für die Archivierung von Bitmapgrafiken und Orthofotos aus Geoinformationssystemen ist das jeweils geeignete Bildformat zusammen mit einem ESRI World-File für die Verortung im Koordinatensystem zu empfehlen; siehe dazu Rasterdaten mit World-File.
Für die direkten Produkte aus Geoinformationssystemen ist eine Archivierung in Vektorgrafik in PDF zu empfehlen, grundsätzlich immer auch als zusätzliche Archivierung zu den Vektordaten.

Durch die langjährige Marktführerschaft der Firma Autodesk hat sich im CAD-Bereich das Speicherformat dieses Herstellers, DWG, faktisch als Industriestandard für Austausch und Archivierung durchgesetzt. Das offengelegte Austauschformat DXF, ebenfalls von Autodesk, hat den Nachteil, dass es in der Regel nur Teile der CAD-Daten speichern kann. Eine Parallelarchivierung in DWG und DXF ist darum nicht zu empfehlen, allenfalls eine Parallelarchivierung in DWG und IFC
Betrachten wir den gesamten Produktionszyklus vor allem in der Bauindustrie, müssen wir IFC sicher in Betracht ziehen. Das offene Format kann auch als Alternative zum proprietären DWG gesehen werden.
Die Archivierung von Produkten der CAD/CAM-Prozesse, also von Plänen, sollte aber weiterhin Beachtung finden. Das heisst, es empfiehlt sich Vektorgrafik in PDF grundsätzlich immer auch als Alternative zu den CAD-Daten.

Katalog archivischer Dateiformate Version 6.0, Juli 2019