Der Katalog archivischer Dateiformate (KaD) beschreibt wichtige und verbreitete Dateiformate und analysiert ihre Eignung für die digitale Archivierung. Diese Formate gehören verschiedenen Kategorien an: Text, Bild, Audio, Video, Tabellenkalkulation, strukturierte Daten, Datenbanken, Hypertext, GIS und CAD/CAM.
Die Preservation-Planning-Expertengruppe (PPEG) führt regelmässig eine Preservation Planning Analyse für den KaD durch und hält den KaD aktuell. Die letzten Aktualisierungen sind im Impressum beschrieben.
Unter Archivinstitutionen besteht ein grober Konsens über die Eigenschaften, die ein Format aufweisen sollte, um als langzeittauglich zu gelten. Diese Eigenschaften können als Kriterien formuliert werden, mit deren Hilfe die einzelnen Formate analysiert werden. Der KaD basiert auf einem Kriterienkatalog, welcher drei Blickwinkel auf die Formate umfasst:
Drei Blickwinkel der Formatanalyse
Die Betrachtung der Dateiformate aus diesen drei Blickwinkeln führt zu zwei sich ergänzenden Resultaten. Einerseits ermöglicht der Katalog der archivfachlichen und Best-Practice-Kriterien, die untersuchten Formate jeder Kategorie in eine Rangfolge gemäss ihrer Archivtauglichkeit zu bringen. Dabei wird jedes Format an Hand des Kriterienkatalogs bewertet und erhält zu jedem Kriterium eine Bewertung von 1 (nicht erfüllt) bis 4 (vollständig erfüllt). Diese Bewertungen werden mit der Gewichtung des Kriteriums multipliziert und aufsummiert. Um eine aussagekräftige Rangliste zu erhalten, wird der Logarithmus über dem Mittelwert innerhalb einer Kategorie berechnet. Formate, die Werte grösser als eins erreichen, können dann als überdurchschnittlich archivtauglich gelten.
Die Analyse nach Formatklassen anderseits lässt sich nicht in einen numerischen Wert übersetzen. Sie hilft aber bei der Interpretation der Resultate, erlaubt es, Trends zu erkennen, und ermöglicht eine Prognose über die den Archiven potenziell in nächster Zeit zur Übernahme angebotenen Formate.
Die Resultate der Analyse aus den drei Blickwinkeln sind in der Bewertung zusammengefasst, die auch als PDF-Datei verfügbar ist. Diese Analyse identifiziert eine Reihe von archivtauglichen Formaten (in der untersten Zeile grün markiert), während einzelne Formate im KaD als nicht archivtauglich bezeichnet werden müssen (rot markiert). Etliche Formate können nur als bedingt archivtauglich gelten (grau markiert). Die Migration solcher Formate in ein archivtaugliches Format muss aber nicht zwingend bei der Übernahme erfolgen. Es kann durchaus das Ende des Lebenszyklus des Formates abgewartet und somit die Migration hinausgeschoben werden, sofern ein aktives Monitoring des Formatlebenszyklus gewährleistet ist. Dies betrifft insbesondere verbreitete aber als nicht archivtauglich klassierte Dateiformate wie zum Beispiel JPEG oder MP3.
Der KaD soll nicht den falschen Eindruck erwecken, die Aufgabe der digitalen Archivierung sei allein durch die richtige Formatwahl lösbar. Die Wahl des geeigneten Archivformats für bestimmte digitale Unterlagen hängt von verschiedenen Faktoren ab. In den Einleitungstexten zu den verschiedenen Formatkategorien ist erläutert, wie der konkrete Anwendungsfall und Bewertungsentscheid die Formatwahl beeinflussen. Allgemeine Überlegungen zur Anwendung des KaD sind im Folgenden festgehalten.
In der Regel legt ein Archiv eine Liste von Formaten fest, die es als archivtauglich akzeptiert. Diese Liste hängt stark vom organisatorischen Umfeld ab, vor allem von den Ressourcen finanzieller und personeller Art, aber auch von weiteren internen oder externen Einflüssen.
Einflüsse auf die Formatauswahl
Bei der Festlegung dieser Formatliste sieht sich das Archiv mit einer grossen Menge an unterschiedlichen Formaten konfrontiert. All diese Formate zu analysieren, übersteigt die Ressourcen der meisten Archive. Ein Expertengremium unter Leitung der KOST hat diese Arbeit übernommen und deren Resultate im KaD festgehalten. Der KaD dient den Archiven damit nicht nur als Informationsquelle, sondern auch als Entscheidungshilfsmittel. Erstens zeigt er auf, welche Formate nach heutigem Kenntnisstand archivtauglich sind und als Zielformate für die Migration dienen können. Zweitens dient er als Referenz dafür, welche Formate aus archivischer Sicht im aktiven Lifecycle verwendet werden können.
Die im KaD als archivwürdig definierten Formate sind als Empfehlung zu verstehen. Welche Formate ein Archiv als tauglich für die digitale Archivierung zulässt, bleibt seine Entscheidung.
Die Kernaussagen des KaD sind in einer Kurzempfehlung zusammengefasst.
Katalog archivischer Dateiformate | Version 7.0, Juni 2024 |