Tabellenkalkulationssoftware stellt numerische und alphanumerische Daten dar und erlaubt insbesondere deren Verarbeitung mittels Funktionen. Tabellenkalkulationsanwendungen existieren für verschiedene Plattformen, sowohl von kommerziellen Herstellern als auch aus Open-Source-Projekten. Sie arbeiten sämtlich mit je eigenen Formaten.
Grundsätzlich können bei der Archivierung von Spreadsheets (Tabellenkalkulations-Dokumenten) drei verschiedene Aspekte interessieren:
De facto haben die beiden letzten Möglichkeiten kaum Bedeutung erlangt. Die Konversion zu PDF/A muss sogar sehr kritisch beurteilt werden, weil sie einen grossen Aufwand für die Qualitätskontrolle bedingt; zudem geht die gesamte Funktionalität verloren (siehe dazu die Diskussion zum Format PDF/A).
Ein eigentliches aus archivischer Sicht ideales Dateiformat für Tabellenkalkulationsdaten hat sich bislang nicht durchsetzen können. Eine vorläufige Lösung für die Archivierung setzt auf die Abwärtskompatibilität kommerzieller Anwendungen (in der Regel über mehrere Versionen). Wenn eine Datei also in einem aktuellen Format vorliegt, kann mit guten Gründen davon ausgegangen werden, dass sie während der nächsten zehn Jahre von der jeweils aktuellen Programmversion noch problemlos gelesen werden kann; daher ist eine Migration unnötig. Liegt eine Datei in einer alten Formatversion vor, sollte eine Migration mit der entsprechenden Software in das jeweils aktuelle Format durchgeführt werden. (Gemäss Untersuchungen des Digital Preservation Testbed [p. 20] ist es dabei empfehlenswert, jeweils eine oder zwei Versionen zu überspringen.) Für Dateien in proprietären Formaten obsoleter Anwendungen ist die Migration in das Format einer aktuellen Anwendung unabdingbar.
Diese Überlegungen gelten insbesondere für das marktführende Format XLSX von Microsoft Excel. Obwohl diese wesentliche archivische Anforderungen nicht erfüllen, ist es für ein Archiv sinnvoller, MS-Excel-Dateien im Originalformat zu belassen, als sie in ein potenziell idealeres, aber weder erprobtes noch verbreitetes Format zu migrieren. Die durch Abwärtskompatibilität erreichte Lesbarkeit von gegen 10 Jahren verschafft den Archiven einen Aufschub bei der Suche nach einem idealeren zukünftigen Archivformat.
Aufgrund nicht vollständig geklärter Fragen zur Interoperabilität zwischen den unterschiedlichen Tabellenkalkulations-Formaten ist eine Konvertierung in das jeweils andere Dateiformat nicht empfohlen.
Dieser Ansatz beherzigt zwei allgemeine Grundsätze zur Formatwahl, nämlich unnötige Migrationen zu vermeiden und sich möglichst viele Optionen offenzuhalten.
Als vorläufige Lösung sollen Tabellenkalkulationsdaten in einer aktuellen und den zugrundeliegenden Standard möglichst vollständig implementierenden Version des Originalformats archiviert werden, also in der Regel in ODS oder XLSX.
Bei ODS ist dies Version 1.2, die als ISO 26300:2015 publiziert wurde. Bei XLSX ist dies ISO 29500:2016 in der Ausprägung "XLSX Strict", die erst mit Microsoft Office 2013 vollständig lesend und schreibend implementiert ist. Beim Einsatz anderer Office-Werkzeuge muss spezifisch abgeklärt werden, ob diese Version vollständig unterstützt wird.
Zu beachten ist, dass aus Gründen der fehlenden Offenheit XLS, das binäre Vorgängerformat von XLSX, ebenfalls nach XLSX konvertiert werden sollte. Analoges gilt v. a. wegen der Softwareunterstützung für SXC, das Vorgängerformat von ODS.
Die Alternativen dazu, nämlich die Archivierung in Datenbank-Archivformaten oder die Konvertierung in PDF/A, können nicht als Best Practice gelten und müssen kritisch beurteilt werden.
Artefactual Systems, Digital Preservation Coalition (eds.), Preserving Spreadsheets.
DPC Technology Watch Guidance Notes, Data Types Series. 2021
doi.org/10.7207/twgn21-09
Katalog archivischer Dateiformate | Version 7.0, Juni 2024 |