DE  |  FR  |  IT

Tabellenkalkulationsformate: Einleitung

Tabellenkalkulationssoftware stellt numerische und alphanumerische Daten dar und erlaubt insbesondere deren Verarbeitung mittels Funktionen. Tabellenkalkulationsanwendungen existieren für verschiedene Plattformen, sowohl von kommerziellen Herstellern als auch aus Open-Source-Projekten. Sie arbeiten sämtlich mit je eigenen Formaten.
Grundsätzlich können bei der Archivierung von Spreadsheets (Tabellenkalkulations-Dokumenten) drei verschiedene Aspekte interessieren:
  • Die Funktionalität (der Aspekt der Kalkulation). Dieser kann nur erhalten werden, wenn Tabellenkalkulations-Originalformate archiviert werden, also ODS, XLSX oder XLS.
  • Die Tabellennatur. Dieser kann Rechnung getragen werden, wenn das Spreadsheet wie eine Datenbank behandelt wird. Dazu wird auf die Datenbank-Archivierungsformate verwiesen; insbesondere entspricht die Möglichkeit des Exports in XML dem Format SQLX.
  • Die optische Erscheinung. Diese kann mit einer Konversion zu PDF/A erhalten werden.

De facto haben die beiden letzten Möglichkeiten kaum Bedeutung erlangt. Die Konversion zu PDF/A muss sogar sehr kritisch beurteilt werden, weil sie einen grossen Aufwand für die Qualitätskontrolle bedingt; zudem geht die gesamte Funktionalität verloren (siehe dazu die Diskussion zum Format PDF/A).
Ein eigentliches aus archivischer Sicht ideales Dateiformat für Tabellenkalkulationsdaten hat sich bislang nicht durchsetzen können. Eine vorläufige Lösung für die Archivierung setzt auf die Abwärtskompatibilität kommerzieller Anwendungen (in der Regel über mehrere Versionen). Wenn eine Datei also in einem aktuellen Format vorliegt, kann mit guten Gründen davon ausgegangen werden, dass sie während der nächsten zehn Jahre von der jeweils aktuellen Programmversion noch problemlos gelesen werden kann; daher ist eine Migration unnötig. Liegt eine Datei in einer alten Formatversion vor, sollte eine Migration mit der entsprechenden Software in das jeweils aktuelle Format durchgeführt werden. (Gemäss Untersuchungen des Digital Preservation Testbed [p. 20] ist es dabei empfehlenswert, jeweils eine oder zwei Versionen zu überspringen.) Für Dateien in proprietären Formaten obsoleter Anwendungen ist die Migration in das Format einer aktuellen Anwendung unabdingbar.
Diese Ueberlegungen gelten insbesondere für das marktführende Format XLSX von Microsoft Excel. Obwohl diese wesentliche archivische Anforderungen nicht erfüllen, ist es für ein Archiv sinnvoller, MS-Excel-Dateien im Originalformat zu belassen, als sie in ein potenziell idealeres, aber weder erprobtes noch verbreitetes Format zu migrieren. Die durch Abwärtskompatibilität erreichte Lesbarkeit von gegen 10 Jahren verschafft den Archiven einen Aufschub bei der Suche nach einem idealeren zukünftigen Archivformat.
Aufgrund nicht vollständig geklärter Fragen zur Interoperabilität zwischen den unterschiedlichen Tabellenkalkulations-Formaten ist eine Konvertierung in das jeweils andere Dateiformat nicht empfohlen.
Dieser Ansatz beherzigt zwei allgemeine Grundsätze zur Formatwahl, nämlich unnötige Migrationen zu vermeiden und sich möglichst viele Optionen offenzuhalten.

Untersuchte Formate


Empfehlung

Als vorläufige Lösung sollen Tabellenkalkulationsdaten in einer aktuellen und den zugrundeliegenden Standard möglichst vollständig implementierenden Version des Originalformats archiviert werden, also in der Regel in ODS oder XSLX.
Bei ODS ist dies Version 1.2, die als ISO 26300:2015 publiziert wurde. Bei XLSX ist dies ISO 29500:2016 in der Ausprägung "XLSX Strict", die erst mit Microsoft Office 2013 vollständig lesend und schreibend implementiert ist. Beim Einsatz anderer Office-Werkzeuge muss spezifisch abgeklärt werden, ob diese Version vollständig unterstützt wird.
Zu beachten ist, dass aus Gründen der fehlenden Offenheit XLS, das binäre Vorgängerformat von XSLX, ebenfalls nach XSLX konvertiert werden sollte. Analoges gilt v. a. wegen der Softwareunterstützung für SXC, das Vorgängerformat von ODS.
Die Alternativen dazu, nämlich die Archivierung in Datenbank-Archivformaten oder die Konvertierung in PDF/A, können nicht als Best Practice gelten und müssen kritisch beurteilt werden.

Literatur

Artefactual Systems, Digital Preservation Coalition (eds.), Preserving Spreadsheets. DPC Technology Watch Guidance Notes, Data Types Series. 2021.
http://doi.org/10.7207/twgn21-09

Katalog archivischer Dateiformate Version 6.2, Dezember 2021