DE  |  FR

Tabellenkalkulationsformate: Einleitung

Tabellenkalkulationssoftware stellt numerische und alphanumerische Daten dar und erlaubt insbesondere deren Verarbeitung mittels Funktionen. Tabellenkalkulationsanwendungen existieren für verschiedene Plattformen, sowohl von kommerziellen Herstellern als auch aus Open-Source-Projekten. Sie arbeiten sämtlich mit je eigenen Formaten.
Grundsätzlich können bei der Archivierung von Spreadsheets (Tabellenkalkulations-Dokumenten) drei verschiedene Aspekte interessieren:

  • Die Funktionalität (der Aspekt der Kalkulation). Dieser kann nur erhalten werden, wenn Tabellenkalkulations-Originalformate archiviert werden, also XLS, ODF bei Tabellenkalkulation oder OOXML.
  • Die Tabellennatur. Dieser kann Rechnung getragen werden, wenn das Spreadsheet wie eine Datenbank behandelt wird. Dazu wird auf die Datenbank-Archivierungsformate verwiesen; insbesondere entspricht die Möglichkeit des Exports in XML dem Format SQLX.
  • Die optische Erscheinung. Diese kann mit einer Konversion zu PDF/A erhalten werden.


De facto haben die beiden letzten Möglichkeiten kaum Bedeutung erlangt. Die Konversion zu PDF/A muss sogar sehr kritisch beurteilt werden, weil sie einen grossen Aufwand für die Qualitätskontrolle bedingt; zudem geht die gesamte Funktionalität verloren (siehe dazu die Diskussion zum Format PDF/A).
Ein eigentliches aus archivischer Sicht ideales Dateiformat für Tabellenkalkulationsdaten hat sich bislang nicht durchsetzen können. Eine provisorische Lösung für die Archivierung setzt auf die Abwärtskompatibilität kommerzieller Anwendungen (in der Regel über mehrere Versionen). Wenn eine Datei also in einem aktuellen Format vorliegt, kann mit guten Gründen davon ausgegangen werden, dass sie während der nächsten zehn Jahre von der jeweils aktuellen Programmversion noch problemlos gelesen werden kann; daher ist eine Migration unnötig. Liegt eine Datei in einer alten Formatversion vor, sollte eine Migration mit der entsprechenden Software in das jeweils aktuelle Format durchgeführt werden. (Gemäss Untersuchungen des Digital Preservation Testbed [p. 20] ist es dabei empfehlenswert, jeweils eine oder zwei Versionen zu überspringen.) Für Dateien in proprietären Formaten obsoleter Anwendungen ist die Migration in das Format einer aktuellen Anwendung unabdingbar.
Diese Ueberlegungen gelten insbesondere für die marktführenden Formate XLS und OOXML von Microsoft Excel. Obwohl diese wesentliche archivische Anforderungen nicht erfüllen, ist es für ein Archiv sinnvoller, MS-Excel-Dateien im Originalformat zu belassen, als sie in ein potenziell idealeres, aber weder erprobtes noch verbreitetes Format zu migrieren. Die durch Abwärtskompatibilität erreichte Lesbarkeit von gegen 10 Jahren verschafft den Archiven einen Aufschub bei der Suche nach einem idealeren zukünftigen Archivformat.
Dieser Ansatz beherzigt zwei allgemeine Grundsätze zur Formatwahl, nämlich unnötige Migrationen zu vermeiden und sich möglichst viele Optionen offenzuhalten.

 

Untersuchte Formate

 

Empfehlung

Als provisorische Lösung sollen Tabellenkalkulationsdaten im Originalformat archiviert werden, also in der Regel in XLS, ODF oder OOXML. Die Alternativen dazu, nämlich die Archivierung in Datenbank-Archivformaten oder die Konvertierung in PDF/A, können nicht als Best Practice gelten und müssen kritisch beurteilt werden.

Literatur

Digital Preservation Testbed: From digital volatility to digital permanence. Preserving spreadsheets
2003
http://www.nationaalarchief.nl/kennisbank/from-digital-volatility-to-digital-permanence-preserving-spreadsheets-2003

KaD Version 5.1, Dez. 2017 - last update: georg.buechler - Mon, 18 Dec 2017 [14:08:01]