Un logiciel tableur représente des données numériques et alphanumériques et permet en particulier de les traiter au moyen de fonctions. Les applications de gestion de tableaux sont fournies pour diverses plates-formes par des producteurs commerciaux et sont aussi disponibles sous forme de projets source ouverte. Chacune possède son propre format.
En principe, on peut tenir compte de trois aspects différents dans les considérations sur l'archivage des feuilles de calcul (documents provenant de tableurs):
Les deux dernières possibilités ne sont de facto guère pertinentes. La conversion en PDF/A doit même être évaluée de manière critique parce qu'elle suppose un grand effort pour le contrôle de la qualité. En outre l'ensemble de la fonctionnalité est perdu (voir à ce sujet la discussion sur le format PDF/A).
Aucun format de fichier idéal du point de vue archivistique n'a pu s'imposer jusqu'ici pour les feuilles de calcul. Une solution provisoire pour l'archivage consiste à miser sur la rétrocompatibilité des applications commerciales (en règle générale sur plusieurs versions). Par conséquent, il y a toutes les raisons de penser qu’un fichier en format courant pourra être lu sans problème pendant les dix années à venir par les versions suivantes du programme. Il est donc inutile de procéder à une migration. Dans le cas d’un fichier dans une version ancienne du format, il faut procéder à une migration dans le format actuel au moyen du logiciel correspondant (selon les investigations du «Digital Preservation Testbed» [p. 20], il est préférable de sauter chaque fois une ou deux versions). Dans le cas d’applications périmées en format propriétaire, il est indispensable d’effectuer une migration dans le format d’une application actuelle.
Ces considérations s’appliquent en particulier au format XLSX de Microsoft Excel qui domine le marché. Bien que ces formats ne répondent pas aux exigences de l’archivage, il est plus judicieux d’archiver les fichiers MS Excel dans le format d'origine plutôt que d’effectuer une migration dans un format potentiellement plus approprié mais n’ayant pas fait ses preuves et dont la diffusion est faible. La lisibilité de 10 ans, atteinte grâce à la compatibilité descendante, accorde au service d’archivage un délai lui permettant de chercher un format d’archivage futur plus approprié. En raison de questions non entièrement résolues concernant l'interopérabilité entre les différents formats de tableur, la conversion dans l'autre format de fichier n'est pas recommandée.
Cette approche suit deux principes généraux guidant le choix d'un format, à savoir éviter les migrations superflues et garder ouvertes le plus d'options possibles.
A titre de solution provisoire, les feuilles de calcul doivent être archivées dans une version actuelle du format original qui implémente le plus complètement possible la norme sous-jacente, c'est-à-dire généralement en ODS ou en XSLX. Pour ODS, il s'agit de la version 1.2, publiée sous la référence ISO 26300:2015. Pour XLSX, il s'agit de la norme ISO 29500:2016 dans sa version "XLSX Strict", qui n'est entièrement implémentée en lecture et en écriture qu'à partir de Microsoft Office 2013. En cas d'utilisation d'autres outils Office, il convient de vérifier spécifiquement si cette version est entièrement prise en charge. Il convient de noter que, pour des raisons de manque d'ouverture, XLS, le format binaire prédécesseur de XLSX, devrait également être converti en XSLX. Les alternatives comme archiver dans des formats d'archivage base de données ou convertir en PDF/A ne peuvent être considérées comme bonnes pratiques et doivent être évaluées de manière critique.
Artefactual Systems, Digital Preservation Coalition (eds.), Preserving Spreadsheets. DPC Technology Watch Guidance Notes, Data Types Series. 2021.
doi.org/10.7207/twgn21-09
Catalogue des formats de fichiers pour l'archivage | version 7.0, juin 2024 |