Par données textuelles nous entendons des données permettant la représentation de textes peu structurés, tels qu’ils sont produits par des logiciels de traitement de texte ou des éditeurs de texte. Pour l’archivage de données textuelles, il est traditionnellement proposé de convertir les formats natifs de tels logiciels dans des formats plus appropriés aux formats d’archivage, p. ex. idéalement PDF/A-2u ou PDF/A-1. Avec le passage à des formats de fichiers ouverts, fondés sur XML, des logiciels de traitement de texte, la question se pose si ceux-ci ne seraient pas adaptés en tant que formats d’archivage.
Il faut faire attention à la distinction fondamentale entre les formats paginés et non paginés. Les formats paginés tels que les PDF et les PDF/A-2 sont optimisés pour l’impression, c’est pourquoi les sauts de page et la mise en page sont fixés. Pour les formats non paginés, comme tous les formats d’éditeur de texte, le texte lui-même est la préoccupation centrale; le saut de page est seulement déterminé lors de l’impression (ou lors de la conversion dans un format paginé). Les données de présentation (p. ex. PowerPoint) font également partie des données textuelles dont elles constituent un sous-type. Ces formats ne sont cependant pas traités de manière spécifique dans la présente version du Cfa.
Les données textuelles devraient, si possible, déjà être converties dans un format PDF (de préférence PDF/A-2u) pendant la phase active et archivées sous cette forme.
La plupart du temps, la conversion ultérieure de fichiers PDF au format PDF/A ne pose pas de problème.
Catalogue des formats de fichiers pour l'archivage | version 7.0, juin 2024 |