Les points suivants ont d’abord été désignés comme critères possibles, puis ont été rejetés après une analyse plus précise.
Le format doit intégrer les métadonnées et permettre leur extraction des fichiers
Certains formats de données disposent de leurs propres domaines de métadonnées qui sont complétés au moment de l'élaboration du fichier. En règle générale, ces métadonnées (par exemple le titre d’un document PDF) sont produites automatiquement, raison pour laquelle elles ne correspondent pas toujours à la réalité et aux intentions de l’auteur. Lorsqu’elles ne sont pas élaborées automatiquement, elles ont tendance à être mal employées.
Ce critère, que contenait encore la version 1.0 du Cfa, a été rejeté parce que l'on s'est rendu compte que les métadonnées internes au format n'offraient aucun avantage pour l'archivage électronique. Les métadonnées revêtent cependant une importance décisive pour l’archivage numérique. Il ressort des réflexions qui précèdent qu'il faut avoir recours, dans la mesure du possible, aux métadonnées des systèmes de gestion de mémorisation dans lesquels les fichiers ont été produits. En règle générale, ces métadonnées externes sont plus complètes et de meilleure qualité que les données internes. Il faut alors les archiver avec les fichiers de documents. Différentes méthodes existent à cet effet et elles sont toutes indépendantes du format du fichier.
Le format du fichier est indépendant du matériel et des systèmes d’exploitation spécifiques.
Actuellement, le lien d’un format de fichier avec un matériel spécifique – par exemple un support particulier (CD ou DVD) – est surtout utilisé pour la protection contre la copie. Cela entre en contradiction avec le principe de base que seuls les formats sans protection contre la copie et le chiffrage devraient être archivés.
En principe, tout format défini peut être mémorisé sur chaque plate-forme matériel/logiciel. Cela ne veut pas dire que des logiciels de rendu soient également disponibles pour ce format. En principe, un tel lien pourrait être développé pour les plates-formes spécifiques (p. ex. WMF sous Linux) sur la base des spécifications de format rendues publiques.
Etant donné qu’il est applicable à tous les formats examinés et qu’avec cela, il ne constitue pas une caractéristique de différenciation, ce critère a été rejeté. L’interopérabilité est une propriété d’une importance telle pour le format d’archivage qu’elle a déjà été prise en compte lors de l'inventaire du format provisoire de catalogue.
Le format doit garantir l’authenticité des documents.
La signature numérique, aujourd’hui acceptée comme preuve d’authenticité d’un fichier, est nécessairement liée aux inconvénients du codage. Des possibilités d’authentification plus simples peuvent être implémentées au niveau de l’archivage du fichier.
Lors de la migration, le contenu, le contexte, la structure et les références du fichier de départ doivent rester présents dans le format.
Le critère a été rejeté car l’authenticité des documents archivés ne doit pas être assurée par le truchement du format de fichier mais par d’autres mécanismes.
Le format doit offrir des mécanismes de correction automatique des erreurs.
Certains formats proposent des mécanismes d’identification automatique ou de correction des erreurs (p. ex. PNG).
Ce critère a été rejeté car l’identification et la correction d’erreurs est actuellement assurée de manière suffisante par la technologie et les logiciels de sauvegarde (Storage Management System).
Catalogue des formats de données d'archivage | version 7.0, juin 2024 |