Le Catalogue des formats de fichiers pour l'archivage (Cfa) du CECO décrit des formats importants et répandus et analyse leur aptitude en termes d'archivage numérique. Ces formats appartiennent à différentes catégories: Texte, Image, Audio, Vidéo, Feuille de calcul, Données structurées, Bases de données, Hypertexte, SIG et CAO/FAO.Le groupe d’experts pour la planification de la conservation (Preservation Planning) PPEG effectue régulièrement une analyse de Preservation Planning pour le Cfa. Les actualisations précédentes sont décrites à chaque fois dans l’Impressum.
Parmi les services d'archives, il existe un consensus approximatif relatif aux propriétés qu'un format devrait présenter pour être apte pour l'archivage à long terme. Ces propriétés peuvent être formulées sous forme de critères utilisés pour évaluer chaque format. Le Cfa est basé sur un catalogue de critères qui comprend trois axes:
Les trois axes de l’analyse des formats
L'analyse des formats de fichiers basée sur ces trois axes entraîne deux résultats complémentaires. D’une part, l'analyse technique archivistique et celle des bonnes pratiques permettent de classifier les formats examinés de chaque catégorie par ordre d'aptitude pour l'archivage. Ainsi, chaque format est évalué selon les critères et se voit attribuer pour chacun d'eux une note de 1 (non satisfait) à 4 (pleinement satisfait). Celle-ci est pondérée selon l'importance du critère puis additionnée aux autres notes. Pour obtenir un classement pertinent, on calcule le logarithme au moyen de la valeur moyenne d’une catégorie. Au final, les formats qui obtiennent une valeur supérieure à 1 peuvent être considérés comme particulièrement aptes pour l’archivage.
D’autre part, la classification des formats ne peut être convertie en valeur numérique. Elle aide cependant à l’interprétation des résultats et permet d'identifier les tendances et de donner un prognostique sur les formats qui sont susceptibles d’être proposés dans un avenir proche pour l'archivage.
Les résultats de l’analyse des trois axes sont résumés dans l’évaluation, qui est également disponible en format PDF. Cette analyse identifie une série de formats comme étant aptes à l’archivage (marqués en vert dans la dernière ligne de la matrice d’évaluation), tandis que quelques formats ont dû être noté comme inaptes pour l’archivage (manqués en rouge). Un certain nombre de formats peuvent être considérés comme aptes pour l’archivage sous condition (marqués en gris). La migration de ces derniers en un format « apte pour l'archivage » ne doit pas nécessairement avoir lieu au moment où ils sont versés au service d'archives. Il est possible d'attendre la fin du cycle de vie du format et différer ainsi la migration. Cela est notamment valable pour les formats relativement répandus mais classés comme inaptes à l’archivage, comme par exemple JPEG ou MP3.
Le Cfa ne doit pas donner l'impression erronée que la mission de l'archivage numérique consiste simplement à faire le bon choix du format. Pour certains documents numériques, le choix du format pour un archivage adéquat dépend de différents facteurs. Les textes d'introduction des différentes catégories de formats expliquent l'impact sur le choix du format d'un cas concret d'utilisation et du résultat d'évaluation. Les considérations générales sur l'usage du Cfa sont consignées ci-après.
En principe, les services d'archives établissent une liste des formats qu'elles considèrent comme aptes pour l'archivage. Cette liste dépend fortement du contexte organisationnel du service d'archives, notamment des ressources financières et humaines ou d'influences internes et externes.
Influences sur le choix du format
Lorsque les services d'archives entreprennent de faire un choix pour l'archivage des fichiers, ils sont confrontés à une grande quantité de formats. Analyser chacun d'entre eux demanderait des ressources que les services d'archives n'ont généralement pas à disposition. Ce travail a été fait par un groupe d'experts, piloté par le CECO, et le résultat a été consigné dans le Cfa. Il est à noter que cette analyse couvre les formats les plus divers. Plus qu'une simple source d'information, le Cfa se veut d'abord un outil d'aide à la décision. D'une part, le CECO montre par le Cfa quels formats sont aptes pour l'archivage dans l'état actuel de nos connaissances et qui peuvent être choisis comme formats cibles pour les migrations. D'autre part, le Cfa peut servir de référence pour déterminer les formats utilisables dans la phase active du cycle de vie des documents.
Il est important de noter que le résultat de l'évaluation et la liste des formats aptes pour l'archivage doivent être pris à titre de recommandations. Il est du ressort du service d'archives de décider de sa propre liste selon des considérations propres à sa situation.
Les points essentiels du Cfa sont résumés dans une recommandation.
Catalogue des formats de données d'archivage | version 7.0, juin 2024 |