DE  |  FR  |  IT

Introduction

Le Catalogue des formats de fichiers pour l'archivage (Cfa) du CECO décrit 52 formats importants et répandus et analyse leur aptitude en termes d'archivage numérique. Ces formats appartiennent à différentes catégories: Texte, Image, Audio, Vidéo, Feuille de calcul, Bases de données, Hypertexte, SIG et CAO/FAO. Le PPEG effectue régulièrement une analyse Preservation Planning pour le Cfa.

 

Analyse et évaluation

Parmi les services d'archives, il existe un consensus approximatif relatif aux propriétés qu'un format devrait présenter pour être apte pour l'archivage à long terme. Ces propriétés peuvent être formulées sous forme de critères utilisés pour évaluer chaque format. Le Cfa est basé sur un catalogue de critères qui comprend trois axes:

  1. Une analyse archivistique technique révèle dans quelle mesure un format satisfait aux exigences pour l’archivage ainsi que les risques potentiels liés à son utilisation. Le Cfa utilise sept critères de pondération distincts.
  2. Une analyse des bonnes pratiques qui positionne chaque format dans la discipline archivistique. Cet axe complète l'analyse archivistique technique, trop abstraite dans certains cas. Le Cfa utilise deux critères de pondération distincts.
  3. Une classification des formats qui permet d'expliquer les différences de résultats des deux premiers axes. Cette compréhension contribue au choix de l’une des recommandations. Cette classification distingue cinq classes de formats: une première qui contient les formats connus de longue date et largement répandus; une seconde classe qui contient les formats actuellement utilisés; une troisième qui contient les formats d'avenir qui ne sont pas encore utilisés à large échelle, mais une large diffusion s'esquisse; une quatrième qui contient les formats potentiels, d'intérêt pour l'archivage, mais qui ne sont pas arrivés à un degré de maturité et de diffusion suffisants; et un cinquième qui contient les formats caducs, qui sont désapprouvés et qui ont été remplacés.


AxesLes trois axes de l’analyse des formats
L'analyse des formats de fichiers basée sur ces trois axes entraîne deux résultats complémentaires. D’une part, l'analyse technique archivistique et celle des bonnes pratiques permettent de classifier les formats examinés de chaque catégorie par ordre d'aptitude pour l'archivage. Ainsi, chaque format est évalué selon les critères et se voit attribuer pour chacun d'eux une note de 1 (non satisfait) à 4 (pleinement satisfait). Celle-ci est pondérée selon l'importance du critère puis additionnée aux autres notes. Pour obtenir un classement pertinent, on calcule le logarithme au moyen de la valeur moyenne d’une catégorie. Au final, les formats qui obtiennent une valeur supérieure à 1 peuvent être considérés comme particulièrement aptes pour l’archivage.
D’autre part, la classification des formats ne peut être convertie en valeur numérique. Elle aide cependant à l’interprétation des résultats et permet d'identifier les tendances et de prévoir quels formats sont susceptibles d’être proposés dans un avenir proche pour l'archivage.
Les résultats de l’analyse des trois axes sont résumés dans une matrice d'évaluation (disponible également sous forme de tableau Excel). Sur la base de cette analyse, les formats du Cfa sont qualifiés comme « aptes pour l'archivage » (marqués en vert), « inaptes pour l'archivage » (marqués en rouge) ou « aptes pour l’archivage sous condition » (marqués en gris). La migration de ces derniers en un format « apte pour l'archivage » ne doit pas nécessairement avoir lieu au moment où ils sont versés au service d'archives. Il est possible d'attendre la fin du cycle de vie du format et différer ainsi la migration (ex.: JPEG, MP3, MPEG-2).
Bewertungsmatrix zur Archivtauglichkeit von Dateiformaten

Matrice d'évaluation de l'aptitude des formats de fichiers pour l'archivage 

 

Usage pour les services d'archives

Le Cfa ne doit pas donner l'impression erronée que la mission de l'archivage numérique consiste simplement à faire le bon choix du format. Pour certains documents numériques, le choix du format pour un archivage adéquat dépend de différents facteurs. Les textes d'introduction des différentes catégories de formats expliquent l'impact sur le choix du format d'un cas concret d'utilisation et du résultat d'évaluation. Les considérations générales sur l'usage du Cfa sont consignées ci-après.
En principe, les services d'archives établissent une liste des formats qu'elles considèrent comme aptes pour l'archivage. Cette liste dépend fortement du contexte organisationnel du service d'archives, notamment des ressources financières et humaines ou d'influences internes et externes.
InfluencesInfluences sur le choix du format
Lorsque les services d'archives entreprennent de faire un choix pour l'archivage des fichiers, ils sont confrontés à une grande quantité de formats. Analyser chacun d'entre eux demanderait des ressources que les services d'archives n'ont généralement pas à disposition. Ce travail a été fait par un groupe d'experts, piloté par le CECO, et le résultat a été consigné dans le Cfa. Il est à noter que cette analyse couvre les formats les plus divers. Plus qu'une simple source d'information, le Cfa se veut d'abord un outil d'aide à la décision. D'une part, le CECO montre par le Cfa quels formats sont aptes pour l'archivage dans l'état actuel de nos connaissances et qui peuvent être choisis comme formats cibles pour les migrations. D'autre part, le Cfa peut servir de référence pour déterminer les formats utilisables dans la phase active du cycle de vie des documents.
Il est important de noter que le résultat de l'évaluation et la liste des formats aptes pour l'archivage doivent être pris à titre de recommandations. Il est du ressort du service d'archives de décider de sa propre liste selon des considérations propres à sa situation.
 

Structure du Cfa

 

  • Liste des formats aptes pour l'archivage ou identifiés comme intéressants pour les services d'archives en raison de leur large diffusion. Pour chaque catégorie, une synthèse est disponible. Elle fournit des informations générales ainsi que des recommandations concrètes, basées sur la matrice d'évaluation.
  • Annexes : Catalogue des critères utilisés pour l'analyse, des indications générales sur le codage des caractères et la compression des données, un glossaire ainsi qu'une bibliographie générale.

 

 

Recommandation

Les points essentiels du Cfa sont résumés dans une recommandation.

Catalogue des formats de fichiers pour l'archivage version 6.2, décembre 2021