DE FR IT

Reconnaissance et validation de format

Des formats adaptés pour l'archivage - et après?

Dans la pratique, les archives ne peuvent se contenter de définir quels formats elles acceptent pour l'archivage numérique. Elles doivent en outre vérifier, lors de chaque entrée, si ces directives sont bien observées, faute de quoi elles pourraient prendre des risques pour la conservation. Cette vérification se fait en deux étapes: tout d'abord une reconnaissance automatique de format puis une validation du fichier dans son ensemble.

Qu'est-ce que cela signifie?

La reconnaissance de format identifie le format d'un fichier jusqu'à la granularité désirée. Pour ce faire, elle s'appuie sur l'existence de caractéristiques particulières. Il s'agit généralement de certaines séquences d'octets à l'intérieur d'un fichier. La validation du format vérifie si un fichier correspond bien à la spécification de son format. Il faut vérifier chaque caractéristique exigée dans la spécification du format. Le fichier n'est valide que si toutes les spécifications sont satisfaites.
Il existe plusieurs bases de données et outils bien rodés pour la reconnaissance de format. La validation de format est, quant à elle, beaucoup plus complexe d'un point de vue technique. L'offre d'outils est donc plus limitée, en particulier pour les formats moins courants.

Etude du CECO

Les bases de la reconnaissance et de la validation de formats figurent dans une nouvelle étude du CECO. Celle-ci examine aussi les bases de données (par exemple PRONOM) et outils disponibles dans le domaine de la reconnaissance de format. Elle repose sur la contribution de Claire Röthlisberger à la journée thématique 2012 de la communauté de travail allemande "Archivierung von Unterlagen aus digitalen Systemen".

Téléchargement

Reconnaissance_validation_formats_v1.0.pdf, 1.1M, 13.08.12
Reconnaissance et validation de format