Un format conteneur est un format de fichiers qui peut contenir plusieurs fichiers de différents formats, habituellement accompagnés d’un ensemble de métadonnées. En règle générale, des formats conteneurs audio/vidéo contiennent des fichiers de flux audio et vidéo qui sont reliés entre eux de sorte à produire un film lisible dans son ensemble. Les flux vidéo et audio sont intégrés après avoir été encodés d’une certaine manière ; le terme de codec s’est imposé pour décrire cette opération (vient de codeur/décodeur). La plupart des formats conteneurs courants prennent en charge différents flux de données encodés. Quelques formats vidéo définissent aussi bien des formats conteneurs que des formats de codecs, par exemple la famille MPEG (MPEG-4, MPEG-2), d’autre formats dits vidéo sont de purs formats conteneurs (MKV, AVI, Quicktime, etc.).
Il est possible de convertir des flux vidéo et audio d’un format conteneur à un autre au moyen de programmes prévus à cet effet sans que les données vidéo et audio proprement dites n’en soient affectées.
La connaissance de l’encodage des flux vidéo et audio intégrés constitue l’information centrale pour l’archivage numérique. Si cette information n’est pas connue, il est possible et souhaitable de la rechercher à l’aide de programmes appropriés.
Formats conteneurs examinés
Formats conteneurs qui ne sont pas examinés
Le graphique ci-après illustre l’évolution et la publication de la spécification d’une sélection de divers formats conteneurs. La première année indiquée signale la première apparition du format ; la seconde année indiquée signale l’année de publication de la version la plus récente du format :
Illustration 1 : évolution des différents conteneurs
Le thème de la compression des données est surtout important pour cette catégorie de formats, et ce pour les raisons suivantes :
Une compression avec pertes (par ex. les différentes normes MPEG) pratiquée lors de chaque transcodage, comme c’est le cas lors d’une migration de format, a pour conséquence une perte d’information en raison de la décompression et de la recompression ultérieure qui peut occasionner des défauts visibles (appelés artéfacts). Pour continuer le traitement, un transcodage dans un format de postproduction est généralement aussi nécessaire, l’information perdue à cause de la compression n’est en outre plus disponible. C’est la raison pour laquelle, l’archivage à long terme requiert d’ordinaire d’utiliser des algorithmes de compression sans pertes ou d’éviter d’avoir recours à la compression.
Dans le domaine de la vidéo, on utilise dans ce cas les termes de format master d’archive
D’autre part, nous sommes dans les milieux archivistiques experts en matière de gestion de l’information. Au travers du processus que nous nommons évaluation, nous renonçons à archiver des documents à la suite de réflexions archivistiques ; de la même manière, nous pouvons aussi renoncer à transmettre une qualité qui excède l’objectif de la constitution des fonds, dans un acte d’évaluation ciblée, c’est-à-dire choisir un format avec pertes, tout en sachant pertinemment qu’une partie de l’information est ainsi irrémédiablement perdue. Voir à ce sujet l’exposé que le CECO a tenu en 2019 à Prague à l’occasion du 23e congrès du groupe de travail Archivage des documents en provenance de systèmes électroniques (Archivierung von Unterlagen aus digitalen Systemen, AUdS) : Qualitative Bewertung im Hinblick auf Informationsgehalt, Verwendung und Kostenmetrik
Dans le domaine de la vidéo, on utilise dans ce cas le terme de format de diffusion.
Lors de l’archivage de données vidéo d’origine numérique (born digital), il faudrait, dans la mesure du possible, reprendre les données créées à l’origine en ce qui concerne les codecs vidéo et audio, c’est-à-dire éviter les migrations au niveau des codecs. Le conteneur vidéo approprié devrait être choisi en se fondant sur le codec.
Si un fichier vidéo déjà compressé est proposé à l’archivage, il doit également rester compressé. Il convient d’estimer si le volume des données vidéo à archiver permet de les sauvegarder sous forme non compressée ou sous une forme compressée sans pertes (format master d’archive). La décision en faveur d’une compression (format de diffusion) constitue du point de vue archivistique une décision d’évaluation : dans de nombreux cas, la compression implique de renoncer à certains aspects (qualité, utilisation ultérieure, etc.). Le mandat d’archivage, le financement à long terme et les possibilités de stockage (délocalisation éventuelle) doivent être pris en compte dans les réflexions lors de toute prise en charge sans compression.
D’autres critères entrent en ligne de compte lors du choix du format en cas de numérisation de vidéos ou de films analogiques. Un format master d’archive non compressé ou compressé sans pertes est recommandé notamment dans les cas de numérisation à des fins de sauvegarde de l’original.
Illustration 2 : cycle de vie d’une vidéo - phases inactives.
Format master d’archive (compression sans pertes)
MKV
Format de diffusion (compression avec pertes)
MKV
La section existante concernant la vidéo a été complètement remaniée dans la version 7.0 du Cfa. Comme il est recommandé de reprendre les codecs audio et vidéo si possible sans les modifier, les différents formats conteneurs ont d’abord été décrits et évalués. Vous pouvez voir dans le conteneur ou plus haut quel codec est permis ou recommandé dans quel conteneur.
La plupart des codecs audio sont décrits parmi les formats audio.
Les codecs vidéo seront décrits dans une version ultérieure du Cfa.
Le graphique ci-après présente les principaux codecs vidéo et leurs propriétés. Les charges de la propriété intellectuelle ont été estimées au mieux de nos connaissances et en toute bonne foi.
Illustration 3 : principaux codecs vidéo
Catalogue des formats de données d'archivage | version 7.0, juin 2024 |