DE  |  FR  |  IT

Qui archive le web et comment?

Jusqu'ici, l'archivage de contenus web n'était pas la grande priorité de la plupart des archives membres. Outre les réserves émises sur la complexité technique de la tâche, la retenue était souvent motivée par un certain flou autour de son ampleur. Le but du Colloque du CECO de cette année était d'apporter des éclaircissements sur le sujet au travers d'échanges entre bibliothèques et archives suisses et étrangères.

Dans une première partie, différentes institutions ont montré sous quel angle elles appréhendaient la problématique. En introduction, Barbara Signori (Bibliothèque nationale suisse BN) a présenté Archives Web Suisse. Kerstin Brunner (AEBS), Felix Stadler (AESG), Martin Akeret (AESH) et Krystyna Ohnesorge (AFS) ont mis en perspective, au travers de quatre brefs témoignages, l'état des réflexions et des activités dans certaines archives membres du CECO avec cette initiative majeure d'archivage du Web en Suisse. Un rapport des Archives du land de Bade-Wurtemberg (LA-BW, Johannes Renz) est venu compléter ces approches, limitées dans leur ampleur, par la présentation d'archives web déjà en service dans de grandes archives d'État. Durant la deuxième partie, Sara Aubry de la Bibliothèque nationale de France (BnF), une des institutions pionnières au niveau mondial, a présenté les outils de moissonnage du Web (web harvesting) développés dans le cadre de l'IIPC. Pour terminer, Simon Scheurer (Qumram AG, Zurich) a présenté d'autres procédés techniques possibles.

Voici trois des nombreux enseignements tirés des présentations et de la discussion :

  • L'archivage de contenus web est encore souvent paré d'une aura extraordinaire, comme si cette tâche ne relevait pas des affaires courantes des archives. Pour-tant, celles-ci se doivent d'avoir pour objectif de traiter les contenus web ayant une valeur archivistique dans les mêmes processus ou, du moins partiellement, avec les mêmes outils que toutes les archives numériques. Mentionnons, à ce titre, les efforts des AFS, dans le cadre de leur étude de faisabilité en collaboration avec le DFAE, pour archiver les sites web importants dans les processus établis par les AFS ainsi que la localisation des ressources web dans la structure hiérarchique des archives et leur description dans l'AIS par les LA-BW.

  • Lors de l'archivage web, les bibliothèques suivent un mandat de collection d'envergure plus ou moins importante selon le contexte législatif. En France, le dépôt légal autorise la BnF à archiver la totalité du domaine .fr ainsi que d'autres sites de France. La BN archive des sites de Suisse en fonction d'une sélection basée sur des critères définis. Alors que certaines archives comme les LA-BW constituent parfois aussi des collections, la nature archivistique effective de l'archivage web est plus difficilement saisissable. En vertu du point 1 ci-dessus, il faut utiliser les mêmes critères d'évaluation pour les sites internet et intranet que pour les documents ordinaires de l'Administration. Jusqu'ici, il n'a été décidé qu'au cas par cas ce que cela signifie concrètement et où se situe exactement la limite de la collection documentaire.

  • L'approche diffusée par l'IIPC et utilisée par de nombreuses institutions patrimoniales est le moissonnage de ressources web et l'archivage des fichiers dans leurs formats d'origine. Si, à moyen terme, le format ouvert et standardisé HTML ne pose que très peu de problèmes, il en existe toutefois pour les fichiers insérés, les contenus actifs et multimédias. C'est pourquoi, dans certaines circonstances, il est indiqué de renoncer à certaines fonctionnalités par un archivage en format PDF. Pour les ressources du Web 2.0 et les sites interactifs, il convient de procéder à un archivage basé non pas sur les contenus, mais sur les transactions, comme le décrit l'entreprise Qumram.

Documentation

2013-05-27_Kolloquium_Programm.pdf, 82.2K, 16.04.13
Programme

2013-05-27_Webarchivierung_PraesentationSignori.pdf, 2M, 12.06.13
Signori: Das Webarchiv Schweiz verbindet: Kompetenzen, Ressourcen und Websites

2013-05-27_Webarchivierung_PraesentationBrunner.pdf, 105.7K, 12.06.13
Brunner: Kurzstatement zum Stand der Web-Archivierung im Staatsarchiv Basel-Stadt

2013-05-27_Webarchivierung_PraesentationOhnesorge.pdf, 1M, 12.06.13
Ohnesorge: Webarchivierung BAR

2013-05-27_Webarchivierung_PraesentationRenz.pdf, 1.9M, 12.06.13
Renz: Keine Angst vor der "Schlange" - das Landesarchiv Baden-Württemberg als Partner des Webarchivs BOA

2013-05-27_Webarchivierung_PraesentationAubry.pdf, 2M, 12.06.13
Aubry: Des outils pour archiver le Web : l'expérience de la Bibliothèque nationale de France

2013-05-27_Webarchivierung_PraesentationScheurer.pdf, 3M, 12.06.13
Scheurer: Web 3.0 und Langzeittauglichkeit