Phasen bei der Archivierung von Dateiablagen
Zweite Phase: Paketbildung und Metadatierung
Die Paketbildung und eine erste Metadatierung erfolgt in den Archiven mit unterschiedlichen Tools (docuteam packer, BAR Package Handler und Apache Spark, weniger in der Schweiz gebräuchlich: ByteBarn, PreIngest Toolkit PIT und DIMAG IngestTool)
Diese Tools unterscheiden sich stark bezüglich des generierten SIP-Formats und der Möglichkeiten der Metadatenannotation im generierten SIP, aber auch in den Möglichkeiten, das Paket noch zu bearbeiten und diese Veränderungen zu dokumentieren.
Die verschiedenen Ansätze werden untersucht und verglichen.
Best Practice
Wie AfZ mit Minimalset (Titel, Signatur, Entstehungszeitraum, Schutzfrist), aber bei uns wird im AIS noch ergänzt, da der packer nicht alles abdeckt. Bei grösseren Beständen ist es sinnvoll, bereits im packer auch weitere deskriptive Metadaten zu erfassen, die dann über die EAD-Schnittstelle ins CMI AIS importiert werden können. (UAZ, ETHZ)
Für den Package Handler (PH) haben wir eine benutzerfreundlichere Kurzanleitung erstellt (Vorlage vom StAZH). Pakete werden gemäss eCH-0160 gebildet. Im PH werden nur rudimentär Metadaten erfasst (Titel, Ablieferungsnummer, abliefernde Stelle, Zeitraum, Schutzfrist, -kategorie, Systemname, Systembeschreibung, Erscheinungsform). PH enthält eine integrierte Validierung (Pfadlänge, Dateinamen, Paketstruktur). Fehler müssen manuell abgearbeitet werden. Die Validierung des Pakets und der Formate muss mit KOST-VAL nachträglich erfolgen. Invalide Dateien werden (allenfalls nach Rücksprache mit der KOST) behoben oder belassen. In der technischen Dokumentation wird vermerkt, falls das Paket nicht 100% valide ist. Das Validierungsprotokoll wird im Ablieferungsdossier abgelegt. Das valide SIP wird auf einem separaten Serverlaufwerk zwischengelagert, bis es ingestiert wird (STASZ)
Metadatierung im Docuteam Packer mit einem minimalen Metadatenset (Titel, Zeitraum, Verwaltungssignatur (falls vorhanden), Archivsignatur auf Stufe Bestand/Teilbestand). Ergänzung der deskriptiven Metadaten im AIS. Grundsätzlich ist eine Übernahme weitere deskriptiver Metadaten ins SIP auch automatisiert möglich (Docuteam Workflow „CreateSIPFromExcel“), bei Fileablagen sind aber meistens ausser Titel und Entstehungszeitraum keine weiteren Metadaten vorhanden. (StAOW)
Literatur