Benutzer-Werkzeuge

Webseiten-Werkzeuge


paketbildung

Phasen bei der Archivierung von Dateiablagen
Zweite Phase: Paketbildung und Metadatierung

Paketbildung und Metadatierung

Die Paketbildung und eine erste Metadatierung erfolgt in den Archiven mit unterschiedlichen Tools (docuteam packer, BAR Package Handler und Apache Spark, weniger in der Schweiz gebräuchlich: ByteBarn, PreIngest Toolkit PIT und DIMAG IngestTool)

Diese Tools unterscheiden sich stark bezüglich des generierten SIP-Formats und der Möglichkeiten der Metadatenannotation im generierten SIP, aber auch in den Möglichkeiten, das Paket noch zu bearbeiten und diese Veränderungen zu dokumentieren.

Die verschiedenen Ansätze werden untersucht und verglichen.

Tools

  • BAR Package Handler und KOST-Val (STASZ)
  • Microsoft Excel (Feeder-Workflow SIP from Excel) (SAB: Wird von uns oft anstelle des docuteam Packers eingesetzt, weil aus unserer Sicht für grosse Datenmengen effizienter (v.a. Metadatierung). Packetbildung erfolgt mittels „Link“ auf Dateipfad (Speicherort))

Best Practice

  • geplantes Vorgehen: Metadatierung / Verzeichnung im docuteam Packer mit einem Minimal-Set an Feldern. Offen ist, ob für die Verzeichnung von digital born allgemein ein reduziertes Metadaten-Set verwendet werden soll oder ob (bzw. in welchem Fall) die Metadaten im AIS noch ergänzt werden. (AfZ)
  • Wie AfZ mit Minimalset (Titel, Signatur, Entstehungszeitraum, Schutzfrist), aber bei uns wird im AIS noch ergänzt, da der packer nicht alles abdeckt. Bei grösseren Beständen ist es sinnvoll, bereits im packer auch weitere deskriptive Metadaten zu erfassen, die dann über die EAD-Schnittstelle ins CMI AIS importiert werden können. (UAZ, ETHZ)
  • Für den Package Handler (PH) haben wir eine benutzerfreundlichere Kurzanleitung erstellt (Vorlage vom StAZH). Pakete werden gemäss eCH-0160 gebildet. Im PH werden nur rudimentär Metadaten erfasst (Titel, Ablieferungsnummer, abliefernde Stelle, Zeitraum, Schutzfrist, -kategorie, Systemname, Systembeschreibung, Erscheinungsform). PH enthält eine integrierte Validierung (Pfadlänge, Dateinamen, Paketstruktur). Fehler müssen manuell abgearbeitet werden. Die Validierung des Pakets und der Formate muss mit KOST-VAL nachträglich erfolgen. Invalide Dateien werden (allenfalls nach Rücksprache mit der KOST) behoben oder belassen. In der technischen Dokumentation wird vermerkt, falls das Paket nicht 100% valide ist. Das Validierungsprotokoll wird im Ablieferungsdossier abgelegt. Das valide SIP wird auf einem separaten Serverlaufwerk zwischengelagert, bis es ingestiert wird (STASZ)
  • Metadatierung im Docuteam Packer mit einem minimalen Metadatenset (Titel, Zeitraum, Verwaltungssignatur (falls vorhanden), Archivsignatur auf Stufe Bestand/Teilbestand). Ergänzung der deskriptiven Metadaten im AIS. Grundsätzlich ist eine Übernahme weitere deskriptiver Metadaten ins SIP auch automatisiert möglich (Docuteam Workflow „CreateSIPFromExcel“), bei Fileablagen sind aber meistens ausser Titel und Entstehungszeitraum keine weiteren Metadaten vorhanden. (StAOW)
  • Metadatierung in Excel File gemäss Erschliessungshandbuch (anstelle des docuteam Packer, danach Ingest-Workflow SIP from Excel). Wir ergänzen keine weiteren Metadaten im AIS (Ziel: identische Metadaten im Repository und AIS) (SAB/StAZG)

Literatur

/home/kostceco/public_html/kostwiki/data/pages/paketbildung.txt · Zuletzt geändert: 2021/01/15 14:06 von marion.wullschleger