Angesichts des Fehlens einer aussagekräftigen Vorschau ist für Audioarchivalien die präzise Verzeichnung von Metadaten umso wichtiger. Leider ist die Standardvielfalt für Audiometadaten sehr hoch. Für eingebettete Metadaten fällt die Wahl sinnvollerweise auf BWF Metadaten und RIFF INFO tags bei WAV bzw. IDv3 bei MP3. Für externe deskriptive Metadaten schlägt AudioVault aufgrund der Analyse diverser Schemata ein Minimalset von Metadaten vor, das den meisten Ansprüchen genügen sollte und in verschiedenen Metadatenschemata gespeichert werden kann; hier lautet der Vorschlag der Gruppe MPEG-7, PBCore oder EBUCore.
3. Vorschlag für ein minimales Metadatenset
4. Mapping: eingebettete – externe Metadaten
Im Gegensatz zu nahezu allen anderen digitalen Formatklassen gibt es für Audiodaten weder eine Vorschau noch eine Kurzansicht, die auf irgendeine Art automatisch zu erstellen wäre.
§ Bei Bilddaten kennen wir das Vorschaubild, die Miniatur- oder Thumbnail-Ansicht: Hier sehen wir das ganze Bild in verkleinerter Form.
§ Bei Videodaten kennen wir die Videovorschau oder Video Key Frame Extraction: Diese Vorschau zeigt uns ein Bild vom Beginn eines jeden Szenewechsels.
§ Textdokumente können entweder manuell zusammengefasst werden (Einleitung oder Management Summary) oder automatisch durch summarizing by sentence extraction (wie bei Google) oder Vorschau der ersten Seite z.B. bei PDF-Dokumenten.
Für Tondokumente kennen wir nur das Hineinhören, allenfalls unterstützt durch Vorwärtsspringen im Dokument bis zur nächsten Pause. Eine Datenkomprimierung findet aber bei dieser Art der Vorschau nicht statt.
Umso wichtiger ist für die Erschliessung das Vorhandensein von Metadaten. Es gibt genau aus diesem Grund auch eine nicht unbedeutende Anzahl von Metadatenstandards speziell für Tondokumente, die wir im Folgenden genauer betrachten wollen.
Einleitend muss unterschieden werden zwischen impliziten Metadaten (welche der Datei untrennbar innewohnen, insbesondere gewisse technische Metadaten) und expliziten Metadaten (welche zur oder in der Datei verzeichnet werden müssen). Implizite Metadaten können mit Tools aus der Audiodatei ausgelesen werden, explizite Metadaten müssen manuell erfasst werden. Im Prinzip gehören Metadaten über die Aufnahmesituation und Technik so auch zu den expliziten Metadaten, weil sie keine notwendigen Spuren in der Audiodatei hinterlassen.
Daneben kann auch zwischen de facto, archivischen und Broadcast-Metadatenstandards unterschieden werden, wobei hier die Übergänge fliessend sind:
§ Ein de facto Standard ist ID3v1 oder RIFF INFO tags,
§ Ein archivischer Standard ist EBUCore oder AES57.
§ Broadcast-Metadatenstandards gibt es mehrere, z.B. BWF, MXF oder PBCore.
Die dritte Unterscheidungsmöglichkeit besteht bezüglich des Speicherortes: Sind die Metadaten in der Audiodatei bzw. im Audiocontainer gespeichert oder ist eine externe Speicherung vorgesehen, oft Sidecar File genannt, z.B. in Form einer XML-Datei? Eingebettete Metadaten haben den Vorteil, dass sie mit der Audiodatei verbunden sind und so in jeder Anwendungsumgebung, also auch ausserhalb des Archivs, zur Verfügung stehen. Der Nachteil hingegen ist, dass beim Einfügen von Metadaten die Originaldatei verändert wird, also eine eigentliche Migration stattfindet.
Zu beachten ist noch, dass Audio-Containerformate in der Regel bereits Metadatenfelder zur Verfügung stellen. Z.B. enthält eine WAVE-Datei in der Regel bereits einen INFO Chunk[i] mit Metadatenfeldern (RIFF INFO tags genannt); weitere Chunks für andere Metadatenstrukturen sind möglich.
Es existiert eine Fülle von Standards, hier die wichtigsten:
AAF
Advanced Authoring Format ist ein Austauschformat aus dem professionellen Videobereich und soll insbesondere komplexe Produktionsprozesse erleichtern. AAF wurde durch die Advanced Media Workflow Association (AMWA) spezifiziert.
http://en.wikipedia.org/wiki/Advanced_Authoring_Format
https://www.amwa.tv/specifications
AES57-2011
AES57-2011 (vollständige Bezeichnung: AES standard for audio metadata – Audio object structures for preservation and restoration) definiert ein Vokabular für die Beschreibung struktureller und administrativer Metadaten für digitale und analoge, trägergebundene und filebasierte Audioformate. Es unterstützt insbesondere Bestandserhaltungsmassnahmen auf Audiodateien.
http://www.aes.org/publications/standards/search.cfm?docID=84
audioMD
audioMD und videoMD sind XML-Schemata für technische Metadaten von audio- und videobasierten digitalen Objekten. Sie werden oft als Extension-Schemata in Metadaten-Containerformaten wie der administrative Section von METS oder der <objectCharacteristicsExtension> von PREMIS (ab Version 2.0) gebraucht.
http://www.loc.gov/standards/amdvmd/
BWF
Das Broadcast Wave Format basiert auf dem WAV-Audiodatei-Formates. Es wurde 1997 von der Europäischen Rundfunkunion (EBU) mit Blick auf die Anforderungen des Rundfunks spezifiziert und 2001 hinsichtlich der Speicherung von Metadaten erweitert. In BWF werden die Metadaten in einer Extension Chunk genannten Erweiterung einer standardkonformen Audio-WAV-Datei gespeichert (Broadcast Extension - 'bext'). Der Anwender kann dadurch die verschiedenen Prozesse der Bearbeitung der Audiodatei und ihren aktuellen Status nachvollziehen.
https://www.aelius.com/njh/wavemetatools/doc/bwf_user_guide.pdf
EBUCore
EBUCore ist ein auf Dublin Core basierendes Set von deskriptiven und technischen Metadaten für audiovisuelle Dateien. Es wurde von der European Broadcasting Union entwickelt und ist deren zentraler Metadatenstandard.
http://tech.ebu.ch/MetadataSpecifications
https://tech.ebu.ch/docs/tech/tech3293.pdf
Exif / RIFF INFO tags
RIFF INFO tags werden u.a. in WAV-Audiodateien zur Speicherung von Metadaten verwendet. Ein Teil der INFO-tag-Metadaten stammt aus Version 2.3 des Exchangeable image file format Exif. Zu RIFF INFO tags siehe ausführlicher unten.
http://www.sno.phy.queensu.ca/~phil/exiftool/TagNames/RIFF.html#Info
http://en.wikipedia.org/wiki/Resource_Interchange_File_Format
http://en.wikipedia.org/wiki/Exchangeable_image_file_format
ID3v1
ID3v1 wurde spezifiziert, um deskriptive Metadaten in MP3-Dateien zu speichern, und entwickelte sich schnell zum de facto Standard. ID3v1-Tags können auch in WAV-Audiofiles verwendet werden.
http://en.wikipedia.org/wiki/ID3
http://www.any-audio-converter.com/howto/edit-id3-tags.php
MPEG-7
MPEG-7 (ISO/IEC 15938. Information technology -- Multimedia content description interface) ist ein ISO-Standard für die Beschreibung von multimedialen (audiovisuellen) Inhalten. Er ergänzt als Metadatenstandard die Audio- und Videoformate der MPEG-Familie.
http://mpeg.chiariglione.org/standards/mpeg-7
ftp://ftp.unicauca.edu.co/Facultades/FIET/DEIC/Materias/computacion%20inteligente/proyecto/audio_descriptors/MPEG/MPEG7/MPEG-7%20Overview.htm
MXF
Das Material eXchange Format MXF ist ein Containerformat für digitales Audio und Video im professionellen Bereich, spezifiziert in einer Serie von SMTPE-Standards. Es handelt sich um ein Subset von AAF.
http://en.wikipedia.org/wiki/Material_Exchange_Format
http://standards.smpte.org/content/978-1-61482-768-9/st-377-2004/SEC1.abstract?sid=17d9a455-cfe8-4a1a-a94a-6b9f2a0cd508
PBCore
PBCore ist ein Metadatenstandard für audiovisuelle Medien und wurde im Bereich des öffentlichen Rundfunks in den USA entwickelt.
https://pbcore.org/
http://en.wikipedia.org/wiki/PBCore
reVTMD
reVTMD ist das Extension-Schema für audiovisuelle Metadaten des US-Nationalarchivs NARA. Ein reVTMD-Ausdruck enthält technische und Prozess-Metadaten, welche ein digitales Video-Objekt beschreiben.
http://www.archives.gov/preservation/products/reVTMD.xsd
Eine Bewertung der verschiedenen Metadatenstandards aus archivischer Sicht ist nicht einfach, gerade auch, weil sich die Spezialarchive für Tondokumente hierin nicht einig sind und oft selbst entwickelte Lösungen anwenden, und weil die Broadcastindustrie immer neue Austauschstandards für ihre an sich proprietären Lösungen entwickelt.
Betrachten wir die Fragestellung aus einem eher pragmatischen Gesichtspunkt und fragen wir, welche eingebetteten Metadaten in den von uns für die Archivierung in Betracht gezogenen Formaten WAVE und MP3 eine grosse Verbreitung haben und von vielen Tools unterstützt werden, sieht die Sache etwas einfacher aus.
RIFF INFO tags sind Bestandteil des WAVE-Containers, genau genommen sind es Tag-Metadaten Paare, die den INFO Chunk bilden. Die BWF (Broadcast Wave Format) Spezifikation erweitert dieses Konzept durch einen weiteren Broadcast Extension Chunk (bext). RIFF INFO tags werden von vielen Tools bei der Produktion und beim Abspielen unterstützt, wobei aus einer grossen Zahl von Tags nur neun Tags[ii] einen Status als de facto Standard erlangt haben. Übernommene Audiodateien in WAVE-Format werden in der Regel bereits in INFO-tags kodierte Metadaten enthalten.
Sollen weitere Metadaten zur Produktion oder Migrationsgeschichte eingebettet werden, drängt sich aber eher BWF (Broadcast Wave Format) auf, da es sich hierbei um einen klar spezifizierten Standard handelt.
Bei MP3 sieht die Sache anders aus, da BWF, wie der Name sagt, an das WAVE-Containerformat gebunden ist. ID3v1 ist hier der de facto Standard. ID3v1-Metadaten können auch in einen WAVE Chunk eingebettet werden, was aber eher unüblich ist.
Ein teilweises Mapping zwischen RIFF INFO tags und ID3v1 ist möglich, siehe dazu weiter unten.
Das Auslesen der eingebetteten Metadaten aus WAVE- und MP3-Dateien wird wohl auch längerfristig kein Problem bereiten, weil diese Metadaten sehr einfach strukturiert sind. Die automatische Konvertierung in andere Metadatenschemata ist wohl längerfristig nur bei den BWF-Metadaten möglich, weil hier die Metadaten klar definiert sind. Bei RIFF INFO tags und ID3v1 ist dazu wahrscheinlich jeweils ein Mapping neu zu definieren.
RIFF INFO tags: Eingebettete (embedded) Metadaten dieses Typs werden in Audioplayern wie iTunes® oder Windows Media Player angezeigt. Die Liste der RIFF INFO tags umfasst mehr als 80 Metadaten[iii], die im Info und fmt Chunk untergebracht sind. Der Audacity Metadata Editor unterstützt die neun wichtigsten, nämlich:
§ Artist (IART)
§ Title (INAM) – im Metadata Editor "Track Title" genannt
§ Product (IPRD) – im Metadata Editor "Album Title" genannt, ab Audacity 2.0.4 unterstützt
§ Track Number (ITRK) – im originalen RIFF-Standard nicht spezifiziert, aber gewöhnlich unterstützt, in Audacity ab Version 2.0.4
§ Date Created (ICRD) – im Metadata Editor "Year" genannt
§ Genre (IGNR), ab Audacity 2.0.4 unterstützt
§ Comments (ICMT)
§ Copyright (ICOP)
§ Software (ISFT)
Mit Kommandozeilentools wie etwa SoX, riffwalk, getID3 etc. können alle RIFF Tags vollständig ausgelesen werden.
ID3v1 Tags: Die gleichen oder ähnlichen Metadaten finden wir in MP3-Dateien als ID3v1 Tags[iv]:
Field | Length | Description |
header | 3 | "TAG" |
title | 30 | 30 characters of the title |
artist | 30 | 30 characters of the artist name |
album | 30 | 30 characters of the album name |
year | 4 | A four-digit year |
comment | 28 / 30 | The comment. |
zero-byte | 1 | If a track number is stored, this byte contains a binary 0. |
track | 1 | The number of the track on the album, or 0. Invalid, if previous byte is not a binary 0. |
genre | 1 | Index in a list of genres, or 255 |
Bzw. zusätzlich als ID3 extended Tags mit der Möglichkeit, längere Metadatenstrings zu schreiben.
Field | Length | Description |
header | 4 | "TAG+" |
title | 60 | 60 characters of the title |
artist | 60 | 60 characters of the artist name |
album | 60 | 60 characters of the album name |
speed | 1 | 0=unset, 1=slow, 2= medium, 3=fast, 4=hardcore |
genre | 30 | A free-text field for the genre |
start-time | 6 | the start of the music as mmm:ss |
end-time | 6 | the end of the music as mmm:ss |
Hier dargestellt mit MusicBrainz Picard:
Inhärente technische Metadaten: Neben den eingebetteten inhaltlichen oder externen Metadaten gibt es noch die technischen Metadaten. Diese sind analog zu den im Audio-Container gespeicherten, aber im Gegensatz dazu immer vorhanden, sind in einer WAVE Datei im fmt Chunk gespeichert oder können aus dem data Chunk[v] berechnet werden. Hier dargestellt mit
Digimetrics MediaInfo:
und in Tabellenform:
Externe Metadaten, meist als XML-Standard definiert, dienen der erweiterten Beschreibung eines Audioobjekts. Oft handelt es sich dabei aber auch nur um eine Extraktion eingebetteter technischer oder inhaltlicher Metadaten. In diesem Fall besteht der Nutzen einzig in der besseren Lesbarkeit.
Besonders oft wird MPEG-7 in diesem Zusammenhang erwähnt. Da es explizit ein offener Metadatenstandard zur Beschreibung von audiovisuellen Objekten ist, scheint MPEG-7 für archivische Belange geeignet. Leider hat dieser Standard, wohl wegen seiner Komplexität, bis anhin eine sehr geringe Verbreitung und kann darum nicht wirklich empfohlen werden.
Alternativen dazu sind PBCore und EBUCore. Beide Standards definieren ein Set von Metadaten, das in einer Datenbank oder in XML-Dateien abgebildet werden kann. PBCore ist die ältere, amerikanische Variante und ist einfacher strukturiert, EBUCore hingegen ist auf der Grundlage von DublinCore entwickelt worden. Aus geografischer Sicht und weil DC bereits in der europäischen Bibliotheks- und Archivwelt eingeführt ist, empfiehlt sich wohl EBUCore.
Externe Metadaten können als eigenständige XML-Datei als sogenanntes Sidecar File, das heisst als Datei mit demselben Dateinamen wie die Audiodatei, aber mit der Dateiextension XML, abgelegt werden. Sie können aber auch in einer Datenbank gespeichert oder als XML-Datei in einem XML-Wrapper in einem grösseren Metadatenzusammenhang, z.B. in einer METS-Metadatendatei als Ergänzung zu den übrigen Metadaten eines Archivobjekts abgespeichert sein.
PBCore: Hier ein Beispiel von technischen Metadaten im PBCore-Standard. Eingebettete Metadaten können in der Regel mit geeigneten Tools automatisch extrahiert werden. Die inhaltlichen Metadaten identifier, title, description etc. müssen, wenn sie nicht bereits eingebettet vorhanden sind, in der Metadaten-XML-Datei manuell eingetragen werden.
<?xml version="1.0" encoding="UTF-8"?>
<PBCoreDescriptionDocument xsi:schemaLocation="http://www.pbcore.org/PBCore/PBCoreNamespace.html http://www.pbcore.org/PBCore/PBCoreXSD_Ver_1-2-1.xsd" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://www.pbcore.org/PBCore/PBCoreNamespace.html">
<!-- Generated at 2013-10-31T16:15:28Z by MediaInfoLib - v0.7.63 -->
<!-- Warning: MediaInfo outputs only pbcoreInstantiation, other mandatory PBCore data is junk -->
<pbcoreIdentifier>
<identifier>***</identifier>
<identifierSource>***</identifierSource>
</pbcoreIdentifier>
<pbcoreTitle>
<title>***</title>
</pbcoreTitle>
<pbcoreDescription>
<description>***</description>
<descriptionType>***</descriptionType>
</pbcoreDescription>
<pbcoreInstantiation>
<pbcoreFormatID>
<formatIdentifier>Chimes</formatIdentifier>
<formatIdentifierSource version="PBCoreXSD_Ver_1.2_D1">File Name</formatIdentifierSource>
</pbcoreFormatID>
<formatDigital>audio/vnd.wave</formatDigital>
<formatLocation>P:\KOST\Pilotloesungen\AudioVault\03_Dokumentation\RIFF Sample\Chimes.wav</formatLocation>
<formatMediaType version="PBCoreXSD_Ver_1.2_D1">Sound</formatMediaType>
<formatGenerations version="PBCoreXSD_Ver_1.2_D1" />
<formatFileSize>15932</formatFileSize>
<formatDuration>00:00:00.720</formatDuration>
<formatDataRate>177022 CBR</formatDataRate>
<formatTracks>1</formatTracks>
<pbcoreEssenceTrack>
<essenceTrackType>Audio</essenceTrackType>
<essenceTrackIdentifier>0</essenceTrackIdentifier>
<essenceTrackIdentifierSource>StreamKindID (Mediainfo)</essenceTrackIdentifierSource>
<essenceTrackEncoding>PCM (1)</essenceTrackEncoding>
<essenceTrackDataRate>176400 CBR</essenceTrackDataRate>
<essenceTrackDuration>720</essenceTrackDuration>
<essenceTrackBitDepth version="PBCoreXSD_Ver_1.2_D1">8</essenceTrackBitDepth>
<essenceTrackSamplingRate>22050</essenceTrackSamplingRate>
<essenceTrackAnnotation>Count: 220|StreamCount: 1|StreamKind: Audio|StreamKindID: 0|Format: PCM|Format_Commercial: PCM|Format_Settings: Little / Unsigned|Format_Settings_Endianness: Little|Format_Settings_Sign: Unsigned|CodecID: 1|CodecID/Url: http://www.microsoft.com/windows/|Codec: PCM|Codec/Family: PCM|Codec/Info: Microsoft PCM|Codec/Url: http://www.microsoft.com/windows/|Codec/CC: 1|Codec_Settings: Little / Unsigned|Codec_Settings_Endianness: Little|Codec_Settings_Sign: Unsigned|Duration: 720|BitRate_Mode: CBR|BitRate: 176400|Channel(s): 1|SamplingRate: 22050|SamplingCount: 15876|Resolution: 8|BitDepth: 8|StreamSize: 15876|StreamSize_Proportion: 0.99649</essenceTrackAnnotation>
</pbcoreEssenceTrack>
</pbcoreInstantiation>
</PBCoreDescriptionDocument>
MPEG-7: Das gleiche Beispiel im MPEG-7-Metadatenstandard:
<!-- Generated at 2013-10-31T16:19:10+00:00 by MediaInfoLib - v0.7.63 -->
<mpeg7:Mpeg7 xmlns="urn:mpeg:mpeg7:schema:2004" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:mpeg7="urn:mpeg:mpeg7:schema:2004" xsi:schemaLocation="urn:mpeg:mpeg7:schema:2004 http://standards.iso.org/ittf/PubliclyAvailableStandards/MPEG-7_schema_files/mpeg7-v2.xsd">
<mpeg7:DescriptionMetadata>
<mpeg7:PrivateIdentifier>Chimes.wav</mpeg7:PrivateIdentifier>
<mpeg7:CreationTime>2013-10-31T16:19:10+00:00</mpeg7:CreationTime>
<mpeg7:Instrument>
<mpeg7:Tool>
<mpeg7:Name>MediaInfoLib - v0.7.63</mpeg7:Name>
</mpeg7:Tool>
</mpeg7:Instrument>
</mpeg7:DescriptionMetadata>
<mpeg7:Description xsi:type="ContentEntityType">
<mpeg7:MultimediaContent xsi:type="AudioType">
<mpeg7:Audio>
<mpeg7:MediaInformation>
<mpeg7:MediaProfile>
<mpeg7:MediaFormat>
<mpeg7:Content href="urn:mpeg:mpeg7:cs:ContentCS:2001:1">
<mpeg7:Name xml:lang="en">Audio</mpeg7:Name>
</mpeg7:Content>
<mpeg7:FileFormat href="urn:mpeg:mpeg7:cs:FileFormatCS:2001:9">
<mpeg7:Name xml:lang="en">wav</mpeg7:Name>
</mpeg7:FileFormat>
<mpeg7:FileSize>15932</mpeg7:FileSize>
<mpeg7:BitRate variable="false">177022</mpeg7:BitRate>
<mpeg7:AudioCoding>
<mpeg7:Format href="urn:mpeg:mpeg7:cs:AudioCodingFormatCS:2001:8">
<mpeg7:Name xml:lang="en">Linear PCM</mpeg7:Name>
</mpeg7:Format>
<mpeg7:AudioChannels>1</mpeg7:AudioChannels>
<mpeg7:Sample rate="22050" bitsPer="8"/>
<mpeg7:Presentation href="urn:mpeg:mpeg7:cs:AudioPresentationCS:2001:2">
<mpeg7:Name>mono</mpeg7:Name>
</mpeg7:Presentation>
</mpeg7:AudioCoding>
</mpeg7:MediaFormat>
</mpeg7:MediaProfile>
</mpeg7:MediaInformation>
<mpeg7:MediaTime>
<mpeg7:MediaTimePoint>T00:00:00:0F1000</mpeg7:MediaTimePoint>
<mpeg7:MediaDuration>PT0H0M0S15876N22050F</mpeg7:MediaDuration>
</mpeg7:MediaTime>
</mpeg7:Audio>
</mpeg7:MultimediaContent>
</mpeg7:Description>
</mpeg7:Mpeg7>
Die verwirrende Menge der Metadatenmodelle und die hohe Zahl verfügbarer Metadatenfelder zwingen uns zu einer Reduktion in der konkreten Anwendung. Nur so ist ein vernünftiges Mapping zwischen eingebetteten Metadaten und erweiterten Metadatenstandards möglich.
Der Vergleich diverser Metadaten-Schemata sowie verschiedener Audioarchive[vi] führt zum folgenden Vorschlag eines minimalen Metadatensets, bestehend aus
Identifier, Title, Creator, Description, Technical Data und Coding History.
(Identifier)
Title / Titel / Musikwerktitel
Autor / Interpret / Urheber / Creator
Sprache / Stimme
Musikinstrument
Aufnahmedatum
Aufnahmeort
Beschreibung / Inhalt / Enthält – Darin / Description
Kategorie / Musikart
Regie
Aufnahmetechnik (Techniker)
Copyright
Technical Data:
Dateiformat
/ Format / Medium
Aufnahmedauer / Laufzeit
Abtastrate / Samplingrate
Bitrate, Bit/s (konstante Bitrate, CBR - variable Bitrate, VBR)
Anzahl Aufnahmekanäle
Umfang (Dateigrösse?)
Coding History:
Technische
Aufnahmeausrüstung (Gerät, Modell, etc.)
Software für die Aufbereitung und Konvertierung
Info zum Tonträger / Bild des Originaltonträger
Original oder Kopie
Wie schon oben erwähnt sind die technischen Metadaten ein inhärenter Teil des Audiocontainers und stehen immer zur Verfügung; um ihre Erfassung müssen wir uns nicht kümmern.
Minimale Metadaten |
RIFF Info Tags |
ID3 |
PBCore |
(Identifier) |
ISRC code[vii] |
ISRC code |
pbcoreIdentifier |
Title / Titel / Musikwerktitel |
Title (INAM) |
title |
pbcoreTitle |
Autor / Interpret / Urheber / Creator |
Artist (IART) |
artist |
pbcoreCreator |
Sprache / Stimme |
Language (LANG) |
|
instantiationLanguage |
Musikinstrument |
|
|
|
Aufnahmedatum |
Date Created (ICRD) |
year |
pbcoreAssetDate |
Aufnahmeort |
Location (LOCA) |
|
|
Beschreibung / Inhalt / Enthält – Darin / Description |
Comments (ICMT) |
comment |
description |
Kategorie / Musikart |
Genre (IGNR) |
genre |
pbcoreGenre |
Regie |
|
|
|
Aufnahmetechnik (Techniker) |
Software (ISFT) |
|
|
Copyright |
Copyright (ICOP) |
|
pbcoreRightsSummary |
|
RIFF fmt Tags |
|
|
Dateiformat / Format / Medium |
Encoding |
|
instantiationDigital |
Aufnahmedauer / Laufzeit |
berechnet |
|
instantiationDuration |
Abtastrate / Samplingrate |
SampleRate |
|
essenceTrackSamplingRate |
Bitrate, Bit/s (konstante Bitrate, CBR - variable Bitrate, VBR) |
BitsPerSample |
|
instantiationDataRate |
Anzahl Aufnahmekanäle |
NumChannels |
|
instantiationTracks |
Umfang (Dateigrösse?) |
berechnet |
|
instantiationFileSize |
|
RIFF exif Tags |
|
|
Technische Aufnahmeausrüstung (Gerät, Modell, etc.) |
Make (ECOR) |
|
|
Software für die Aufbereitung und Konvertierung |
Model (EMDL) |
|
|
Info zum Tonträger / Bild des Originaltonträger |
Related Image File (EREL) |
|
instantiationMediaType |
Original oder Kopie |
|
|
|
In unserem Projekt gehen wir davon aus, dass bereits aufgenommene Audiodateien ins Archiv gelangen. Die Digitalisierung von Audiodatenträgern im Archiv oder vom Archiv haben wir im früheren Projekt „Sauver les CD“[viii] bereits behandelt.
Die Aufnahmen stammen also von einem Produzenten, der möglicherweise nicht unbedingt die Archivierung als Ziel im Auge hatte. Wir müssen damit leben, dass die von uns definierten minimalen Metadaten nicht wirklich oder auch nicht in sinnvoller Form in den Audiodateien oder als externe Metadaten vorliegen. Haben wir Einfluss auf die Produktion, wie das zum Beispiel bei Tonprotokollen der Fall sein kann, können wir darauf drängen, dass das vom Archiv empfohlene Audioformat[ix] mit entsprechender Qualität verwendet und dass die im jeweiligen Produktionssystem möglichen Metadaten auch wirklich gesetzt werden.
Bei der Datenübernahme bzw. beim Pre-Ingest ist es sinnvoll, die eingebetteten Metadaten in die externen Metadaten (z.B. im XML-Format) zu übernehmen. Dabei ist aber eine Kontrolle unumgänglich. Nur die technischen Metadaten sind aus dieser Quelle verlässlich, schon die Entitäten Title, Creator und Description sind möglicherweise bei der Produktion nicht korrekt gesetzt worden. Selten sind Informationen zur Coding History verfügbar, wenn es sich nicht um BWF-Dateien handelt, die aus einem professionellen Broadcast System stammen. Informationen zur Coding History stehen aber in der Regel für eine Übernahme global als Information vom Produzenten zur Verfügung und können in die externen Metadaten übernommen werden.
Beim Pre-Ingest oder beim Ingest stellt sich die Frage, ob fehlende oder fehlerhafte eingebettete Metadaten mit den gesammelten neuen Metadaten ergänzt oder korrigiert werden sollen.
Das ist eine schwierige und auch prinzipielle Frage. Obwohl mit sogenannten Metadateneditoren, auch automatisiert auf der Kommandozeile, eingebettete Metadaten in die WAVE-Datei geschrieben werden können, ohne dass der im Container eingebettete Datenstrom, der den Ton repräsentiert, verändert wird, ist dieses Neu-Schreiben des Containers eine eigentliche Datenmigration. Es will genau überlegt sein, ob eine solche Migration zu Beginn der Archivierung durchgeführt werden soll, wenn die Metadaten auch ohne Verlust extern verwaltet werden können, denn eine Migration ist immer mit Risiken behaftet.
Externe Metadaten in einem der vorgeschlagenen Formate MPEG-7 oder EBUCore können im Ingest anschliessend problemlos ins Findmittel oder AIS übernommen werden und bilden dort die Grundlage für die Erschliessung.
Wird zu irgendeinem Zeitpunkt eine Zugangskopie der originalen Audiodatei erstellt, z.B. eine MP3-Datei zur Vermittlung über das Internet, ist unbedingt darauf zu achten, dass die extern vorhandenen Metadaten möglichst vollständig in die Zugangskopie eingebettet werden. Hierbei sind die de facto Standards RIFF INFO tags und ID3v1 angezeigt.
Je nach Herkunft der Daten (bereits digitale Tondokumente oder selbst digitalisiertes analoges Material), sind unterschiedlich viele und aussagekräftige eingebettete Metadaten verfügbar.
Die eingebetteten Metadaten müssen beim Pre-Ingest mit externen Informationen ergänzt und abgeglichen werden und am besten für Ingest und Archivierung in eine externe Metadatendatei exportiert werden. Diese externe Metadaten können dann auch einfach ins archiveigene Findmittel übernommen werden und vereinfachen die Erschliessung.
Einzelne Archive mögen sich auch dafür entscheiden, wichtige Metadaten wieder in die Audiodatei zurückzuschreiben; dazu eignet sich das Format BWF am besten. Die Arbeitsgruppe AudioVault möchte das generell nicht empfehlen.
Hingegen ist es sinnvoll, Zugangskopien (MP3 oder Flac) mit eingebetteten Metadaten anzureichern, um dem Benutzer schon im Player entsprechende Metadaten anzuzeigen.
P:\KOST\Pilotloesungen\AudioVault\04_Publikation\AudioVault_Metadaten_Standards&Probleme_v0.2.docx 02.04.2015 10:31:06
[i] Ein Chunk in einer WAVE-Datei ist ein strukturierter Containerteil, der Metadaten für verschiedene Zwecke enthalten kann (z.B. Playliste). Ein unbekannter Chunk wird von einem Abspielprogramm einfach ignoriert. Der INFO Chunk ist ein List Chunk, d.h er ist als Liste von Tags mit Metadatenstrings organisiert.
[ii] Artist (IART), Title (INAM), Product (IPRD) ,Track Number (ITRK), Date Created (ICRD), Genre (IGNR), Comments (ICMT), Copyright (ICOP) und Software (ISFT).
[v] Der data Chunk enthält die eigentlichen PCM-kodierten Audiodaten
[vi] Fonoteca Nazionale Svizzera, Österreichisches Phonogrammarchiv, Deutsches Bundesarchiv, Regensburger Archiv für Werbeforschung, Phonogrammarchiv Universität Zürich, British Library – Sound & Moving Image, BBC Archive, Memoriav memobase und IASA-TC04 Guidelines.
[vii] International Standard Recording Code (ISRC, ISO 3901) http://de.wikipedia.org/wiki/International_Standard_Recording_Code
[viii] Beim Digitalisieren von Audio-CDs sind eine Abtastrate von 44,1 kHz und einer Sampletiefe von 16 Bit vorgegeben, bei anderen analogen Datenträgern kann bei der Digitalisierung eine höhere Qualität sinnvoll sein. Memoriav und die Fonoteca Nazionale Svizzera empfehlen hier > 96 kHz und 24 Bit.
[ix] Siehe Empfehlungen der KOST: WAVE PCM kodiert, je nach Produktionssituation mit einer Abtastrate von 48 oder 44,1 kHz und einer Sampletiefe von 16 oder 24 Bit https://kost-ceco.ch/wiki/whelp/KaD/pages/WAV.html. Dies korrespondiert mit den Empfehlungen der IASA: http://www.iasa-web.org/tc04/key-digital-principles.
AudioVault_Metadaten_Standards&Probleme.pdf, 573.1K, 04.09.24