DE FR IT

MRC

MRC-Komprimierung bei PDF/A

[29-05-2017] Eignet sich die MRC-Komprimierung bei einem Digitalisierungsprojekt mit PDF/A?

MRC (Mixed Raster Content) ist genau genommen keine Komprimierung, sondern meint die Anwendung unterschiedlicher Kompressionsmethoden in verschiedenen Bereichen der gescannten Seite, also z.B. Fax G4 für schwarze Schrift und JPEG für Bilder. Damit kommt die jeweils qualitativ und quantitativ beste Komprimierung zum Einsatz. JPEG und JPEG2000 führen bei Schrift zu Artefakten, Fax G4 und JBIG2-Komprimierung eignet sich im Prinzip nur für einfarbige Bilder. Durch die Verwendung von Layern, wie sie in PDF vorgesehen sind, kann die Komprimierung auch im farbigen Bereich noch weiter optimiert werden. Die gleiche Technologie wird bei DjVu verwendet: https://de.wikipedia.org/wiki/DjVu. Für weiterführende Informationen siehe eine Präsentation von LuraTech zu diesem Thema: http://www.doc-forum.de/downloads/DocForum_Was_ist_PDFA-2_Heiermann.pdf. (Das Papier ist etwas sehr enthusiastisch - LuraTech ist einer der führenden Anbieter dieser Technik -, aber der Sachverhalt ist korrekt dargestellt.)

Im Gegensatz zu „einfachen“ Komprimierungsalgorithmen wie etwa JPEG, die über das ganze Rasterbild gleich angewendet werden, ist die MRC-Qualität, besonders was den Komprimierungsfaktor betrifft, sehr stark von der eingesetzten Software abhängig. Ein PDF von der gleichen gescannten Seite kann also bei MRC-Komprimierung mit dem besseren Algorithmus durchaus zehnmal kleiner werden als mit einem anderen, ohne dass es zu einem Qualitätsverlust kommen würde. Der Grund dafür ist, dass die Software erst die qualitativ unterschiedlichen Bereiche identifizieren und dann die bestmögliche Komprimierungsstrategie anwenden muss.

Leider hat die Praxis gezeigt, dass die Verwendung von MRC auf unterschiedliche Daten jeglicher Art und Qualität noch nicht ausgereift ist. Insbesondere bei Bildern mit einer geringen Qualität (z.B. Screenshot) ist ein Qualitätsverlust häufig. Dies hat die PDF/A-Konverter-Studie, 2017 gezeigt. Die Qualität von Foxit (ehemals LuraTech) und Intarsys erfüllt unsere Erwartungen noch nicht.


Fazit: Von einen allgemeine Verwendung der MRC-Komprimierung wird den Archiven abgeraten. Die MRC-Komprimierung kann aber für Scandienstleister, welche homogene Unterlagen wie zum Beispiel Bücher digitalisieren, sinnvoll sein.