DE  |  FR  |  IT

JBIG2-Komprimierung

Im August 2013 wurde ein beunruhigender Fehler beim Scannen von PDF-Dokumenten mit Xerox-Geräten festgestellt. Der Fehler besteht hauptsächlich darin, dass einzelne Ziffern durch andere Ziffern ersetzt werden. Diese falschen Ziffern sind pixelidentisch mit anderen Ziffern im Dokument.

Die unter anderem von Xerox verwendete verlustbehaftete JBIG2-Komprimierung speichert gleichwertige Symbole nur einmal ab und verwendet diese mehrfach im ganzen Dokument. Dieses Verfahren nennt sich "Pattern matching and substitution" (PMS). Mit dem PMS-Verfahren können signifikante Einsparungen in der Dateigrösse erreicht werden, ohne dass Kompressionsartefakte wie z.B. bei JPEG auftreten. Xerox hat bei der Implementierung zu stark auf die Dateigrösse fokussiert. Damit wurde zwar erreicht, dass die Dateigrösse sehr klein wurde, aber auch, dass verschiedene Zeichen als gleichwertig eingestuft und entsprechend ersetzt wurden.

Nicht nur Xerox verwendet diese Komprimierung, sondern auch andere Hersteller wie z.B. Fujitsu. Es handelt sich also um ein grundsätzliches Problem der JBIG2-Komprimierung.

In PDF/A-Dateien dürfen verlustbehaftete Komprimierungen wie zum Beispiel JBIG2 eingesetzt werden. Bei einer Konvertierung von PDF zu PDF/A wird die JBIG2-Komprimierung und ggf. der Substitution-Fehler übernommen. Da der Fehler irreversibel ist und nicht festgestellt werden kann, ob das verlustbehaftete PMS-Verfahren eingesetzt wurde oder nicht, empfiehlt die KOST, beim Erstellen von PDF-Dateien vorerst auf die Kompressionsart JBIG2 zu verzichten und die verschiedenen Quellen, insbesondere die Informatikdienstleister der abliefernden Stellen, zu sensibilisieren. Durch die Vermeidung von JBIG2 oder durch die Verwendung des neuen Xerox-Patches können die Anzahl fehlerhaften Scan-Dateien in Zukunft auf ein Minimum reduziert werden.

Xerox_JBIG2_Studie_v1.2.pdf, 2.6M, 14.02.18
Analyse JBIG2-Komprimierung

Beilage_Testdokumente.zip, 6.2M, 31.03.22
Beilage Testdokumente

Für eine detaillierte Analyse von PDF bzw. PDF/A als Archivformat siehe den Katalog archivischer Dateiformate.