En août 2013, une erreur préoccupante survenant lors de la copie numérisée de documents PDF avec des appareils Xerox a été constatée. L’erreur réside principalement dans la substitution de certains chiffres par d’autres. Ces chiffres erronés sont identiques à d’autres chiffres du document en termes de pixels.
La compression JBIG2 avec pertes, utilisée notamment par Xerox, ne sauvegarde qu’une seule fois les symboles de même valeur et les utilise plusieurs fois dans tout le document. Ce procédé est appelé pattern matching and substitution ou PMS (filtrage par motif et substitution). Le procédé PMS permet d’obtenir des compressions significatives de la taille des fichiers sans générer d’artéfacts de compression comme c’est le cas notamment avec JPEG. Xerox s’est trop focalisé sur la taille de fichier lors de l’implémentation, ce qui a permis d’obtenir une très petite taille de fichier, mais a également conduit à classer différents caractères comme étant de valeur identique et donc à les remplacer.
Xerox n’est pas le seul fabricant à utiliser cette compression, d’autres l’utilisent également, par exemple Fujitsu. Il s'agit donc d’un problème fondamental de la compression JBIG2.
Dans les fichiers PDF/A les compressions avec pertes comme JBIG2 peuvent être utilisées. En cas de conversion de PDF en PDF/A, la compression JBIG2 et, le cas échéant, l’erreur de substitution sont reprises.
Comme l’erreur est irréversible et qu'il ne peut être détecté si le procédé PMS avec pertes a été utilisé ou non, le CECO recommande d’éviter pour le moment le type de compression JBIG2 lors de l’établissement de fichiers PDF et de sensibiliser les différentes sources, en particulier les services informatiques des services versants. Éviter la compression JBIG2 ou au moins utili-ser le nouveau correctif de Xerox permettra à l’avenir de réduire au minimum le nombre de fichiers de numérisation erronés.
Xerox_JBIG2_Studie_v1.2.pdf, 2.6M, 14.02.18
Analyse JBIG2 (Management Summary en français)
Beilage_Testdokumente.zip, 6.2M, 04.09.24
Beilage Testdokumente