News

Xerox-Scanprobleme voll bestätigt, tatsächlich Software-Bug

Heute Nacht gibt es gute Neuigkeiten: Rick Dastin und Francis Tse haben gerade angerufen. Lange Rede, kurzer Sinn:

  • Es war in der Tat ein Bug,
  • in der Tat können alle Kompressionsmodi Zahlen vertauschen, über eine ganze Masse an Gerätetypen hinweg,
  • am wichtigsten, sie haben den Bug gefunden,
  • ein Patch wird gerade entwickelt,
  • und sie wollen, dass ich ihn teste (das ist eine Ehre, herzlichen Dank!).

Hier ist ihre Presseerklärung. Dann gehe ich ja doch nicht in die Geschichte ein als der Typ, der zu doof war, die Anleitung zu lesen. 8-)

Alle drei Kompressionsstufen vertauschen Zahlen (Xerox WorkCentre 7545, laut Leser auch 7655)

Wie ihr wahrscheinlich mittlerweile alle wisst, haben die Xerox WorkCentres drei Scan-Kompressionsmodi: Normal, higher und highest. Xerox hatte im Questions and Answers-Papier angegeben, dass der „normal“-Modus der nummernvertauschende wäre, und alles ab „higher“ ab 200dpi sicher wäre.

Vor ein paar Tagen hatte ich bemerkt, dass auch der „higher“-Modus auf einem Xerox WorkCentre 7545 in meiner Heimatstadt Bonn vertauschte Zahlen produzierte, selbst mit einer großzügig gesetzten Auflösung von 300 dpi. Ich gab diese Ergebnisse an Xerox weiter, und nachdem sie es auf einem 7545 in den USA getestet und ebenfalls vertauschte Zahlen gesehen hatten, gab es hier einen detaillierten Artikel.

Das alles stand bereits im starken Kontrast zu den Bildschirmmitteilungen, den Anleitungen (zumindest zu denen, die ich kenne) und sogar zu Xerox' aktuellen Pressestatements – alle diese haben nur Ersetzungswarnungen mit Blick auf den Modus „normal“ ausgesprochen und sogar gesagt, der Rest wäre sicher.

Xerox untersucht neue Nummernvertauschungs-Funde

Im zweiten Presse-Statement von Xerox hat Rick Dastin, Vice President at Xerox Corporation, gesagt: „You will not see a character substitution issue when scanning with the factory default settings.“ In Xerox' offiziellem Technischen Statement zum Thema werden diese factory default settings definiert: Gemeint sind der Kompressionsmodus „higher“ und eine Auflösung von mindestens 200 dpi. Für diesen Kompressionsmodus (und den darüber) sind auch keine „character substitution“-Hinweise in den Bedienungsanleitungen oder Admin-Panels; zumindest nicht in denen, die ich kenne.

Heute im Laufe des Tages konnte ich nun das Nummernvertauschungsproblem auf einem Xerox WorkCentre 7545 reproduzieren, und zwar unter Benutzung des „higher“-Kompressionsmodus, mit noch großzügiger gewählten 300 dpi Auflösung. Wie ihr euch alle vorstellen könnt, könnte das auf ein sehr ernstes Problem hindeuten. Nicht nur würde das Zahlenvertauschen auch mit den Fabrikeinstellungen vorkommen und damit alle betreffen, auch Xerox' Pressestatements wären nicht akkurat gewesen, wenn auch sicher wohlgemeint.

Hätte es wirklich so einfach sein können, Xerox?

Ich bekomme Kommentare und Mails, die etwas sehr interessantes sagen. Kann es sein, dass im hier verwendeten JBIG2-Algorithmus direkt ein „Lossless“-Flag eingebaut ist, der den ganzen Mist hätte verhindern können, wenn man ihn nur angestellt hätte? Diese Pressemeldung sagt das zumindest (danke, Flavio). Money Quote:

supports traditional “lossless” compression, but also a new „lossy“ type of image compression, whereby the compression factor is increased on average by a factor of about 3 to 10, without noticeable visual differences compared with the lossless mode.

Die „lossy“-Variante ist das, was die Fehler hier verursacht. Das wichtige ist, wie der Auszug zu lesen ist. Der Faktor 3-10 bezieht sich auf die Lossy-Variante. Insgesamt heißt das, dass JBIG 2 wohl im lossless mode etwas kleinere Dokumente produziert als andere Kompressionsverfahren, und im lossymode noch mal massiv kleinere, aber u.U. auf Kosten der Datenintegrität.