11:33
9/8/2013

Bardzo popularne kserokopiarko-skanery wykorzystywane w biurach mogły wprowadzać błędy do faktur (czasem na korzyść, czasem na niekorzyść właściciela). Ale to najmniej istotny problem — wyobraźcie sobie bowiem, jakie straty maszyna mogła wygenerować, jeśli stała w biurze architekta i “przypadkiem” podmieniła ważne obliczenia w planach konstrukcji np. mostu… Albo w aptece, gdzie w wyniku pomyłki skanera sporządzono lek w złych proporcjach…

Podmiana “6” na “8” w skanach

Na ten interesujący błąd natknął się kilka dni temu David Kriesel, skanując plany budynku na których naniesiono powierzchnię danego pokoju w metrach kwadratowych:

Oryginalny plik

Oryginalny plik w którym nastąpi zamiana po zeskanowaniu

W wynikowym PDF uzyskano błędne wymiary:

Plik po zeskanowaniu - zamienione cyfry zostały zaznaczone

Plik po zeskanowaniu – zamienione cyfry zostały zaznaczone

Jak widać, błędy nie polegają na podmianie losowych pixeli, ale zamieniane są całe fragmenty okolic liczb (czyli zestawy danych) pomiędzy sobą. Kolejny przykład (głównie szóstki są zamieniane na ósemki):

6 zamieniane na 8 - błąd skanowania w Xerox

6 zamieniane na 8 – błąd skanowania w Xerox

Żeby było ciekawiej, za problemy z podmianą skanowanych liczb nie odpowiada wada w oprogramowaniu OCR — na czas testów błędu zostało ono wyłączone.

Gdzie leży problem?

Za błąd najprawdopodobniej odpowiada kompresja JBIG2 wykorzystywana w urządzeniach Xeroksa oraz Brother MFC-9140CDN.. Algorytm tworzy coś na kształt słownika podobnych znaków i podczas kompresji oryginalnego znaku odwołuje się do “słownika” ze skompresowanym obszarem, jeśli oryginał jest do niego podobny.

Szczęśliwie dla Xerox i innych firm, które zaimplementowały JBIG2, błąd można łatwo usunąć, jeśli ustawi się flagę bezstratności w momencie implementacji algorytmu JBIG2 — ciężko powiedzieć, dlaczego Xerox i inne firmy tego nie zrobiły, zwłaszcza, że nie wpływa to za bardzo na rozmiar wynikowy dokumentów (tzn. dalej są one “skompresowane”).

Mam skaner/ksero XeroX/Brother, co robić, jak żyć?

Jeśli jesteś właścicielem urządzenia marki Xerox, z listy poniżej, powinieneś przeprowadzić test (przykładowy dokument do zeskanowania i porównania znajdziesz tutaj).

Lista podatnych urządzeń Xerox

Xerox Workcentre 7535 (061.121.201.09700 oraz 061.121.222.06508)
Xerox Workcentre 7556 (061.121.201.09700)

Internauci donoszą także, że błędy występują również na urządzeniach:
ColorQube 87XX / 89XX
WorkCentre 57XX
WorkCentre 76XX
ColorQube 92XX / 93XX
WorkCentre 58XX
WorkCentre 77XX
WorkCentre 5030/5050
WorkCentre 6400
WorkCentre 78XX
WorkCentre 51XX
WorkCentre 7220/7225
WorkCentrePro 2XX / BookMark 40/55
WorkCentre 56XX
WorkCentre 75XX

Xerox wie już o sprawie i przygotowuje rozwiązanie problemu. Na razie firma opublikowała dokument z “pytaniami i odpowiedziami” dotyczący tej sprawy. Firma zasłania się także niniejszym komunikatem, twierdząc, że przecież jasno informuje, że mogą wystąpić błędy:

Komunikat Xeroxa w oprogramowaniu

Komunikat Xeroxa w oprogramowaniu

Jak widać “bezstratna” kompresja może być całkiem “zyskowna” — po internecie już krążą żarty, że to zapewne Xerox jest odpowiedzialny za niczym nie uzasadnione i niewytłumaczalne wzrosty cen na stacjach benzynowych, kantorach …i w innych miejscach ;-)

PS. Kto czytając ten artykuł pomyślał o “szatanie z siódmej klasy”?

Aktualizacja
Zgodnie z zapewnieniami pracownika Xerox, błąd nie pojawia się w domyślnej konfiguracji urządzeń — ale nie jest to prawda — problem występuje także przy zalecanej jakości wydruków “HIGH”, jak informuje nasz czytelnik.


Dowiedz się, jak zabezpieczyć swoje dane i pieniądze przed cyberprzestępcami. Wpadnij na nasz kultowy ~3 godzinny wykład pt. "Jak nie dać się zhackować?" i poznaj kilkadziesiąt praktycznych i przede wszystkim prostych do zastosowania porad, które skutecznie podniosą Twoje bezpieczeństwo i pomogą ochronić przed atakami Twoich najbliższych. Uczestnicy tego wykładu oceniają go na: 9,34/10!

Na ten wykład powinien przyjść każdy, kto korzysta z internetu na smartfonie lub komputerze, prywatnie albo służbowo. Wykład prowadzimy prostym językiem, wiec zrozumie go każdy, także osoby spoza branży IT. Dlatego na wykład możesz spokojnie przyjść ze swoimi rodzicami lub mniej technicznymih znajomych. W najbliższych tygodniach będziemy w poniższych miastach:

Zobacz pełen opis wykładu klikając tutaj lub kup bilet na wykład klikając tu.

24 komentarzy

Dodaj komentarz
  1. A wiadomo jakie inne urządzenia Brothera mają taki błąd? Mamy w firmie DCP-385C oraz MFC-490CW i nie wiem czy mam się czego obawiać.

    • Sprawdz na testowym pliku?

    • Ten komentarz aż prosi się o bycie uszczypliwym ;)

      1. wydrukuj plik tif podlinkowany w tekście
      2. zeskanuj na standardowych ustawieniach rzeczoną kartkę na obydwóch urządzeniach
      3. porównaj czy coś się zmieniło

      PS. jeśli te sprzęty mają opcję ksero (nie sprawdzałem czy to skanery czy multi) możesz jej użyć na standardowych ustawieniach w punkcie drugim

    • Ok, dzięki. Sprawdziłem i skanuje poprawnie.

  2. Mam brothera ale nie takie cuda jak w artykule :D i działa
    w wszystko w porządku :) DCP-375 CW :) a tu chodzi o kompresie
    JBIG2 :P

  3. Pracuje w Xeroxie, w dziale gdzie ww. pan eskalowal problem, wiec moge powiedziec ze jestem wtejamniczony. Po pierwsze, problem pojawia sie nie przy domyslnych ustawieniach rozdzielczosci skanu, tylko przy najnizszej, ktora trzeba ustawic recznie, przy czym drukarka informuje ze przy kompresji jbig2 moze nastapic zamiana znakow. O co zamieszanie, nie mam pojecia…
    Tu link to ww. powiadomienia http://i.imgur.com/Rlswkzo.png

    • Może stąd, że “low” nazwaliście “normal”?

    • @nnqu nomenklatura. Jednak masz pod spodem wytlumaczone ze normal daje najnizsza jakosc i najmniejszy rozmiar pliku, jak i ostrzezenie o mozliwosci zamiany znakow.

    • Nomenklatura? No bez jaj. Normal to normal-nie za ładnie,
      nie za brzydko. Jeśli wam się wydaje, że w imie marketingu możecie
      nazywać poziomy jakości wg klucza: zwykli ludzie = Xerox
      shitty=normal fair=high good=extra to mam w nosie taką firmę i taką
      politykę jakości.

    • Takie pytanie odnośnie pracy. Czy jesteś osobą upoważnioną aby w imieniu firmy tłumaczyć zaistniałą sytuację? Wydaje mi się, że od tego są osoby odpowiednio upoważnione i przeszkolone (rzecznicy prasowi etc.). W przyszłości radzę również czytać regulaminy, które się podpisywało względem pracodawcy. Sam pracuje w większej “korporacji” i prędzej ugryzłbym się w palce zanim bym wypisywałbym odnośnie jakiejkolwiek wpadki w firmie zanim (a nawet po) zrobi to rzecznik. No chyba, że chciałeś się pochwalić gdzie pracujesz :) w takim razie gratuluje.

    • Podbijam opinię Artura. Stary, jeśli faktycznie jesteś pracownikiem korporacyjnym Xeroksa to gratuluję zarówno Tobie, jak i firmie.

    • @ Artur, ale ja nic innego nie powiedzialem jak to co bylo juz oficjalnie podane do wiadomosci, tylko w tym czasie jeszcze nie uwzglednione w arcie…

  4. Sprawdziłem na Xerox WorkCentre 7530 na swoim arkuszu, który najpierw wydrukowalem a potem skanowałem z różnymi konfiguracjami skanera.
    Błąd wystąpił – i to wcale nie na ustawieniach “Normal” tylko na wariancie pośrednim “High” – akurat takim jakim aktuaalnie zaleca Xerox w:
    http://www.xerox.com/assets/pdf/ScanningAppendixB.PDF
    http://www.xerox.com/assets/pdf/ScanningQAincludingAppendixA.pdf
    – użyłem “odcieni szarości”, opcji “text” i normalnej rozdzielczości 300 DPI.
    Ciekawe jest to, że nie zawsze przy jednakowych ustawieniach skanera błąd wystąpi

    • Moglbys umiescic wyniki gdzies?

  5. Jesli zmieniacie artykul, milobylo by zaznaczyc co zmieniliscie, bo moj komentarz jest w tym wypadku bez sensu…

  6. wysłałem wynik autorowi odkrycia i jest do zobaczenie tutaj: http://www.dkriesel.com/_media/blog/2013/wc7535high.pdf
    opis jest pod hasłem Edit3 na stronie http://feeds.feedburner.com/dkriesel-en

    • Muszę cię zmartwić. Ja znalazłem jeszcze jeden błąd.

      Nie wiem czy używają w/w urządzeń w moim banku ale często “brakuje” mi kasy na koncie.

  7. Przetestowałem na urządzeniach w firmie i na wc6400 problem wystąpił przy ustawieniach domyślnych

  8. Zamiana 6 na 8 jest częstym przypadkiem, szczególnie kiedy górna część 6 jest bardzo zaokrąglona i blisko środka liczby. Bardziej jest to błąd sknera niż oprogramowania.
    Zauważcie że na zdjęciu z tabelką 6 została zamieniona w 8 tylko w ciemnych polach, a w jasnych jest wszystko ok.

    • Okazuje się, że więcej cyferek udało się przyłapać na podmiankach i to na dodatek we wszystkich trzech metodach kompresji – nawet tej najmniej oszczędnej (w domyśle najdokładniejszej). David Kriesel zakończył batalię z Xeroxem, który oficjalnie przyznał, że buga odnalazł przy każdym ustawieniu i szukuje patch
      http://www.dkriesel.com/en/blog/2013/0812_xerox_scanning_issue_fully_confirmed

  9. mam nadzieję, że bekną za to, i to bardzo. bo na pewno pojawią się pozwy. dla mnie takie błędy mogą być akceptowalne przy OCR, bo wtedy człowiek liczy się z tym, że mogą być przekłamania i dokładnie się sprawdza.

    ale przy zwykłym kopiowaniu?

    aż strach pomyśleć, do czego to mogło doprowadzić. błędne faktury, błędne wyliczenia naukowe i inżynieryjne, błędne ilości podanych leków itp.

    a najgorsze, że jeśli używałeś tego urządzenia to w zasadzie nie masz bladego pojęcia gdzie i kiedy wystąpiły przekłamania i z której strony uderzy cię (słuszny!) gniew klienta.

  10. A czy te firmy zrekompensowały straty użytkowników?
    W końcu gwarancja…
    A jeśli błąd jest oczywistą winą firmy?
    zrjn.

  11. Ktoś wam cały artykuł zerżnął żywcem:

    http://www.riset.pl/index.php/aktualnosci-3/79-skanowanie-bledy

  12. @Piotr konieczny To ze urzedzenie xeroxa bylo uzywane do skanowania dokumentu prezydenta (obama) stanow zjednoczonych i afera z tym zwiazana juz niewarto wspomniec ?

Odpowiadasz na komentarz blad201

Kliknij tu, aby anulować

Zamieszczając komentarz akceptujesz regulamin dodawania komentarzy. Przez moderację nie przejdą: wycieczki osobiste, komentarze nie na temat, wulgaryzmy.

RSS dla komentarzy: