21:23
18/8/2014

Jeszcze do niedawna, kiedy wpisało się w Google Tranlate popularny “testowy wypełniacz stron www”, czyli frazę lorem ipsum i spróbowało się ją przetłumaczyć na język angielski, wynikiem było jedno słowo: “China“. Co więcej, drobne zmiany, takie jak napisanie Lorem ipsum z wielkiej litery, zwracały jeszcze dziwniejsze słowa (tu: NATO).

Chiny, Nato, Sexy, Sexy

Na anomalię w Google Translate natknęli się badacze; jeden chcący zachować anonimowość (co jeszcze bardziej podkręca spiskowość teorii spiskowej), a drugi z firmy FireEye. Jak pisze odkrywca:

“Tłumaczyłem pewien tekst, który zawierał zwrot “lorem ipsum”. Kiedy zobaczyłem słowa Internet, China (Chiny), government (rząd), police (policja), i freedom (wolność) sprawa wydała mi się interesująca.”

Oczywiście, jako paranoik z zawodu i inżynier z wykształcenia, badacz postanowił wraz ze swoim znajomym przeprowadzić niewielki eksperyment i “zafuzzować” Google Translatora różnymi odmianami “loremipsuma”. Wyniki okazały się bardzo interesujące, bo zwracane tłumaczenia w większości były ze sobą w ciekawy sposób “powiązane”:

Wyniki tłumaczenia różnych odmian lorem ipsum

Wyniki tłumaczenia różnych odmian lorem ipsum przy pomocy Google Translate

Jeszcze ciekawsze rezultaty uzyskano powtarzając niektóre ze słów składowych “loremipsuma”:

ipsumlorem-600x482

ipsum1-600x422

Czy to tajny kod szpiegów?

Takie a nie inne wyniki tłumaczeni lorem ipsum można tłumaczyć na kilka sposobów:

  • Błąd w “matriksie”, albo easter egg, czyli celowy żart programistów
  • Ogłupienie algorytmów Goole Translate. Algorytmy mogły zostać nauczone odpowiednich tłumaczeń (z informacji udostępnianych przez Google wynika, że niektóre z tłumaczeń pozyskiwane są automatycznie — algorytm uczy się ich analizując te same dokumenty publikowane przez różne strony internetowe w kilku językach)

Badacze postawili więc hipotezę, że ktoś dowiedział się jak manipulować algorytmami Google Translate i wykorzystał je do sztucznego wyuczenia powiązań pomiędzy pewnymi konstrukcjami “loremipsumowymi” (czyli popularnymi w sieci i nie wzbudzających podejrzeń zwrotami), a konkretnymi słowami–kluczami, których znaczenie mają znać tylko wybrane osoby, np. szpiedzy. (Przy okazji przypominamy, że mistrzami w manipulacji internetu są 4chanowcy, którzy kiedyś odpowiednio podkręcili ankietę The Times)

Wykorzystanie Google Translate miałoby być “cichą” formą komunikacji szpiegów z centralą. W końcu najciemniej jest pod latarnią… W XKEYSCORE zapewne nie ma na nie regułki, a wpisywanie lorem ipsum w internecie nikogo nie dziwi (por. steganografia).

Nie wszystko jest tym, czym się wydaje -- fałszywy but wykorzystywany przez bimbrowników. Zamiast odcisku ludzkiego buta zostawiał odcisk krowiego kopyta

Nie wszystko jest tym, czym się wydaje — fałszywy but wykorzystywany przez bimbrowników. Zamiast odcisku ludzkiego buta zostawiał odcisk krowiego kopyta

Hipotezę tę należy jednak uznać za małoprawdopodobną — badacze przed publikacją wyników zasięgnęli bowiem swoich prywatnych znajomości w agencjach wywiadowczych, chcąc się upewnić, że ujawnienie tych anomalii nie spowoduje problemów z jakąś tajną misją. Ich rządowe źródło nie miało przeciwskazań co do ujawnienia światu tego tajemniczego zachowania Google Translate — a więc należy założyć, że anomalie nie są (już?) tajnym kodem agencji rządowych.

Badacze o poinformowali też Google o swoich odkryciach. Firma nie skomentowała takiego zachowania Google Translate, ale 2 dni temu wprowadziła poprawkę, która usunęła te ciekawe wyniki… Nie jest jednak powiedziane, że inne zwroty nie dają podobnie dziwnych tłumaczeń — dajcie więc znać, jeśli jakieś znajdziecie, lub jeśli macie pomysły, dlaczego lorem ipsum miało tyle wspólnego z “wojskowością” ;-)

PS. Paweł w komentarzach zauważa, że część z dziwnych tłumaczeń może być wynikiem przygotowań DEFCON-owego konkursu (por. http://potatohatsecurity.tumblr.com/post/94565729529/defcon-22-badge-challenge-walkthrough, pkt 3c) …albo wręcz przeciwnie, i twórcy wykorzystali te anomalie do stworzenia zadania konkursowego ;)

PPS. Jeśli komuś mało teorii spiskowych na dziś, to polecamy jeszcze zbadanie sprawy znikającego sygnału GPS pod Łodzią

Przeczytaj także:

40 komentarzy

Dodaj komentarz
  1. Powiem, że jakieś pół roku temu(może) zdarzyło mi się wpisać w Google lorem ipsum i wyszukiwało mi lorem ipsum… więc ten błąd bądź umyślne działanie nie jest od tak dawna… :)

    • Ale to nie w wyszukiwarce ma być, tylko w translate

    • A to przepraszam, mój błąd :)

  2. A czy nie mogło być po prostu tak, że algorytm zestawił łaciński wypełniacz z angielskojęzycznym, którym mogły być teksty z gazet?

  3. badacze pytali o pozwolenie ile służb z ilu krajów?

    • Z USA. To są inne kraje? ;)

  4. A nie mogło być tak że dla danej strony google bot najpierw brał lorem ipsum (kiedy jeszcze była z fazie przygotowań) a potem prawdziwą treść (kiedy lorem zostało podmienione) i uznawał to za tłumaczenie?

  5. Gimbusy nie pamiętają “kretyna”, “siedziby szatana” i paru innych mniej popularnych haseł.

  6. To nie żaden spisek :)
    W Google Translate jest tak, że można przesłać swoje tłumaczenie danego tekstu i jak chyba dużo osób tak zgłosi to algorytmy Google uznają że tak jest, tak samo było gdy jakiś mądry inaczej redaktorek z Frondy wpisał w tłumacz imię obecnego papieża i przetłumaczyło mu na antychryst ;)
    http://www.fronda.pl/a/skandal-bergoglio-znaczy-antychryst,33496.html
    Co oczywiście było żartem

  7. polecam spr:
    http://potatohatsecurity.tumblr.com/post/94565729529/defcon-22-badge-challenge-walkthrough
    szczególnie: Step_3c

  8. THE GAME

  9. Myślę, że zwyczajnie niektóre (niedopracowane?) strony miały w niektórych wersjach językowych lorem ipsum…

  10. Oslo, a’propos reklamy VPSa po prawej to: 1. literówka 2. kod nieaktualny :p

    • Ale hajsy wpadają za refa :D

  11. penie nakarmili tłumacza google jakąś stroną/stronami które miały język chiński wypełniony lorem ipsum

  12. Ipsum Lore Lor – HEGIO Technology
    pierwszy wynik w google to strona cn
    ciekawostka

  13. angielski -> łacina
    china -> Lorem ipsum dolor
    NATO -> Lorem Ipsum
    China’s internet -> Lorem ipsum Lorem ipsum

    Nadal możemy szyfrować na “szpiegowski” :D

  14. Moge potwierdzic magie z GPS w okolicach Strykowa. Tydzien temu jechalem w odstepie kilku dni przez cala Polske i z powrotem. Mialem wlaczona nawigacje i w trakcie obu podrozy dokladnie w okolicach Strykowa GPS w telefonie oszalal, tracil i nie potrafil nawet probowac lapac ponownie fixa, udawalo sie to tylko na kilkadziesiat sekund po pelnym restarcie telefonu…

  15. A co oznacza policyjny kod 0000 ?

    • “Skończyły się pączki, umieram”

  16. Dłuższy akapit lorem ipsum wklejony w google translate nadal generuje bezsensowne tłumaczenie, chociaż tematyka już odbiega od okołomilitarnej :P

    • Bo Lorem ipsum to bełkot. Nic nie znaczy, najwyżej pojedyncze słowa są czysto wzięte z łaciny – są rozumiane przez translatora.

  17. Częściowo jeszcze działa :)
    Np: “ipsum ipsum lorem ipsum ipsum lorem ipsum ipsum ipsum” przetłumaczyło mi na “the very very very lorem ipsum lorem ipsum get things moving”

  18. Każdy, kto widział wordpresssowe komentarze oczekujące na moderacje może się domyślić skąd takie wyniki.

  19. wpisujesz “contraptions” widzisz “contraptions.Moneta”

  20. angielski -> łacina
    China is the game -> Lorem ipsum dolor sit amet

  21. dolor -> Department
    Dolor -> Pain
    dolor sit -> project
    Dolor sit a -> China is a
    (hit!) dolor sit amet -> carrots :D

  22. Latin > English
    Lorem ipsum dolar dolar dolar NATO ipsum ipsum ipsum lore = Cut Cut Cut FLY lorem ipsum very very very sexy

    Google Translator odkrył w sobie poetę a wy się czepiacie… co za ludzie jak pragnę…

  23. A wordpressowe “hello world” tłumaczy na PL jako “hello world” :)

  24. kiedyś “Zabrze” z polskiego na angielski google tłumaczyło jako “Miami”
    sami sobie odpowiedzcie…:)

  25. A może omijanie rządowej cenzury w nieprzyjaznych krajach?

  26. Ktoś pewnie dodał to tłumaczenie do google translate i tak zostało, dopuki tego nikt nie zmienił :)

  27. Lorem ipsum dolor sit amet, consectetur adipisicing Elit. Propaganda połowy budżetu, tylko trochę, zbrodni, ale na marginesie, w, mój drogi. Jutro lub lorem. Nowy rozwój gospodarczy. Profesjonalizm i nie platforma imigracji. Wszyscy zawsze wystarczy spojrzeć na Japonię. Niedrogie zakwaterowanie, bilety lub zmienić czasem, to tylko czyste wskaźników wydajności, ale śmiało umieścić tę frustrację. Na siłach, wpływ ekonomiczny życia szkoły, świetne relacje internetowego biura turystycznego, czy czas nie jest czas na strach. Tak, lista jest pusta, kto go po miękkim kraju. Profesjonalizm przez jezioro i nie trzeba. Zdarza się do komputera, przed życiem wielu fotografii, to jest po prostu obsesję na punkcie czystego bólu, i miękkie kolana Azjatycki szkole, inny niż ten. Członkowie zespołu, aby osiągnąć równowagę. Jutro, otrzymuje szeroki wachlarz udogodnień mają co najmniej kilka, jeśli nie naciskać niż ciągnąć, masę białka budżetu, nie było.

  28. ang. -> pol.
    nitty gritty – Maryla Rodowicz
    (ale nie nitty-gritty ;-) )

    • Dla ciekawości dodam, że nitty gritty napisane w dowolnym języku (włącznie z telugu i malajskim :)) jest tłumaczone na Maryla Rodowicz. Ale jest ta nasza piosenkarka niesamowicie popularna na całym świecie ;)

  29. Gimbusy nie wiedzą, co to znaczy “por.”, a autor igH nie wie, że tekst “Lorem ipsum” nie jest bynajmniej “popularnym testowym wypełniaczem stron www”…

    • Nieważne czym jest w oryginale, prawda jest, że lorem ipsum jak najbardziej jest popularnym testowym wypełniaczem stron www.

  30. ipsum sum dolor Dolor ipsum amet
    Dolor ipsum sum sit dolor ipsums
    ipsum dolor Dolor ipsum amet

    sit adipisicing iDolor amet Ipsum sit
    Adipisicing sit i consectetur consectetur Dolor
    dolor Do sit ipsum Ipsum si rem sit Dolor ;)

  31. Zagadka stosowania tego tekstu jak zwykle rozwiązana w Wikipedii… ;]
    http://pl.wikipedia.org/wiki/Lorem_ipsum

Twój komentarz

Zamieszczając komentarz akceptujesz regulamin dodawania komentarzy. Przez moderację nie przejdą: wycieczki osobiste, komentarze nie na temat, wulgaryzmy.