11:09
13/9/2013

Dropbox z jakiegoś powodu otwiera pliki .doc wgrywane przez użytkowników. Ujawnił to eksperyment polegający na wgraniu do Dropboksa takiego pliku .doc, który osadza obiekt generujący przy otwarciu dokumentu .doc żądanie GET do monitorowanego serwera.

Pliki są otwierane zawsze po ok. 10 minutach. IP pochodzi z EC Amazonu, a User-Agent to …Libre Office. Nie jest do końca pewne, czy żądania generowane są automatem, czy ręcznie (logika wskazuje na automatyzację tego procesu).

żądanie generowane przez Dropbox po otwarciu pliku doc

żądanie generowane przez Dropbox po otwarciu pliku doc

Pytanie bez odpowiedzi, to w jakim celu Dropbox renderuje wgrywane do ich chmury .doce? Tego typu działanie Dropboksa nie musi nosić znamion złych intencji. Może chodzić o generowanie podglądu (jeśli tak, to gdzie jest on udostępniany?). Albo o deduplikacja/cacheowanie zewnętrznych zasobów osadzanych w innych plikach (np. hotlinkowane obrazki) w celu zoptmalizowania usługi? Wreszcie, Dropbox mógł po prostu nie zdawać sobie sprawy, że tak działa silnik LibreOffice i albo nie wyłączyli opcji crawlingu osadzanych plików, albo takiej opcji nie ma.

Niezależnie od tego co jest powodem crawlowania zewnętrznych zasobów osadzanych w dokumentach wgrywanych na Dropboksa, należy mieć świadomość, że cokolwiek co umieszczamy w “chmurze”, a co nie zostało przed wysłaniem zaszyfrowane, może zostać odczytane przez jej właściciela (i nie tylko)


Przeczytaj także:



40 komentarzy

Dodaj komentarz
  1. Renderowanie miniaturek?

  2. Po co otwierać (renderować) plik do deduplikacji?

  3. “Rządań” ? ;)

  4. Mi ten artykuł śmierdzi. Otwieranie zyliarda plików .doc za pomocą kobyły jaką jest LibreOffice?. Linki do rejestracji w tej (zatrważająco drogiej) usłudze do śledzenia otwarć dokumentów, brak możliwości komentowania artykułu. Na całym tym portalu są tylko 3 teksty. Wiarygodne jak cholera.

    Co więcej, programy pocztowe już się nauczyły, że zanim załadują zasoby z sieci przy otwieraniu wiadomości, to by zapytać użytkownika czy sobie tego życzy. LibreOffice wali GETem we wszystko co popadnie? Jestem ciekaw, jak niby osadzają te “callbacki”. Deduplikacja? A co z ze starym dobrym sha1sum? Deduplikacja na podstawie treści jest bezsensowna, bo co jak mam np. dokumentację jakiegoś API w wersji 1.34.2 i w wersji 1.34.2.1 które różnią się poprawioną literówką i muszę trzymać w archiwum służbowym obydwie wersje?

    • … poczytaj proszę o tym, jak deduplikuje dane np. EMC Avamar – a potem skreśl ostatnie wersy swojego postu :)

  5. Żądań. Szczęść Borze.

  6. Przeciez jest tam podglad dokumentów on-line. Moze otwiera żeby go zrenderowac tak na zapas?

    • Praktyka zawodowa nauczyła mnie, że przy usługach dużej skali niczego nie robi się “tak na zapas”. Robi się na żądanie użytkownika a potem cache’uje, no chyba że w Dropboksie pracują laicy.

  7. Renderowanie do miniaturek przez uno i jakiś binding do innego języka, najpopularniejsza i najłatwiejsza metoda generowania obrazu z doc/docx. Stawia się serwer na którym leci Libre i puszcza w kolejke, dodatkowo Linux friendly.

  8. Sprawdziłem i skutek jest taki, że w tym HoneyDocs nic się nie pojawia. Natomiast pojawia się kiedy otwieram dokument za pomocą LibreOffice. Także chyba to jakaś ściema :)

    • W jakim celu jest słowo ‘także’?

  9. Wygenerowałem pliki z użyciem tego HoneyDocs którego on użył, i utworzyło archiwum zip z trzema plikami doc, html i xls, tyle że wszystkie trzy pliki to zwykły html i LibreOffice 4.1.0.4 nie potrafi ich otworzyć…a otwierając html nic nie pokazuje ten HoneyDocs, nawet z innego kompa z innym IP

  10. mała poprawka, jednak działa z innego kompa z innym IP, tylko jakoś z opóźnieniem pokazało tam

  11. Dlatego swoje dane będę trzymać albo na własnych urządzeniach, albo na własnoręcznie postawionych rozwiązaniach (z wyjątkiem poczty, chociaż tutaj też myślę, czy nie byłoby bezpieczniej postawić sobie własny serwer).

  12. Bo trzymanie plików w chmurce Dropboxa w kontenerze TC jest taaaaakie trudne…. ;)

    PS. DB generuje podgląd dokumentów – ta usługa działa też przez WWW, a mam wrażenie że ludzie widzą tylko apkę na PC/smartphony…

  13. Dlatego dane, które muszą być mobilne proponuję trzymać na własnym NAS’ie, które w obecnych czasach są tanie, a z braku laku za pomocą raspberry można zbudować własny.

    • NAS na Raspberry Pi? Eee. Jest na tym SATA? Może chociaż IDE? Nie? To powodzenia z transferami USB rzędu 3MB/s i cachowaniem bloków dysku w 512MB RAMu. Aha, i 1 rdzeń też nie pomaga w zastosowaniach serwerowych – tam zwykle chce się mieć 1 wątek na dyskowe I/O (filesystem, block), a drugi na obsługę sieci (Samba, NFS, itp.), żeby zmaksymalizować przepustowość.

      Nie, żebym osobiście miał coś do Raspberry Pi. Bardzo fajna płytka np. na domowy odtwarzacz muzyki albo taki reklamowy wyświetlacz do firmy (byle nie na Flashu…). Po prostu jako NAS się zupełnie nie nadaje. Tu lepiej wybrać jakiś Cubieboard, a już najlepiej po prostu x86 typu Intę Seleron, który faktycznie obsługuje USB 2.0 i SATA z odpowiednimi prędkościami.

    • Raspberry PI ma jeden hub USB 2.0 na którym masz podłączoną kartę sieciową i zewnętrzny port więc transfer dysk -> sieć jest naprawdę mizerny. W ogóle podłączanie dysku na USB 2.0 to jest jakiś smutny żart.

  14. @Torwald

    trzymanie kontenerów TC w katalogu Dropboxa to głupota… no chyba że kontener ma kilka MB… ale gdy chcemy zabezpieczyć dużą ilość plików i kontener ma kilka GB to pojawia się problem.
    I przy najmniejszej zmianie wewnątrz konteneru na dropbox wgrywany jest od nowa cały kontener.
    Są inne lepsze rozwiązania szyfrujące każdy plik osobno.

    • @macek – mam kontener w pliku 3G i DB wysyła tylko zmienione fragmenty. Jedynie skanuje /hashuje cały plik po odmontowaniu TC i przez chwilę komputer się muli.

    • Potwierdzam, sam na codzien uzywam 1GB kontenera TC z rzeczami do roboty i backupuje to m.in w dropboxie. I jest to cholernie wygodne bo jak koncze prace demontuje kontener, wtedy dropbox moze go przeskanowac i wyslac delta na server. I jesli nie wrzuciem 100mb nowych danych trwa to zazwyczaj pare sekund.

      W ogole nie moge sie nadziwic ze ludzie tak ufnie wysylaja na DB albo google drive dane ktore uwazaja za prywatne/poufne. :)

    • Sto razy lepszym rozwiązaniem jest encfs który szyfruje plik bezpośrednio, polecam poczytać.

  15. Jeśli dobrze rozumuję.. to w ten sposób można uzyskać dostęp do “lokalnych” zasobów (np. baza danych za firewallem).

  16. A to ogóle jest jeszcze ktoś, kto trzyma swoje PRYWATNE dokumenty w chmurze bez szyfrowania?

    Pod lnuxem szyfrujemy sobie katalog dropbox za pomocą encfs. Klucz w pliku .xml wykluczamy z synchronizacji w linuxowym dropboxie jak i windowsowym (tak, jest pod windowsem możliwe wykluczenie dowolnego pliku z synchro w dropboxie). Pod windozą plik-klucz .xmp encfs można zaimportować np. boxcryptorem.

    Ludzie, bez jaj. Dalibyście komuś do oglądania własne dokumenty z biurka? Przecież nie macie żadnej gwarancji, poza zapewnieniami ANONIMOWEJ osoby “z drugiej strony”, że dbają o prywatność tych dokumentów które im przesyłacie w chmurę i to każdą, nie ważne czy dropbox czy google czy cokolwiek innego. Myślcie trochę.

    • Kto szyfruje… odpowiem: PRAWIE NIKT!

  17. A Ja je… DropBox’a :)

  18. należało by spakować tego doc’a zip’em i było by więcej poszlak ;)

  19. Mam nadzieję, że przy kilku milionach plikach i może przy kilkaset tysięcy *.doc-ach… dziennie, mojego akurat nie odczytają…

  20. “Dropboksa takiego pliku .doc, który osadza obiekt generujący przy otwarciu dokumentu .doc żądanie GET do monitorowanego serwera.” czyli albo jestem głupi albo w .doc można teraz osadzić tak złośliwy skrypt żeby wysadzić im serwery?

  21. Oj tam, oj tam, co wy się tak podniecacie, przecie nie od dziś wiadomo, że to NSA prewencyjnie robi sobie kopię każdego wrzuconego do internetu dokumentu… :P

  22. Dlatego jeśli komuś zależy bardzo na prywatności to trzeba szyfrowa albo trzymać na prywatnym NAS

  23. No i dobre. Szpiegowanie szpiegów. Swoją drogą czy to
    oznacza, że można im podesłać jakiegoś konika w makro, a oni go
    otworzą po 10 minutach ot tak? Może jakiś screenshot z kamerki albo
    sampel z mikrofonu? bardzo roztropne…

  24. Polecam wuala – szyfrowanie odbywa się po stronie klienta (więc jak zapomnisz hasła to dane przepadają). Za free 5GB (6GB z referral code JN4H6PF47G4JKMF3433K)

  25. Głupie pytanie – a co z plikami odt?

  26. LibreOffice do konwersji z doc/odt/rtf/… do pdf a pdfa można już łatwo przekonwertować na swf i mamy podgląd dokumentów na stronie (a dla kogo ten podgląd to już inne pytanie)

  27. A np. zainstalowanie OwnClouda na własnym serwerze i zamontowanie jego przestrzeni na pliki w kontenerach tc ?

  28. “Pomimo tego, iż wyglądało to wszystko podejrzanie, odpowiedź okazała się prosta. W wyniku dalszych badań WNC InfoSec stwierdził, że to Dropbox dobiera się do niektórych typów plików, w tym przypadku do plików .doc. Chodzi o to, że Dropbox pozwala użytkownikom przeglądać niektóre typu dokumentów (w tym pliki .doc), budując specjalną kopię takiego dokumentu i następnie udostępniając ją do przeglądania użytkownikowi. Aby było to możliwe, Dropbox musi otwierać te dokumenty.”
    Z dzisiaj news na jednej ze stron

  29. @Torwald [Bo trzymanie plików w chmurce Dropboxa w kontenerze TC jest taaaaakie trudne…. ;)] Myślę że te są dla służb najbardziej ciekawe. Teraz po rewelacjach Snowdena każdy kto ma coś do ukrycia będzie sobie szyfrował i NSA zaoszczędzi to roboty z filtrowaniem masy badziewia które się codziennie przelewają przez serwery. Szyfrowane dane są najciekawsze. TC a nawet i TOR pewnie dawno przez NSA złamane a może i kontrolowane a może i przez nich stworzone…Politycy, genialni konstruktorzy, programiści, ludzie kreatywni, pracujący w instytutach naukowych i badawczych, poważnych firmach na stanowiskach inżynierskich itp. mają się czego obawiać ale reszta może spokojnie spać nie są pewnie w kręgu zainteresowań NSA.

  30. […] tym, na ile sposobów jako społeczeństwo jesteśmy inwigilowani pisaliśmy już wiele razy. Naprawdę wiele. Ale kto by […]

  31. […] czy ma — czy nie ma — dostępu do danych użytkowników (ma). Dropbox zaliczył też wpadkę z podglądaniem zawartości plików .doc swoich użytkowników, aż w końcu w cwany sposób zmienił […]

Twój komentarz

Zamieszczając komentarz akceptujesz regulamin dodawania komentarzy. Przez moderację nie przejdą: wycieczki osobiste, komentarze nie na temat, wulgaryzmy.

RSS dla komentarzy: