13:12
29/7/2010

No więc ktoś zebrał publicznie dostępne dane (imiona i nazwiska) osób zarejestrowanych na Facebooku. Pisaliśmy o tym na blipie 2 dni temu. Na Blipie tylko, bo informacja wydała nam się tak mało istotna, że nie warto było jej pchać na Niebezpiecznika. Niestety, widzimy, że “mainstreamowe” media wywęszyły sensację, więc jednak napiszemy dwa słowa, żeby wyprostować te wszystkie brednie o rzekomym “wycieku” i terorie spiskowe, które przewijają się teraz przez sieć.

171 milionów wtórnych informacji

Zebrane dane to 171 millionów imion i nazwisk (ale tylko 100 milionów unikalnych). Przez dane rozumie się tylko imię i nazwisko osoby mającej konto na Facebooku. Dane pochodzą z publicznie dostępnego katalogu.

Publiczny katalog Facebooka

Tak! Facebook umożliwia wszystkim wyszukiwanie swoich użytkowników po imieniu i nazwisku. Tu np. macie stronę na której można znelźć moje nazwisko w — przypominam raz jeszcze — publicznie dostępnym Facebookowym katalogu. Jeśli macie kilkadziesiąt gigabajtów na zbyciu, katalog możecie zassać stąd.

Co z takimi danymi można zrobić? W zasadzie niewiele. Potworzyć ciekawe statystyki, np. najpopularniejszego imienia i nazwiska na świecie, albo samego imienia, albo samego nazwiska:

  • 17204 john.smith
  • 7440 david.smith
  • 7200 michael.smith
  • 6784 chris.smith
  • 6371 mike.smith
  • 6149 arun.kumar
  • 5980 james.smith
  • 5939 amit.kumar
  • 5926 imran.khan
  • 5861 jason.smith
  • 977014 michael
  • 963693 john
  • 924816 david
  • 819879 chris
  • 640957 mike
  • 602088 james
  • 584438 mark
  • 515686 jason
  • 503658 robert
  • 484403 jessica
  • 913465 smith
  • 571819 johnson
  • 512312 jones
  • 503266 williams
  • 471390 brown
  • 386764 lee
  • 360010 khan
  • 355639 singh
  • 343220 kumar
  • 324972 miller

…a oprócz tego, przeparsować i zrobić słownik do np. ataków słownikowych, bo pewnie sporo osób ma hasła typu: [pierwsza litera imienia][nazwisko] a Facebook nie wymaga “numerków” ani znaków specjalnych w haśle do konta.

Google było pierwsze!

Zcrawlowanie tych danych w celu łatwiejszego wyszukiwania osób, to nie jest wielki wyczyn, bo od dawna można to robić przy pomocy Google:
"piotr konieczny" inurl:directory site:facebook.com

Tyle widać, jak nie jesteś 'przyjacielem'. A jak jesteś to dodatkowo dostaniesz spam z mojego blipa ;) Dobry deal, nie?

I o co tyle hałasu?

Się pytam. Znów będziemy krzyczeć po serwisach, jaki to Facebook jest zły, bo obdziera nas z prywatności (na nasze własne życzenie)? Przecież to ludzie decydują, co chcą udostępnić światu

…z tym wyjątkiem, że decydując się na konto na Facebooku każdy musi udostępnić swoje imię i nazwisko (może być fałszywe), listę przyjaciół (nie da się ukryć) oraz profilowe zdjęcie — ja np. mam takie w okularach — jak ktoś mi powie na podstawie tego zdjęcia, kto siedział za mną na tylnej kanapie, to stawiam mu piwo.

Przeczytaj także:



35 komentarzy

Dodaj komentarz
  1. Literówka w ostatnim śródtytule – “hasłasu”. Co do samego artykułu, to jak zwykle, wszyscy będą krzyczeć, czego to nie znaleźli, a wartość merytoryczna znaleziska będzie na poziomie artykułu z Faktu. Aczkolwiek, tak jak wspomnieliście, budowa słownika z tych danych to będzie niemała gratka dla “hakierów”. ;]

  2. > …decydując się na konto na Facebooku każdy musi udostępnić swoje imię i nazwisko (może być fałszywe), listę przyjaciół (nie da się ukryć) oraz profilowe zdjęcie…

    Pytanie tylko komu ;] Ustawienia prywatności dla np. widoku listy kontaktów można dostosować tak, aby była ona znana tylko nam oraz samemu Facebookowi. Opcje tego dot. można znaleźć w na stosownej stronie: Określ swoje ustawienia prywatności > Podstawowe informacje profilowe.

  3. Można zmienić “Wyświetlanie mojej listy znajomych”, ja mam np. ustawione żeby widzieli “znajomi znajomych”.

    Wchodzimy w “Ustawienia prywatności” (http://www.facebook.com/settings/?tab=privacy) a następnie w “Podstawowe informacje profilowe”..

  4. Ups, Karol ‘Zal’ Zalewski mnie uprzedził, sorki, zapomniałem odświeżyć strone przed dodaniem komentarzy.

    • Karole (oba): poprawka naniesiona, dzięki :)

  5. “może być fałszywe”

    NIE może być fałszywe. Za to usuwają konta ;) Ostatnio bodajże Katarynie bo nie potrafi czytać regulaminu.

    • A Rysiek to ma jedno takie konto, na Jana Kowalskiego zarejestrowane — znajdziesz je i udowodnisz, że na lewe dane? :)

  6. 2 sprawy:
    1. Jeśli ktoś wpisze jako imię Blogger to chyba jasne, że fałszywe konto
    2. Jeśli to znana postać Internetu to wiadomo jak się nazywa.

    W Sieci dosyć często ktoś płacze, że usunięto mu konto i robi później jakieś anty-grupy na FB.

  7. Na tylnej kanapie siedzi fotograf? ;)

  8. Piotrze, możesz stawiać mi piwo. Zrobiłem uncrop tego zdjęcia i na tylnej kanapie siedzi dziewczyna, konkretnie blondynka lub szatynka (słabe światło).

  9. @emisariusz: zrób jeszcze zoom&enhance, bo uncrop Ci źle płeć wskazał :)

    P.S. Dodaje 6-ciopak dla tego, kto powie ile puszek piwa było w bagażniku.

  10. Rysiek ma lewe konto bo to leszczu a oni kasują konta takim osobom, które są w miarę rozpoznawalne w internecie (np. Lindsay Lohan która podała nazwisko przyjaciółki), Katarynę ktoś podpie…
    Ciekawe jest to, że Facezbook kasuje cudze konta jak mu się podoba, a jak ktoś sam chce je skasować to ma utrudnioną drogę. Wczoraj na przykład skasował http://ireport.cnn.com/docs/DOC-466703 ale ponieważ było dużo fanów, to się przestraszył i przywrócił. Podobnie jak ze zmianami w regulaminie odnośnie korzystania ze wszystkich informacji umieszczanych przez użytkownika, po protestach nie będą przywłaszczać sobie wszystkiego co popadnie (na razie).

  11. 0

  12. @Piotr Konieczny: 0 (tak jak napisał Szczygieł). Były tam 2 butelki wina (0.7), 0.5 szkockiej łyżki i “unijna ćwiartka” wyborowej (0.2) :P
    A wracając do tematu – warto odpowiednio skonfigurować ustawienia prywatności na FB. Poza tym jest kilka innych zabiegów, które manipulowanie danymi – czy to “Сk” różnie się od tego “Ck” (podpowiedź – Unicode :P).

  13. Miało być – Poza tym jest kilka innych zabiegów, które utrudniają manipulowanie naszymi danymi – czy to “Сk” różnie się od tego “Ck” (podpowiedź – Unicode :P)?

  14. “jak ktoś mi powie na podstawie tego zdjęcia, kto siedział za mną na tylnej kanapie, to stawiam mu piwo.”
    Będę odpowiadał… Turecki słoń pochodzenia azjatyckiego, który odbył nielegalną przeprawę przez granicę województwa lubelskiego, w celu odbycia szkolenia na kierunku ślusarz-sportowiec. Zdjęcie jest zrobione właśnie po zakończeniu końcowego egzaminu z Teorii Sterowania prowadzonego przez prof. Jakub Stopiwek-Niedopił.
    Zgadłem?

  15. @Piotr: puszek piwa było tyle, ileście wczesniej wsadzili.

    Sześciopak pocztą czy odbiór osobisty?

  16. Trochę temat jest, bo:
    1. Zgromadzonych danych osobowych (cóż, w przypadku Polski to się pod GIODO łapie, prawda?) jest sporo i są w jednym miejscu. Ściągający pisał o sporej liczbie przesłanych danych – raczej poza zasięgiem przeciętnego Kowalskiego.
    2. Mimo wprowadzenia i nagłośnienia przez FB opcji służących ochronie prywatności (mniej lub bardziej), pokazuje, że mało kto z tego skorzystał.

    Z ciekawostek, bo właśnie się bawię pewnym skryptem, ale słabo znam opcje obu serwisów – na Twitterze czy Identi.ca nie można ukryć pokazywania znajomych, danych o sobie itp., prawda?

  17. Ja się dziwię, że jeszcze nikt nie płacze, że jego dane są w książce telefonicznej…

  18. @rozie: art. 3a, ust. 1, pkt.2 UODO – “Ustawy nie stosuje się do podmiotów mających siedzibę lub miejsce zamieszkania w państwie trzecim, wykorzystujących środki techniczne znajdujące się na terytorium Rzeczypospolitej Polskiej wyłącznie do przekazywania danych”. Z tego co wiem serwer FB jest w USA, zatem GIODO nie ma tu pola manawru. Druga sprawa – jeżeli ktoś wyraża zgodę na przetwarzanie swoich danych zgodnie z regulaminem jakiegoś serwisu, niech później nie robi afery z faktu, że jego dane są publicznie dostępne. Powinno się:
    1. Uważnie czytać wszystkie klauzule, które się akceptuje.
    2. Podać tylko te dane, które są niezbędne.
    3. Ustawić odpowiedni poziom dostępu do swoich danych przez osoby trzecie.
    I tyle tylko wystarczy, aby później nie lamentować, że nasze dane można “wygooglać”.

  19. Skoro już jesteśmy przy kwestiach ustawień prywatności i Facebooka to polecam zadanie domowe w postaci takiego skonfigurowania w/w serwisu żeby rzeczy/elementy zapisane w “Lubię to” nie były publicznie dostępne (a samo zadanie jest wredne, bo … nie da się, jedyne co znalazłem na sieci to utyskiwania że brak takiej funkcji).

  20. @KrystianCK: Wszystko się zgadza. Miałem na myśli taką bazę ściągniętą (albo zrobioną) przez osobę/firmę w Polsce. GIODO by się interesowało, zapewne. OTOH taki John Smith to żadna dana osobowa, jak jest ich 17k.

  21. Ja zgłosiłem konto do usunięcia (fałszywe konto na to samo imię i nazwisko, zdjęcie profilowe) z 2 albo 3 tygodnie temu (jak nie jeszcze wcześniej) ale FB nic z tym nie robi, jak narazie nadal jest aktywne.

  22. @rozie: wszystko zależy od danych, jakie znalazłyby się w takiej bazie. Jak dla mnie imię i nazwisko to nie są dane osobowe w rozumieniu ustawy (nie umożliwiają szybkiej i łatwej identyfikacji danej osoby – patrz John Smith), zatem i w tym przypadku GIODO nie miałby się czego przyczepić. Druga sprawa – “Ustawy nie stosuje się do osób fizycznych, które przetwarzają dane wyłącznie w celach osobistych lub domowych” (UODO, art. 3a, ust. 1, pkt. 1). Cele osobiste lub domowe można różnie interpretować ;)

  23. …”Całość można ściągnąć w postaci pliku torrent wraz z crawlerem, którego użyto do pobrania danych z katalogu. Archiwum ma łączny rozmiar 2,8 GB, co już samo w sobie obrazuje, z jak ogromną liczbą informacji (w całości tekst) mamy do czynienia.” http://wolnemedia.net/?p=23125
    to jak to jest z tym facebookiem?

  24. @KrystianCK:
    “Ustawy nie stosuje się do podmiotów mających siedzibę lub miejsce zamieszkania w państwie trzecim, wykorzystujących środki techniczne znajdujące się na terytorium Rzeczypospolitej Polskiej wyłącznie do przekazywania danych”. Afaik to o tranzyt ruchu chodzi, FB sie pod to nie lapie.

  25. @matipl – Katarynie skasowali, z Pan Kominek działa. Chyba że Pan to jakies imie ;-)

  26. @oleg: podałem banalny sposób jak sprawdzić, nie stosując zaawansowanego sprawdzania czy Jan Kowalski to Jan Kowalski.
    Jak żenującemu Kominkowi działa to niech się cieszy ;)

  27. @forkbomb: afaik portal o którym mówimy ma serwery na terenie USA. Zatem jeżeli FB nie ma żadnych przedstawicielstw ani środków technicznych do przetwarzania danych w Polsce to IMHO nie podlega pod UODO tylko pod przepisy obowiązujące w USA.

  28. @Cyprian

    Bzdura, ja tam mam schowane swoje “like”.

    “Things I share” wszystko poza “Posts by me” ustawione na “Only me”.

  29. Jeszcze raz to napiszę… A co z danymi z książek telefonicznych ? Toż to są bazy danych osobowych ! Jakiś haker może je przecież wykorzystać ! Trzeba napisać do prasy i telewizji, że dane milionów Polaków są w niebezpieczeństwie !

    Nienawidzę głupoty…

  30. @KrystianCK:
    “wyłącznie do przekazywania danych” przekazywania, nie przetwarzania. routing, nie data mining. (czyli nie interesuje nas przetwanie danych osobowych ukrainicow na amekrykanskich serwerach mimo ze te dane leca z ukrainy do ameryki przez polskie)

  31. Praktycznie większość popularnych portali udostępnia takie dane lub nawet więcej..

  32. […] tak, to na pewno będzie miał do tego większe prawo niż poprzednim razem, kiedy to ktoś zebrał publicznie dostępne dane wszystkich użytkowników Facebooka (takie jak imię, nazwisko i […]

  33. […] Zmiana lub reset hasła zawsze działa podobnie. Pytanie o nazwisko panieńskie matki, datę urodzenia — czyli w większości dane, które można łatwo sprawdzić np. w internecie (vivat Facebook, vivat Nasza-Klasa i zbyt-trudne-do-zrozumienia ustawienia prywatności). […]

Twój komentarz

Zamieszczając komentarz akceptujesz regulamin dodawania komentarzy. Przez moderację nie przejdą: wycieczki osobiste, komentarze nie na temat, wulgaryzmy.

RSS dla komentarzy: