15:03
18/6/2020

Nie, nie mogło. Co nie znaczy, że wyniki ankiety są prawdziwe i “boty” w ankiecie TVP nie głosowały. Dyskusja na ten temat w mediach jest uproszczona, bo prowadzą ją politycy (lub sympatycy polityków). Jeśli jednak ktoś chce zrozumieć na czym polega fałszowanie ankiet internetowych i jak można tego dokonać, zapraszamy do lektury.

Strumień 600 botów

Wczoraj TVP info opublikowało ankietę na Twitterze:

A potem opublikowało informacje o tym, że “sonda jest nieważna” bo wykryto “strumienia 600 botów”:

W różnych ankietach internetowych oczywiście można głosować botami (o tym więcej za chwilę) i można nawet takie “fałszywie oddane” głosy wykrywać. Ale czy da się to zrobić na Twitterze, który w przeciwieństwie do innych serwisów nie pokazuje kto i jak głosował pod odpowiedziami? Może twórca ankiety ma dostęp do większej ilości bardziej szczegółowych danych? Niestety nie. Sprawdziliśmy to.

Najpierw opublikowaliśmy ankietę:

Potem zajrzeliśmy do mechanizmu analitycznego, który udostępnia Twitter:


Jak widzicie, nie ma tam informacji KTO oddał głos, ani na KTÓRĄ odpowiedź. Nie widzi tego nawet twórca ankiety.

Nie można więc będąc organizatorem ankiety na Twitterze stwierdzić, że zagłosowało “600 botów” ani wskazać na kogo te boty miałyby konkretnie oddać głos.

Nie mamy pojęcia jak TVP tak dokładnie wyliczyło liczbę botów. Naszym zdaniem określenie liczby fałszywie oddanych głosów w twitterowych ankietach nie jest możliwe.

To jednak nie oznacza, że w wyniki ankiety TVP należy wierzyć. W zasadzie, to nie należy wierzyć w żadne wyniki jakichkolwiek internetowych ankiet. Może niektórych rozczarujemy, ale każdej ankiecie można nabić głosy, nawet takim, które wymagają “założenia konta” (jak na Twitterze) do oddania głosu. Po prostu takie konta też da się (pół)automatycznie zakładać.

Jak fałszować ankiety?

W przypadku Twittera najprościej jest samodzielnie założyć lewe konta (tzw. boty, trole), którym wyda się instrukcję oddania głosu lub po prostu twitnięcia, lajknięcia, retwitnięcia. Przy czym w przypadku trzech ostatni akcji, takie boty da się namierzyć i powiązać ze sobą — co zrobiliśmy ostatnio na przykładzie siatki botów w kretyński sposób promujących rządową aplikację Protego. Te boty amplifikowały także treści dotyczące jednego z kandydatów na prezydenta (por. Poznaj siatkę trolli, która promuje rządową aplikację na Twitterze).

Boty można też kupić. Usług pozwalających na lajkowanie, retwittowanie, followowanie, spamowanie lub głosowanie na jakiejś platformie społecznościowej jest wiele. Nie będziemy tych patologii tu promować, jeśli ktoś wpisze w wyszukiwarkę odpowiednie zapytanie, znajdzie dziesiątki takich serwisów.

Oczywiście z botów można korzystać inteligentnie i mniej inteligentnie…

Czy ankieta była zmanipulowana?

Nawet jeśli jakaś platforma nie udostępnia informacji na temat tego kto i na kogo głosował, to można — z różnym prawdopodobieństwem — określić, że wyniki są “mocno podejrzane”. Chociaż, jak wspomnieliśmy, wyniki każdej ankiety należy traktować jako podejrzane i niewiarygodne z założenia.

Z kronikarskiego obowiązku opiszmy techniki wykrywania anomalii w głosowaniach internetowych. W zasadzie, to termin jest samoopisujący się, bo chodzi właśnie o obserwacje anomalii. Można próbkować wyniki ankiety (np. co 5 minut) i sprawdzać w jakim tempie przyrastają głosy na poszczególnych kandydatów. Jeśli następnie wykreślimy zebrane próbki na wykresie i zobaczymy piki w przyrostach, może to oznaczać, że w krótkim przedziale czasu nagle zagłosowało kilka-kilkadziesiąt-kilkaset razy więcej osób. To może być wynik wydania instrukcji “botom”: głosujcie!

Ale równie dobrze, może to być efekt udostępnienia ankiety (retwitnięcia) przez osobę o mocnych zasięgach w danej sieci społecznościowej, która ma homogenicznych co do odpowiedzi w ankiecie followersów.

Przy próbkowaniu trzeba jednak pamiętać, że czasem sam serwis na którym prowadzona jest ankieta nie podaje wyników w czasie rzeczywistym (a co 5 lub 15 minut, albo co gorsza w innych nieregularnych okresach), co może zakłamać wyniki.

Gdyby ankieta nie była anonimowa, moglibyśmy prześledzić te osoby, które oddały głos “w piku” i sprawdzić, czy są botami za pomocą kilku prostych analiz. W przypadku ankiety TVP INFO nie jest to możliwe, bo to ankieta na Twitterze. Tylko Twitter może to zrobić (a po namierzeniu lewych kont, usunąć głosy i “skorygować” wyniki. Jeśli więc one się teraz zmienią drastycznie, to może to oznaczać wyeliminowanie przez Twittera siatki botów).

Warto też zwrócić uwagę, że boty to nie zawsze tylko i wyłącznie lewe konta założone po to aby np. oddawać głosy. Co złośliwsze grupy manipulatorów mogą przejmować konta prawdziwych Twitterowiczów, którzy nie są botami, normalnie funkcjonują, ale po prostu na chwilę ktoś “zaloguje się na ich konto i odda z niego głos”. To trudniejsze, ale też możliwe. I znacznie utrudnia wykrywanie fałszerstw.


Jak do przejęć kont prawdziwych użytkowników (nie tylko Twittera) dochodzi? Najczęściej przez wycieki danych, oczym opowiadamy na naszym webinarze “Jak ochronić swoje dane przed wyciekiem” — z kodem strumien600botow otrzymacie dostęp w cenie o 60PLN niższej.

Przejęcie konta (nie tylko na Twitterze) to częsty problem. Dlatego warto je zabezpieczyć przed nieautoryzowanym dostępem — ja kto zrobić? Zobacz nasz darmowy webinar na ten temat.

Manipulować można sprytniej

Aby nie narazić się na powyższe, “statystyczne” metody wykrywania anomalii, operator botnetu może (jeśli ma odrobinę oleju w głowie) stopniowo oddawać głosy swoimi botami. Nie wszystkimi naraz. Powinien przy tym dbać, aby wyniki nie były drastycznie różne od innych podobnych sondaży.

W przypadku rankingu prezydentów, różne sondy pokazują raczej remis lub niewielkie przewagi pomiędzy panem Dudą a Trzaskowskim. Sprzyjający jednemu lub drugiemu kandydatowi botnet nie powinien więc wybijać swojego faworyta głosami “pod niebiosa”, a dbać o to, aby wynikom ankiety “pomagać” stopniowo, kiedy jego faworyt spada na drugie miejsce.

Zwracamy tu uwagę na cudowną możliwość zinterpretowania każdego wyniku ankiety na swoją korzyść. Jeśli wygraliśmy lekko, to wygraliśmy. Jeśli przegraliśmy, to kandydat używał botów. Jeśli wygraliśmy z podejrzanie wysokim wynikiem, to mówimy, że zwolennicy przeciwnika użyli botów aby podbić nasz wynik i uczynić go niewiarygodnym, bo nie mogą stolerować tego, że mamy przewagę, więc robią wszystko, żeby ją zdyskredytować. :-)

Głosowanie przez internet to zło

Jeśli możecie, unikajcie głosowania przez internet. Nie, dodanie captcha albo wymóg podania PESEL-u aby badać “jednorazowość” oddania głosu to nie są doskonałe metody ograniczania manipulacji.

  • PESELI jest masa publicznie dostępnych, a jeśli jego właściciela nie informuje się o tym jak zagłosował w danej ankiecie (co jest niemożliwe, bo jak organizator miałby ustalić czyjś e-mail/telefon), to każdy może zagłosować za kogoś.
  • CAPTCHĘ da się obejść na wiele sposobów. Od technik czysto programistycznych, o których opowiadamy na naszym szkoleniu z Atakowania i Ochrony Webaplikacji po użycie botnetu… prawdziwych Hindusów, którym płaci się za rozwiązywanie captchy ręcznie.

Jest powód, dla którego profesjonalne sondażownie do szacowania wyników korzystają z ankiet przeprowadzanych telefonicznie.

Technologia nie jest doskonała

Internetowe głosowanie, podobnie jak ochrona przed koronawirusem za pomocą aplikacji mobilnych, to kolejny przykład na to, jak technologia którą obecnie dysponujemy nie jest idealna i nie nadaje się do wszystkiego, czego potrzebują ludzie.

Internet jest przydatny i ma wiele plusów. Ale elektroniczne głosowanie ma sporo wad w stosunku do tradycyjnego, papierowego oddawania głosów (o hackowaniu “internetowych wyborów” w 15 i 23 odcinku naszego podcastu “Na Podsłuchu”). Te papierowe też można fałszować, ale te internetowe fałszować można masowo, szybko, automatycznie i anonimowo. Oto przykład:

[poll id=”51″]

Pamiętajcie o tym i z dystansem podchodźcie do wszystkich wyników internetowych ankiet.


Aktualizacja 22.06.2020, 11:42
TVP sugeruje, że “strumień 600 botów” wykryło porównując (w trakcie trwania ankiety) liczbę oddanych głosów podaną pod twitem a liczbę podawaną w statystykach widocznych dla konta, które publikuje ankietę…

Słusznie TVP zauważa że liczby głosujących podane pod ankietą a w statystykach różnią się. Ale wnioski wynikające z tej różnicy TVP stawia jednak trochę na wyrost ;) podpierając się dowodami raczej anegdotycznymi, opisując mechanizm, którego działania nie jest i nie może być pewna.

W naszej testowej ankiecie też różnice są (patrz film). Czy TVP uważa, że u nas było 1k+ botów? Serio? Z naszych testów wynika, że każda większa ankieta pokazuje rozjazd pomiędzy tymi liczbami, ale to nie oznacza, że w ankiecie oddawane są głosy przez boty a na pewno, nie że botów jest tyle ile wynosi różnica.

Skąd więc te różnice? Nie wiemy. Tylko Twitter wie. Dlatego zamiast snuć hipotezy o lukach czy “pompowaniu ruchu” jak TVP, my wysłaliśmy zapytanie do Twittera, jak to kiedyś zwykli robić dziennikarze… Jak otrzymamy odpowiedź, podzielimy się z Wami.

Te różnice nie są jednak dowodem na prawdziwość stwierdzenia TVP. Matematyka zresztą nie spina się nawet samemu TVP. W ich krótkiej (!) testowej ankiecie są o 3 boty za dużo ;) Z czasem ta liczba by urosła, bo może twitter ankiety podlicza z opóźnieniem, a może nie liczy tych bez avatara albo podanego nru telefonu albo tych, co głosy oddali spoza aplikacji mobilnej. Można tylko spekulować.

Podtrzymujemy, że naszym zdaniem nie można:

    1. wiarygodnie określić ile botów głosowało w ankiecie
    2. dowiedzieć się, która z odpowiedzi (który z kandydatów) była wybierana przez boty (ustalić ile głosów jest lewych)

A zatem TVP nie było w stanie wykryć “strumienia 600 botów” na podstawie ww. analizy.

PS. Jeśli chcecie się dowiedzieć jak weryfikować internetowe anomalie i oszustwa, jak namierzać ślady zostawiane przez sprawców i tożsamości osób, które za wszystkim stoją oraz powiązane z nimi firmy, zapraszamy do udziału w naszym szkoleniu z OSINT-u, czyli Białego Wywiadu, gdzie prezentujemy jak wykorzystywać publicznie dostępne źródła i narzędzia do pozyskiwania informacji i przewagi nad konkurencją lub po prostu lepszego dbania o prywatność swoich internetowych działań. Większość botów kliknie tutaj automatycznie.

Przeczytaj także:


Dowiedz się, jak zabezpieczyć swoje dane i pieniądze przed cyberprzestępcami. Wpadnij na nasz kultowy ~3 godzinny wykład pt. "Jak nie dać się zhackować?" i poznaj kilkadziesiąt praktycznych i przede wszystkim prostych do zastosowania porad, które skutecznie podniosą Twoje bezpieczeństwo i pomogą ochronić przed atakami Twoich najbliższych. Uczestnicy tego wykładu oceniają go na: 9,34/10!

Na ten wykład powinien przyjść każdy, kto korzysta z internetu na smartfonie lub komputerze, prywatnie albo służbowo. Wykład prowadzimy prostym językiem, wiec zrozumie go każdy, także osoby spoza branży IT. Dlatego na wykład możesz spokojnie przyjść ze swoimi rodzicami lub mniej technicznymih znajomych. W najbliższych tygodniach będziemy w poniższych miastach:

Zobacz pełen opis wykładu klikając tutaj lub kup bilet na wykład klikając tu.

31 komentarzy

Dodaj komentarz
  1. Dodajmy, że w wysokodostępnych systemach rozproszonych często stosuje się tzw. “eventual consistency” (https://en.wikipedia.org/wiki/Eventual_consistency) przez co podczas odświeżania wyników ankiety liczba głosów może niekiedy spadać. Nie jest to dowodem manipulacji i usuwania głosów, lecz użycia architektury mogącej wytrzymać dowolne obciążenia.

    • Wydaje się, że głównym argumentem był nagły wzrost głosów. Tyle, że Twitter może korzystać (i nie byłoby to wcale takie głupie) z asynchronicznego modelu przetwarzania wiadomości czy też zwykłej kolejki do zliczania ankiet.
      To tłumaczyłoby nagły wzrost odpowiedzi.

    • Myślę że w tym przypadku nie było by rabanu gdyby % głosów trzaskowski vs duda były ze sobą zamienione :)

      btw. a tvp to już nie umie zrobić platformy do głosowania?
      btw2. a to nie można zrobić ‘refresh page’ z kontrolą czy ciastko nie wyparowało? jak nie to po następnym głosowaniu z kompa by wylazło kasowanie ciastka, czyli utrata tymczasowej identyfikacji utrudniającej duplikację głosów.

      można rejestrować IP i sprawdzać czy z danego IP głosy są jednorodne.

      ale profesjonalne tvp (???) woli użyć tweetera buahahaha :) w końcu na coś te 2MLD ekstra rocznie idą.

    • Nie może na podstawie IP gdyż wykluczałoby to z możliwości oddania głosów osobom nie mających własnego zewnętrznego IP. Dodatkowo można by oddać tyle głosów ile urządzeń ma dostęp do sieci kom. Poza tym można zmieniać IP

  2. Ja chyba wiem jak określili liczbę botów. Pewnie Sami “wysłali” 600 sztuk aby głosowały na Dude, nie pomogło za bardzo no to napisali co napisali i nie kłamali.

  3. A czemuz to ocenzurowaliscie jedno z kont z “siatki trolli”? Czyzby sie do Was zglosil?

  4. Nie przykładam wagi do ankiet, poza tym to nie ankiety wygrywają wybory. Ankiety są słabo zabezpieczone chyba, że to jakieś poważne duże serwisy i/lub social media nieco lepiej zabezpieczone. Najsłabsze skrypty są zabezpieczone np. po IP, cookies a to można w banalny sposób obejść – zmianą IP (dhcp) kasowaniem cookies
    i voila.

  5. Nie tak trudno też sobie wyobrazić, że nagły wpływ 600 głosów na któregoś z kandydatów to nawet niw tyle efekt retwitnięcia, co po prostu mobilizacja w sztabie wyborczym. Najzwyczajniej w świecie 600 członków sztabu mogło w tym samym czasie otrzymać wiadomość: loguj się na Twittera i głosuj. To nie jest na tyle duża anomalia, żeby wykluczyć, że powstała mniej lub bardziej naturalnie (w każdym razie nie dzięki botom).

  6. Ustalić wprost że to były trolle nie mogli,za to ustalić że był nagły skok i to głosów na Trzaskowskiego – jak najbardziej mogli. Oczywiście nie jest to dowodem bo i może to wynikać z działania serwerów twittera i z ludzi którzy się rzucili na internetową ankietę…

    Zresztą anonimowe ankiety internetowe z natury są podatne na zmanipulowanie przez boty czy inne rozwiązanie,no nie można tu chyba mieć ciastka (pełna anonimowość użytkowników względem twórców ankiety) i zjeść ciastka (mieć rzetelne głosowanie 1 głos = 1 człowiek).

  7. Akurat w przypadku takiej ankiety da się ją zabezpieczyć. Ograniczony czas jej trwania powoduje, że przy nowym pomyśle na zabezpieczenie nie będzie czasu na opracowanie oprogramowania do ataku botów, bo to też wymaga czasu. Ale 2 mld to za mało i musieli darmową na twitterze zrobić.

    • Zapłacisz Hindusom za głosowanie i oprogramowanie nie potrzebne.

  8. Ej, ale macie świadomość, że po API na levelu różnych aplikacji komercyjnych (dużych) można czytać dane z ankiet w zasadzie live i wykrywać anomalie? Bo mam wrażenie, że trochę nie znacie tematu, o którym piszecie…

    • A które API pozwala na pobranie nazw użytkowników oddających głosy (i to na kogo oddają głosy)? Dasz znać?

    • Równie chętnie poznam odpowiedź na pytanie Piotra.
      Czas start…

    • still waiting

    • Np. CrimsonHexagon

  9. Już pomijając kwestię botów czy innej, ew. manipulacji przy tej ankiecie, to zauważmy jedną rzecz: znaczna część wyborców obecnego Prezydenta Polski zwyczajnie nie śledzi twittera TVP, i ogólnie rzadko lub wcale korzysta z internetu, więc to było do przewidzenia, że w internetowej ankiecie większe szanse ma Pan Trzaskowski. Jak zresztą zauważono w artykule, różne sondaże na reprezentacyjnej grupie obywateli dają inne wyniki.

    • Mam wrażenie, wręcz sądzę, że się mylisz.
      Wejdż na profile różnej maści propagandystów PiS, mieniących się dziennikarzami, i zobacz reakcje ich obserwatorów na jakikolwiek wpis przeciwny PO lub innej partii opozycyjnej.
      Zauważysz setki zadowolonych ćwierknięć.

  10. Ale zobaczcie na liczbę głosów. W tym wypadku 600 głosów oddanych przez boty zbyt dużo nie zmienia :-)

  11. Czy TVP Info mogło wykryć “strumień 600 botów” fałszujących ankietę na Twitterze?
    “Nie. Nie mogło”

    Czyżby?
    https://tvp.info/48600557/strumien-600-botow-ujawniamy-jak-mozna-kupic-glosy-w-ankietach-twittera

  12. Dla mnie to są z grubsza tematy fikcyjne. Tego typu problemy można rozwiązać stosunkowo prosto przy niewielki spadku anonimowości.

    https://polandthoughts.blogspot.com/2020/06/pewien-mechanizm-potwierdzania.html

  13. Technik sledzenia jest wiele i nie musza sie one opierac o udostepniane przez Twiter dane. Najprostsza technika tego nie wymagajaca to ‘poisoned content’ ktora udostepnia dane do poziomu kto, jak i zkad glosowal. Stosowalna na wiekszosci portali pozwalajacych wielokrotnie odpytywac o wynik. Czasami przeszkadza cache – wtedy wychodzi ‘klasteryzacja’ wynikow ale z tym daje sie zyc.
    Tak tez twierdzenie ze ‘nie da sie’ jest nieprawdziwe. Jest mozliwe ale jest kosztowne (i pewnie w przypadku TVP wladcy twitera by sie wkurzyli bo bezstronni to oni nie sa).
    Ciekawszym pytaniem jest czy taki monitoring da sie zrobic w sposob niezauwazalny dla adminow? Sadze ze sie da ale tu juz jest kwestia kosztow. W sumie bywalo juz w historii ze caly ruch do i z Polski ciurkal przez Atlanyk do (jak sie mowilo) jednego pokoju w New Yorku. Dlaczego by wiec tego nie powtorzyc dla innych obszarow sieci?

  14. Jakaś odpowiedź redakcji na to?
    https://spidersweb.pl/2020/06/sonda-tvp-info-twitter-manipulacja.html

  15. >po użycie botnetu… prawdziwych Hindusów, którym płaci się za rozwiązywanie captchy ręcznie

    Ehh im to płacą a ja za darmo codziennie muszę kilkadziesiąt razy wskazywać przejścia do pieszych, sygnalizacje i samochody…

    • To zacznij pobierać opłatę, np. 5-10zł i od razu będzie mniej chętnych (szczególnie jeśli to stali klienci).

  16. 3 dodatkowe boty dostali naturalnie w bonusie dla stałych klientów :)

Twój komentarz

Zamieszczając komentarz akceptujesz regulamin dodawania komentarzy. Przez moderację nie przejdą: wycieczki osobiste, komentarze nie na temat, wulgaryzmy.

RSS dla komentarzy: