Praėjusį penktadienį „Facebook“ užblokavo britų bendrovės „Cambridge Analytica“ paskyrą savo tinkle. Apie tai, kokį vaidmenį tikslingai orientuotos „Cambridge Analytica“ reklamos sklaidos metodika suvaidino 2016-ųjų JAV prezidento rinkimuose, pradėta kalbėti netrukus po rinkimų. O štai praėjusią savaitę bendrovės paskyra užblokuota dėl to, kad bendrovė pažeidė duomenų tvarkymo protokolą, kuriuo nustatyta bendroji duomenų rinkimo, perdavimo ir saugojimo tvarka, – o ne dėl to, kas su šiais duomenimis buvo padaryta.
Žaidė ne pagal taisykles ir melavo
Akademikas Aleksandras Koganas naudotojų duomenis surinko pasiūlęs jiems pasinaudoti specialia programėle, kuri žmogaus psichologinį paveikslą sukuria remdamasi jo elgesiu tinkle „Facebook“. Problema kilo tada, kai A.Koganas nusprendė šiuos duomenis perduoti tretiesiems asmenims. Bendrovės „Cambridge Analytica“ paskyra tinkle „Facebook“ užblokuota ne todėl, kad ji surinko naudotojų duomenis ir juos panaudojo, o todėl, kad tai padarė ne pagal taisykles.
Sužinojusi, kad pažeistas duomenų tvarkymo protokolas, bendrovė „Facebook“ pareikalavo, kad „Cambridge Analytica“ sukauptus duomenis ištrintų. Pastaroji sutiko, tačiau neilgai trukus „Facebook“ per savo informatorių išsiaiškino, kad duomenys, deja, neištrinti. Taigi, „Cambridge Analytica“ paskyra šiuo metu yra užblokuota.
Vis dėlto daugiausia dėmesio šioje istorijoje sulaukė tai, kaip surinkti duomenys buvo panaudoti. Daugelis apstulbo, sužinoję, kokį tikslų ir detalų žmogaus psichologinį paveikslą galima sukurti remiantis vien, atrodytų, niekuo neypatingu jo elgesiu socialiniuose tinkluose. Tokie psichologiniai paveikslai apie daugelį tinklų naudotojų kuriami kasdien – jiems tereikia atlikti veiksmą, ir apie jų tapatybę bus padarytos atitinkamos išvados.
Tai atliekama renkant duomenis arba internete, per socialinių tinklų profilius, arba realiame gyvenime, pavyzdžiui, stebint atsiskaitymų įvairiose parduotuvėse istoriją. Psichologinis žmogaus paveikslas paprastai kuriamas antrame plane, žmogui apie tai nė nesusimąstant. O sutikimą rinkti jų duomenis ir leisti jais naudotis žmonės duoda patys – lengva ranka paspausdami vieną mygtuką ir visiškai nesigilindami, ką tas paspaudimas reiškia.
Ką apie mus pasako tai, kas mums patinka
Visiems puikiai suprantama, kad pasakyti, kokia žmogaus politinė orientacija, galima pažvelgus į tai, kokie politikai ar organizacijos tam žmogui patinka ar ką jis seka. Jei apie žmogaus politinę orientaciją tyrėjas spręstų pagal jo mėgstamus politikus, šiuos duomenis vadintume išoriškai patikimais duomenimis (angl. face valid data). Tai reiškia, kad vertinamas dalykas yra aiškiai susijęs su dalyku, kurį siekiama nuspėti (t. y. su politine orientacija).
Mažiau žinoma tai, kad daugumą, o gal ir visas, žmogaus asmenines savybes galima atspėti (žinoma, spėjimas gali ir nebūti visiškai tikslus) pasinaudojant bet kokia apie tą žmogų žinoma informacija. Kad spėjimas būtų tikslus, vertinamas dalykas neprivalo atitikti išorinio patikimumo kriterijaus. Jei galima manyti, kad vienas dalykas yra nuosekliai susijęs su kitu, visiškai nebūtina, kad ryšys tarp jų būtų akivaizdus arba priežastinis. Svarbu tik tai, kad ryšys būtų. Būtent juo remiantis ir yra atliekami spėjimai. Šis metodas dažnai vadinamas empiriniu metodu, metodu „iš apačios į viršų“ arba duomenų analizės metodu.
Susumavus pakankamai daug tokio pobūdžio duomenų, galima daryti patikimas išvadas. Žinoma, rezultatas visada tuo geresnis, kuo daugiau surinkta duomenų, net jei dauguma tų duomenų arba jie visi – prastos kokybės. Jei duomenys būtų aukštos kokybės, tokiam pat spėjimo tikslumui užtikrinti jų reikėtų mažiau. Tačiau jei aukštos kokybės duomenys kartais gali būti nepatikimi (pavyzdžiui, jei išorinio patikimumo kriterijų atitinkanti informacija yra melaginga) arba jų gali būti sunku gauti, tai prastos kokybės duomenų – apstu, ir jie puikiai tinka.
Galima pabandyti eksperimentą atlikti patiems
Prieš kelerius metus atliktas tyrimas, kuriam vadovavo psichologas, duomenų analitikas Michalas Kosinskis (ir kurį vėliau taikliai apibendrino komikas Stephenas Colbertas), labai aiškiai parodė, kiek daug galima išsiaiškinti pagal patinka paspaudimus tinkle „Facebook“. Naudodamiesi šiais duomenimis, tyrėjai geba pakankamai tiksliai įvardyti žmonių asmenybės bruožus, seksualinę orientaciją, politinį prielankumą ir kt.
Atitinkamus algoritmus ištobulinus grupėje žmonių, kurių rūpimus prognozavimo rezultatus tyrėjai žino iš anksto (vadinamoji mokomoji imtis), juos galima taikyti naujiems žmonėms – tiems, kurių prognozavimo rezultatai nežinomi. Kaip tai veikia, galima išbandyti patiems, leidžiant panaudoti savo „Facebook“ arba „Twitter“ duomenis (pažymėtina, kad nurodyta svetainė nėra siejama su bendrovės „Cambridge Analytica“ skandale minimu tyrėju, taigi nėra pagrindo baimintis, kad jūsų informacija yra arba bus naudojama kokiais nors nepageidaujamais tikslais; šiaip ar taip, kaskart, leidus kažkam prieiti prie savo duomenų, reikėtų suvokti, kad tas kažkas prie jų tikrai prieis).
Tikslas ne toks, kaip gali atrodyti
Pasak rašinio autorės, pasinaudojus minėta nuoroda ir leidus prognozavimo algoritmui „suvirškinti“ savo „Facebook“ profilį, jai buvo pateiktas štai toks jos psichologinis paveikslas: ji – moteris (vienas iš pagrindinių kintamųjų, leidusių algoritmui padaryti tokią išvadą, – kad jai patinka Vinas Dieselis), gebanti konkuruoti (nes patinka „Sephora“) ir labai protinga (sprendžiant iš to, kad patinka Willas Smithas). Kiti algoritmo spėjimai vis dėlto buvo mažiau tikslūs, teigia ji. Antai padaryta neteisinga prielaida, esą ji yra nelaiminga (nes patinka Rob Zombie), nors ji pati teigia, kad yra absoliučiai laiminga.
Taip pat įdomu tai, kad tie patys kintamieji pasitelkiami bandant nuspėti skirtingus bruožus. Pavyzdžiui, tai, kad jai patinka „Starbucks“ ir Barackas Obama, yra lemtingi veiksniai beveik visuose spėjimuose, pastebi J. Derringer. Vis dėlto ji pabrėžia, kad šių algoritmų tikslas nėra pateikti tikslų kiekvieno žmogaus psichologinį paveikslą.
Tikslas – surinkti ir panaudoti kuo daugiau duomenų, kad politinę ir komercinę reklamą būtų galima nukreipti kuo taikliau, taip sutaupant pinigų ir maksimaliai padidinant poveikį. O žvelgiant iš akademinės arba mokslinės perspektyvos, tokia priemonė leistų sutaupyti nemažai laiko, kuris iššvaistomas klausinėjant žmonių įvairiausių dalykų, nors juos išsiaiškinti galima paprasčiausiai pasitelkiant jau esamus duomenis, jei tik naudotojai leidžia prie jų prieiti.