VDU profesorė Jūratė Ruzaitė apie neapykantos kalbą: atpažinti padeda ir dirbtinis intelektas

– Neapykantos kalba – seniai egzistuojantis reiškinys. Kuo ypatingas palyginus neseniai atsiradęs virtualios neapykantos kalbos fenomenas?

– Ji išsiskiria masiškumu, nesuvaldomais turinio kiekiais. Nors neapykantos kalba nėra naujas reiškinys, bet tokį turinį fizinėje erdvėje, tarkime, užrašą ant pastato sienos išplatinti yra ganėtinai sudėtinga. Virtualios platformos šiuos pasisakymus leidžia tiražuoti neaprėpiamais kiekiais.

Taip pat galima ne tik kurti naują turinį, bet ir platinti tai, kas jau sukurta, o tai irgi yra neapykantos skatinimas. Kitas svarbus klausimas – galimybė virtualų turinį teisiškai reguliuoti. Virtualioje erdvėje sienų tarp valstybių nėra, tad kyla sunkumų taikant įstatymus, kovojančius su neapykantos kalba. Pavyzdžiui, viename elektroninės muzikos festivalio reklamos filmuke buvo panaudoti Aušvico koncentracijos stovyklos įvaizdžiai, nukreipti prieš mažumas. Reklamos kūrėjai iš Olandijos buvo nubausti, o filmuko sklaida šalyje sustabdyta, bet vaizdo klipas buvo toliau platinamas kitose šalyse. Net praėjus keleriems metams po šios baudžiamosios bylos, vaizdo įrašą dar galima rasti Vimeo platformoje.

– Tiek pasaulyje, tiek Lietuvoje jau kuriami virtualūs neapykantos kalbos atpažintuvai, kurie nuskaito tūkstančius komentarų ir bando identifikuoti tuos, kurie yra įžeidūs ar kursto neapykantą. Kaip veikia virtualios neapykantos kalbos atpažintuvai?

– Kai aptinkama rizika, atsižvelgiama į daug įvairių kalbinių kategorijų. Viena iš bazinių kategorijų yra skyrybos ženklai: tarkime, matomas perteklinis ar nepakankamas skyrybos ženklų vartojimas gali suponuoti, kad tai yra rizikingas komentaras. Taip pat gali būti ieškoma didžiųjų raidžių, raidžių sekų ar tarp jų įsiterpiančių skyrybos ženklų. Jei tekste yra daug skaičių, tarpų ar skyrybos ženklų, dažnai paaiškėja, kad nekentėjai taip sąmoningai ir sistemingai bando neapykantos kalbą užmaskuoti ir taip apeiti automatizuotus įrankius: tarkime, komentatorių mėgiamas „3,14diec“, kur skaičiai yra matematinio dydžio Pi raiška.

Vis dėlto, tai yra paviršiniai dalykai ir jų neužtenka – dažnai tokie modeliai apima ir žodžių leksiką – įžeižius, žeminančius grupių įvardijimus, įvarius epitetus (pvz.: snarglius, mazgotės), gyvūnų pavadinimai, asocijuojami su kvailumu, tokie kaip „asilas“. Svarbu ir kaip leksika komentare pasiskirsto, kokie žodžių junginiai vartojami, ar komentare yra keiksmų, vulgarizmų, tiesioginių nuorodų į lytiškumą. Pavyzdžiui, dažnai pasitaiko užgaulūs kreipiniai su „tu“, pvz.: „tu šiukšle“ ir paprastai tokiais kreipiniais pradedamas komentaras. Atkreipiamas dėmesys, ar yra išskiriama specifinė visuomenės grupė, į kurią komentaras nukreiptas. Pirmieji neapykantos kalbos atpažinimo įrankiai buvo paremti raktinių žodžių sąrašais, savotiškais žodynais. Visgi, labai greitai pastebėta, kad tai yra neveiksminga, nes neapykantos kalba keičiasi itin sparčiai, joje labai daug variantiškumo – sukuriami naujadarai, neologizmai, kurie taip pat kinta.

– Kiek efektyvios šiuolaikinės dirbtinio intelekto sistemos?

– Sėkmingiausios neapykantos kalbos atpažinimo sistemos remiasi keliais skirtingais metodais bei vertina bendrą komentaro kontekstą pagal labai skirtingus parametrus. Kuo daugiau parametrų pasitelkiama, tuo jautresnė ir tikslesnė ta sistema. Vienas naujausių tokios anglų k. sistemos pavyzdžių remiasi penkiais-šešiais tokios kalbos nustatymo metodų tipais. Šios sistemos tikslumas yra apie 90 proc. Vis dėlto, automatizuotos sistemos yra problematiškos, nes kalba yra daugiareikšmiška.

Vis dėlto, automatizuotos sistemos yra problematiškos, nes kalba yra daugiareikšmiška.

Svarbu pridėti, kad automatinis atpažinimas orientuotas į kalbinę neapykantos raišką, tačiau virtualioje erdvėje aktualesni tampa vizualieji aspektai, kuriems kol kas yra skiriama per mažai dėmesio. Vizualus turinys yra itin sugestyvus, dar lengviau platinamas bei leidžia perteikti žinutę tiesiogiai jos neišsakant. Tai yra dar vienas iš šių sistemų iššūkių, kurie kol kas nėra sprendžiami. Taip pat šios sistemos neatskiria įžeidaus turinio nuo neapykantos kalbos, bet net ir netobulos neapykantos kalbos atpažinimo sistemos yra tikrai geriau nei nieko.

– Kokiuose lietuviškuose kontekstuose neapykantos kalba dažniausiai pastebima?

– Kiek teko susidurti, neapykantos kalba dažniausiai nukreipta į LGBTQ+ bendruomenės narius ir migrantus – tokio turinio aptinkama daugiausiai, taip pat išskirtinis šio turinio variantiškumas. Tarkime, žiniasklaidoje imigrantai dažnai yra nužmoginami, matomi kaip grėsmė, daroma skirtis tarp „jie“ ir „mes“. Kitos pažeidžiamos visuomenės grupės irgi sulaukia komentarų, bet ne tokiais kiekiais. Etniniu pagrindu dažniausiai diskriminuojami musulmonai ir arabų kilmės žmonės.

Šiuo atveju leksika ir įvardinamos žeminančios savybės yra daug įvairesnės nei bet kurios kitos kitataučių grupės Lietuvoje atveju – į vieną vietą suplakama tiek daug dalykų, tad sunku net išskirti, ar arabų kilmės žmonės smerkiami etniniu bei religiniu pagrindu. Pavyzdžiui, į musulmonus nukreipta neapykantos kalba pasižymi kaltinimais nusikalstamų veiksmų vykdymu, socialinės gerovės sistemos išnaudojimu. Taip pat svarbi erdvė, kurioje ta grupė pristatoma: pavyzdžiui, imigrantai dažniausiai apibūdinami kaip nepriklausantys, svetimi nusakomai erdvei. Plačią naratyvų, argumentų įvairovę galima pastebėti ir neapykantos kalboje prieš LGBTQ+ asmenis. Kaip žeminantis aspektas dažnai yra pabrėžiamas „gėjiškumas“, neva, medicininis diskursas, vertinama, ar tai „sveika“, ar „nesveika“, kritikuojami nukrypimai nuo normos ir pan.

Kaip žeminantis aspektas dažnai yra pabrėžiamas „gėjiškumas“, neva, medicininis diskursas.

– Šiandieniniame politiniame kontekste matome išaugusią visuomenės poliarizaciją. Atrodo, kad neapykantos kalbos mastas auga. Galbūt lingvistinė analizė galėtų padėti tokią kalbą suvaldyti?

– Remiantis daugelio šalių duomenimis, neseniai Alikantės universitete vykusiose Tarptautinės kalbos ir teisės asociacijos organizuotose konferencijose, padaryta išvada, kad matomas stabilus neapykantos kalbos augimas. Nors gana aišku, kad priešiškumas visuomenėse didėja, bet vienareikšmiškai tai vertinti yra sunku: auga ir žmonių sąmoningumas, vis daugiau kalbama apie neapykantos kurstymą ir nusikaltimus, griežčiau reguliuojami socialiniai tinklai, žmonės yra raginami tokias situacijas atpažinti ir apie jas pranešti. Tad galimai tokie duomenys byloja ne tik apie neapykantos turinio gausėjimą, bet ir apie augantį žmonių jautrumą jam. Kalbant apie politinį kontekstą, matome daug pavyzdžių, kurie byloja, kad viešieji asmenys gali daryti įtaką visuomenės priešiškumui.

Pavyzdžiui, 2018 m. Didžiosios Britanijos premjeras Boris Johnson musulmones moteris, viešojoje erdvėje dėvinčias burkas, palygino su pašto dėžutėmis ir bankų plėšikais. Kaip žinia, žiniasklaida atidžiai seka politikų pasisakymus, tad šie ministro pirmininko žodžiai išplito greitai ir plačiai. Po savaitės organizacija „Tell MAMA“, kuri stebi neapykantos nusikaltimus, užfiksavo keturis kartus didesnį neapykantos kurstymo prieš musulmonus atvejų skaičių. Taigi, sąsajos tarp viešųjų asmenų pasisakymų ir neapykantos kalbos masto išaugimo yra akivaizdžios. Į tokius atvejus reikia reaguoti, kitaip kyla neapykantos kurstymo normalizavimo pavojus. Vienas efektyviausių būdų – į neapykantą neatsakyti neapykanta, reaguoti su humoru. Žiniasklaida, viešinanti politikų pasisakymus, irgi turėtų atidžiai įvertinti, kaip tai pateikti visuomenei. Aš labiausiai tikiu ne vien įstatyminiu, teisiniu reguliavimu, bet mūsų visų pilietišku veikimu, empatija ir sąmoningumu, tad labiausiai reikia šviesti žmones.

– Kaip manote, kaip automatinio neapykantos kalbos atpažinimo sistemos atrodys ateityje?

– Artimoje ateityje pilnai automatizuotų tokio tipo sistemų nesitikėčiau. Mano manymu, dirbtinio intelekto gebėjimas atpažinti riziką tekste jau ir taip yra itin pažangu. Prisiminkime, kad neapykantos kalbos tyrimai yra gana šviežia sritis – jie prasidėjo tik apie 2005 m., suklestėjo – apie 2015-2018 m. Kol kas svarbiausia suvokti, kokie neapykantos turinio mechanizmai skirtingose kalbose egzistuoja, kaip jie veikia ir į ką reikia atkreipti dėmesį. Pavyzdžiui, neapykantos kalbos tyrimuose pastebėta, kad sintetinėse kalbose (tose, kuriose yra gausu formų, priesagų, prielinksnių, linksnių ir pan.) labai svarbios gramatinės raiškos priemonės.

123RF.com nuotr./Dirbtinis intelektas

Tarkime, lietuviškuose neapykantos tekstuose pastebimos mažybinės formos, deminutyvai. Tokie subtilūs aspektai išryškėja kalbą tyrinėjant, tad, mano manymu, tobulesni techniniai sprendimai atsiras geriau pažįstant patį kalbinį reiškinį. Jau nekalbu apie tai, kad laikui bėgant mūsų technologijos ir sprendimai tobulėja – pirmosios neapykantos kalbos atpažinimo sistemos rėmėsi primityviais raktinių žodžių žodynėliais, o šiandien sistemos jau gali atpažinti daug subtilesnę kalbinę raišką.

VDU profesorė Jūratė Ruzaitė apie neapykantos kalbą: atpažinti padeda ir dirbtinis intelektas

Pranešti klaidą

Sėkmingai išsiųsta