Panašų projektą vykdo ir H.Van Der Kaa komanda. Pasak žinomos žurnalistės, mes gyvename atvirų duomenų epochoje, o technologijos daugeliu atveju juos pasiekti gali žymiai greičiau nei žmogus. Pašnekovės teigimu, daugelis išsigąstų pamatę, kiek informacijos apie kiekvieną iš mūsų yra sukaupta internete. „Tranparency international“ Lietuvos skyriaus kvietimu H.Van Der Kaa vedė mokymus Lietuvos žurnalistams.
– Jūs mokslininkė ar žurnalistė?
Įsigilinus į skaičius galima pamatyti labai įdomių istorijų.
– Pradėjau dirbti žurnaliste. Taip pat dirbau leidėja. Turėjau sekti išlaidas, pajamas ir supratau, kad man patinka dirbti su duomenimis. Įsigilinus į skaičius galima pamatyti labai įdomių istorijų. Prieš penkerius metus Nyderlanduose duomenų žurnalistika sparčiai populiarėjo. Nutariau specializuotis būtent šioje srityje. Grįžau į universitetą, apsigyniau disertaciją.
Universitete buvau priskirta Informacinių technologijų katedrai. Visiems buvo gana keista ten matyti žurnalistę. Buvau sutikta labai šiltai, nes programuotojai pagaliau pamatė, kaip praktikoje gali būti naudojami jų kuriami įrankiai. Apie mūsų tyrimus ėmė rašyti žiniasklaida.
– Kas yra duomenų žurnalistika?
Vis dažniau susisteminti duomenys virsta baigtais tekstais. Ir tam net nereikia žurnalisto dalyvavimo. Tai vadinama automatizuota žurnalistika.
– Tai gana paprasta. Savo tyrimams žurnalistai naudoja ne komentarus ar nuomones, o duomenis. Dažnai, tai tiesiog lentelės su skaičiais. Tai yra duomenų žurnalistikos esmė – duomenys gryniausiame jų pavidale.
Tai gali būti tyrimo dalis, tačiau vis dažniau susisteminti duomenys virsta baigtais tekstais. Ir tam net nereikia žurnalisto dalyvavimo. Tai vadinama automatizuota žurnalistika.
Kaip tik šiuo metu kuriame tokią programinę įrangą. Tai lengva palyginti su seismologiniais stebėjimais. Sistema renka duomenis iš daviklių ir praneša apie žemės drebėjimus. Jei duomenų pakanka, gali būti išsiunčiama perspėjimo žinutė. Mūsų atveju duomenys gali virsti tekstais.
– Kompiuterinė programa pakeičia žurnalistą?
Galima sakyti, kad tai naujoji žurnalistika.
– Galima sakyti, kad tai naujoji žurnalistika, tačiau jai reikia priėjimo prie duomenų. Taip pat, ne visas istorijas galima paversti programos algoritmu. Tai negali pakeisti tradicinės žurnalistikos. Visada reikės žmogaus dalyvavimo.
Duomenų žurnalistika labai svarbi verslo žiniasklaidai. Per trumpą laiką galima apdoroti labai daug duomenų ir juos pateikti skaitytojui. Šia technologija naudojasi daug didelių tarptautinių žiniasklaidos bendrovių – „Associated Press“, „Forbes“, „New York Times“.
Automatizuota žurnalistika naudojama visai su skaičiais susijusiai informacijai pateikti. Pavyzdžiui, sporto straipsniams.
– Ar tokios technologijos įkandamos nedidelių valstybių žiniasklaidos priemonėms?
Šios technologijos gali būti naudojamos ne tik faktų surinkimui, tačiau ir jų tikrinimui. Programa gali skenuoti tinklalapius, duomenų bazes, net pdf dokumentus ieškodama pavadinimų arba vardų.
– Technologijos plačiai taikomos anglakalbėse šalyse, tačiau Europoje jos dar nėra taip paplitusios. Olandų kalba, kaip ir lietuvių, nėra tokia populiari pasaulyje, todėl mes kuriame programas, kurios leis šias technologijas diegti mūsų šalies žiniasklaidos priemonėse. Bendradarbiaujame su didžiausiu Nyderlandų dienraščiu, tačiau tai tik pradžia.
Šiuo metu pasaulyje yra trys bendrovės, kurios siūlo panašias technologijas. Mes savo programai universitete gavome 700 tūkst. eurų. Projektą kuria komanda žmonių. Taip, tai nemažai, tačiau sistema gali kurti tekstus, kuriuos kurtų atlyginimą gaunantys žmonės. Kompiuterio algoritmas negali perteikti emocijos, tačiau puikiai gali perduoti faktus.
Šios technologijos gali būti naudojamos ne tik faktų surinkimui, tačiau ir jų tikrinimui. Programa gali skenuoti tinklalapius, duomenų bazes, net pdf dokumentus ieškodama pavadinimų arba vardų. Žmonėms prireiktų labai daug laiko tokiai informacijai patikrinti. Mes šią sistemą jau naudojome atskleisdami nusikalstamas schemas.
– Kur randate jus dominančius duomenis? Juk sakoma, kad informacijos šaltiniai yra didžiausias žurnalisto turtas.
– Nemažai duomenų ES valstybėse yra viešai prieinami. Tai viešieji pirkimai, turto registrai ir kitos duomenų bazės. Iš esmės valstybės tampa didelėmis duomenų bazėmis.
Šiuos įrankius mes imame naudoti žurnalistikoje, tačiau valstybės juos jau seniai naudoja. Mano šalyje panaši technologija naudojama identifikuoti asmenis, kurie internetu parduoda didelius kiekius daiktų. Tikrinama, ar šie asmenys sumokėjo mokesčius.
– Kaip manote, kaip ateityje atrodys žurnalisto darbas?
– Žurnalisto vaidmuo išliks toks pats. Žurnalistai bus tarsi sarginiai šunys, kurie stebės, kas darosi valstybėje. Tiesiog keisis jų instrumentai. Ateityje žurnalistas turės būti ir geras IT specialistas. Jau dabar žurnalistams tenka dirbti su didžiuliais kiekiais informacijos ir ją filtruoti neturint jokių technologinių žinių yra be galo sunku.
Programos niekada nepakeis gyvo pokalbio tarp žmonių, bet sudėtingesnėms temoms reikės naujų įrankių.
– Ar naudojant tokias technologijas nekyla pavojus lengvai pažeisti asmens privatumą?
– Buvau nustebusi, kad Lietuvoje galima laisvai gauti informaciją, kokį turtą valdo politikai. Nyderlanduose tai suvokiama kaip privati informacija ir ji nėra viešai prieinama.
Jūs tikrai išsigąstumėte, jei žinotume, kiek informacijos apie jus yra internete ir kas ją valdo. Mobilieji telefonai, socialiniai tinklai, paieškos sistemos, valstybės įstaigų duomenų bazės. Asmeninę informaciją labai sudėtinga apsaugoti.