Kada į Lietuvą ateis didžiųjų duomenų ir dirbtinio intelekto revoliucija?

Viso pokalbio klausykite:

Apie duomenų atvėrimą ir jų potencialą, duomenų valdymą Lietuvoje per pandemiją ir ateities algoritmus.

Inovacijas skatina akistata su problema

Duomenų analitikos paslaugas teikiančios įmonės „Exacaster“ vadovas Š.Chomentauskas teigia, kad 2010 metais, kai pradėjo veiklą DI srityje, šios technologijos nebuvo paplitusios ar žinomos plačiajai visuomenei. Tebuvo akademinių straipsnių raktažodis. O pavadinimas „didieji duomenys“ (angl. big data) dar neegzistavo. 2015 metais nemažai įmonių pradėjo domėtis DI technologijomis ir prasidėjo didžiųjų duomenų revoliucija ir jų diegimas. Tačiau Lietuvoje tai vyksta itin lėtai.

„Tarp to, ką šiandien leidžia technologijos, ir tarp to, ką naudoja įmonės, vis dar egzistuoja didžiulė praraja. Jeigu Lietuvoje peržengsime penkiasdešimt didžiausių įmonių topą ir leisimės toliau sąraše, pamatysime, kad situacija beveik nepasikeitė, naujų sprendimų nėra įdiegta“, – pasakoja įmonės „Exacaster“ vadovas.

Jis pabrėžia, kad naujų, su duomenimis susijusių sprendimų, poreikis didėja, o problemos aštrėja – duomenų kiekiai vis didėja, sistemos dar labiau paseno, atsirado privatumo iššūkių ir yra jaučiamas vis didesnis specialistų stygius. Pasak Š.Chomentausko, įmones nuo naujų technologijų diegimo atbaido įvairios priežastys – didelių investicijų poreikis, radikalių pokyčių baimė arba tiesiog poreikio nesuvokimas.

Pašnekovas pabrėžia, kad neretai inovatyvūs sprendimai ar apsisprendimas taikyti kokią nors naują technologiją gimsta akis į akį susidūrus su sunkiai išsprendžiama problema. Taip atsitiko ir jo atveju, kai dirbant telekomunikacijų bendrovėje atsirado poreikis analizuoti didžiulius duomenų kiekius rinkodaros ar klientų aptarnavimo tikslais.

„Tam, kad gautume atsakymus, neretai tekdavo užsidaryti kabinete savaitei, atšaukti skambučius, susitikimus ir atsivertus „Excel“ lentelę eiti per kiekvieną eilutę ir ją peržiūrint ieškoti įvairių hipotezių. Akivaizdu, tai nebuvo labai efektyvu. Todėl natūraliai kildavo mintis, kad turi būti geresnis būdas visa tai išspręsti. Tuomet atsirado įvairios mokslinės publikacijos apie algoritmus, leidžiančius spręsti tokio pobūdžio problemas. Mes pabandėme savo sprendimus diegti, šis tas pavyko. Todėl nusprendėme, kad verta pabandyti rimčiau“, – pirmuosius žingsnius DI srityje prisimena Š.Chomentauskas.

Nuo teisės aktų iki duomenų valdymo pokyčių

Anot Š.Chomentausko, duomenų valdymo pokyčius Europoje paskatino atsiradęs Bendrasis duomenų apsaugos reglamentas (trump. BDAR), kuris įmones padalijo į dvi stovyklas: tuos, kurie iš tikrųjų pradėjo gilintis į esmę ir diegti pokyčius, ir tuos, kurie tiesiog atliko formalumus.

„Vienur teisininkai atliko savo darbą, atsirado privatumo politikos, sausainėlių (angl. cookies) rinkimo sutikimai, bet fiziniame pasaulyje niekas nepasikeitė. Kitos įmonės iš tiesų bandė spręsti problemą ir dabar yra toje būsenoje, kai jau supranta reikalingų pokyčių mąstą. Netrumpas laiko tarpas praėjo nuo pokyčių įsigalėjimo. Taigi tik dabar pradedama suprasti, ką reiškia terminas „privacy by design“ – veikla turi būti vykdoma, kad kurtų privatumą“, – sako Š.Chomentauskas.

Pašnekovo teigimu, neseniai įvykęs „City Bee“ atvejis – puiki iliustracija to, kodėl iš tikrųjų reikia spręsti duomenų apsaugos problemą. Anot Š. Chomentausko, šią problemą galima spręsti įmonėse diegiant „privatus nuo pat pradžių“ filosofiją. Privaloma įsivertinti, kuriuos duomenis kaupiant atsiranda didžiausios rizikos. Taip pat reikia pagalvoti ir apie tai, ką daryti, kad tiems duomenims atsiradus internete, jie taptų beverčiais tiems, kas juos pavogė.

„Čia turime daugybę techninių sprendimų – pradedant nuo tokenizavimo – kai nėra asmens kodų, o tik raidžių kratiniai, taip pat šifravimo algoritmai, duomenų paskirstymas per skirtingas bazes“, – galimus sprendimus vardijo Š.Chomentauskas.

Tokie sprendimai, anot pašnekovo, reikalauja ne tik finansinių investicijų, bet ir laiko bei personalo resursų. BDAR taikymui įvairiu veiklos lygmeniu prireikia laiko – tai sunkus procesas, reikalaujantis praktikos ir supratimo, kokio galutinio rezultato siekiama.

Duomenų atvėrimas ir pandemijos išryškintos spragos

Nors ir viešajame sektoriuje netrūksta įvairių iniciatyvų bei diskusijų apie duomenų valdymą bei panaudojimą, anot Š.Chomentausko, globaliame kontekste Lietuva duomenų valdymo srityje vis dar atsilieka ir savo potencialo neišnaudoja: „Mes domimės šia tema, bet realios patirties yra labai mažai. Daugelis kalbančiųjų šia tema neturi praktinio taikymo patirties. Dėl to pas mus yra labai lėtas progresas. Sakyčiau pastarąjį penkmetį, kaip valstybė, mes pramiegojome“.

Pašnekovas pasakoja, jog būtent vykstanti pandemija atskleidė duomenų valdymo spragas, ji akivaizdžiai parodė, kad tik ten, kur skiriame dėmesį, esame susitvarkę, o sritys, kurios lyg šiolei nebuvo svarbios – visiškai apleistos. Ne ką mažiau iššūkių sukėlė ir pasiruošimo, teisinės bazės nebuvimas bei neaiškios finansavimo galimybės.

Anot Š.Chomentausko, tik prasidėjus pirmajam karantinui, buvo labai aiškios galimybės matuoti žmonių mobilumo lygį, tačiau praktikoje buvo susidurta su jau minėtais iššūkiais, o atėjus antrajai bangai bei vakcinacijai, ši tema buvo pamiršta.

„Gali būti, kad šios pamokos taip ir neišmoksime. O kas bus, jei bus kita pandemija? Juk galima būtų išmokti šio to ir iš šios situacijos – suprasti, kad duomenys yra instrumentas, su kuriuo dirbti reikia pradėti iš anksto. Duomenis reikia kaupti, tvarkyti ir juos pasiimti tuomet, kai jų prisireikia. Nesiruošimas yra trumparegiškas ir nevisuomeniškas požiūris tiek žiūrint iš valstybinės, tiek iš verslo pusės“, – teigia Š.Chomentauskas.

Duomenų analitikos paslaugas teikiančios įmonės vadovas judėjimui į priekį ragina atverti valstybinius duomenis: „Duomenų atvėrimas sukuria daug galimybių. Duomenys ir yra dirbtinis intelektas, nes dirbtinis intelektas tėra ne kas kita, kaip tų duomenų kompiliatas – jis juos sukaupia, apibendrina ir sudeda į algoritmą. Be duomenų, algoritmo nėra, tad neperduodami duomenų, mes negalime judėti į priekį“.

Pašnekovo teigimu, atverti duomenis galima ir nesukeliant chaoso ar papildomų rizikų – atverti duomenis siūloma ne apie žmones, o apie daiktus, prietaisus, žaliavinius srautus. Kaip pavyzdį Š.Chomentauskas pateikia institucijų internetinių puslapių lankomumo statistiką, kurią atvėrus būtų galima sužinoti, kiek kainuoja vieno lankytojo apsilankymas. Taip pat, ar tai efektyvu. Pašnekovas pabrėžia, kad valstybiniai duomenys yra jau sukurti. Be to, už juos sumokėję esame visi, tad ši informacija turi būti vieša.

Technologijos siūlo sprendimus

„Exacaster“ vadovas pažymi, kad darbą su duomenimis dirbtinis intelektas pakeitė iš esmės, o kai kuriose srityse matomas ypač didelis proveržis. Šiandien jau turime tokias technologijas ir algoritmus, kurie patys savarankiškai veikdami bei analizuodami, gali mums pateikti savo sukurtus sprendimus.

„Atsirado naujos rūšies algoritmai, vienas jų – „reinforcement learning“. Šis algoritmas neprašo, kad jam pasiūlytum visus įmanomus variantus, jis pats tyrinėja aplinką, eksperimentuoja ir randa geriausią rezultatą. Tik, deja, labai mažai įmonių tiek automatizavusios savo veiklą, kad tokius algoritmus būtų galima tinkamai panaudoti“ – apie pastarųjų metų virsmus pasakoja Š.Chomentauskas. Pasak pašnekovo, tokios sritys, kaip vaizdo, garso atpažinimas, teksto generavimas – sparčiai veržiasi į priekį.

„Yra tokia algoritmų įmonė „OPEN AI“, kuri 2019 metais padarė neuroninį tinklą su 1,5 mlrd. parametrų. O 2020 metais tinklas jau turėjo 175 mlrd. parametrų. Jie stipriai nekeitė algoritmo esmės, bet dėmesį skyrė techninėms problemoms. Rezultatai stulbinantys – algoritmas jau moka programuoti „Python“ kalba, rašyti rišlų Šekspyro tekstą ir laisvai pagal bet kokią temą sugeneruoti 50 tūkst. žodžių esė“ – geriausiais pavyzdžiais DI proveržyje dalijasi „Exacaster“ vadovas.

Tačiau tenka paminėti, kad toks malonumas nėra pigus – remiantis skirtingais šaltiniais, šio algoritmo mokymo kaina siekia 5–12 mln. dolerių. Kitą, labai panašų pokytį, vykstantį su algoritmais, pašnekovas mini algoritmo tobulinimą. Švaistūniškus, daug elektros sunaudojančius bei neefektyviai informacijos nepernaudojančius algoritmus šiuo metu bandoma tobulinti taip, kad jie reikalautų mažiau mokymosi arba mažiau sąlygų ir pagalbos.

Kada į Lietuvą ateis didžiųjų duomenų ir dirbtinio intelekto revoliucija?

Inovacijas skatina akistata su problema

Nuo teisės aktų iki duomenų valdymo pokyčių

Duomenų atvėrimas ir pandemijos išryškintos spragos

Technologijos siūlo sprendimus

Pranešti klaidą

Sėkmingai išsiųsta