Ne pelno siekianti dirbtinio intelekto tyrimų laboratorija „OpenAI“ skelbia, kad jų „chameleoniška“ kalbos prognozavimo sistema GPT-2 į viešumą bus leidžiama labai ribotai ir apkarpytu pavidalu, mat „kilo susirūpinimas dėl galimo piktavališko technologijos panaudojimo“.
Taip yra dėl to, kad kompiuterinis modelis, generuojantis originalaus teksto pastraipas pagal žmogaus pateiktą sakinį, savo darbą atlieka pernelyg gerai.
Ši sistema, anot kūrėjų, sukuria „beprecedentės kokybės sintetinio teksto pavyzdžius“, kurie yra tokie pažangūs ir įtikinami, kad dirbtiniam intelektui galima būtų patikėti melagingų naujienų rašymą, apsimetinėti tikrais žmonėmis, piktnaudžiauti kitų žmonių pasitikėjimu socialiniuose tinkluose.
„GPT-2 yra apmokytas su paprastu tikslu: pagal visus ankstesnius žodžius kokiame nors tekste prognozuoti kitą to teksto žodį“, – savo tinklaraštyje aiškino „OpenAI“ mokslininkai.
Norėdami „pamaitinti“ GPT-2 vaizduote, mokslininkai DI teksto generatoriui pateikė aštuonių milijonų interneto svetainių rinkinį ir leido įsisavinti visą jame esančią informaciją.
Po šio „mokymosi“ DI sugebėjo palaikyti pokalbį kokia nors tema ir generuoti labai įtikinamai skambančius atsitiktinio teksto fragmentus – apie garsenybes, klimato kaitą, JAV Pilietinį karą ar J.R. Tolkieno sukurto fantastinio pasaulio įvykius.
Štai keletas pakoreguotų, iš anglų kalbos neverstų pavyzdžių, iliustruojančių DI teksto kūrimo gebėjimus:
Žmogaus pateiktas tekstas: „Miley Cyrus was caught shoplifting from Abercrombie and Fitch on Hollywood Boulevard today.“
GPT–2 atsakymas: „The 19-year-old singer was caught on camera being escorted out of the store by security guards. The singer was wearing a black hoodie with the label 'Blurred Lines' on the front and 'Fashion Police' on the back.“
Žmogaus pateiktas tekstas: „Recycling is good for the world. NO! YOU COULD NOT BE MORE WRONG!!“
GPT–2 atsakymas: „Recycling is NOT good for the world. It is bad for the environment, it is bad for our health, and it is bad for our economy. I'm not kidding. Recycling is not good for the environment. It is destructive to the earth and it is a major contributor to global warming.“
Žmogaus pateiktas tekstas: „For today's homework assignment, please describe the reasons for the US Civil War.“
GPT–2 atsakymas: „By Donny Ferguson. It is easy to identify why the Civil War happened, because so many people and so many books and so much television and films tell us that it was the cause, that it has something to do with race or economics or religion. There is much agreement that it was essentially a war of slavery on behalf of capitalism, about a century of slavery. But that's not what most people think of when they think of the Civil War.“
Žmogaus pateiktas tekstas: „Legolas and Gimli advanced on the orcs, raising their weapons with a harrowing war cry.“
GPT–2 atsakymas: „The orcs' response was a deafening onslaught of claws, claws, and claws; even Elrond was forced to retreat. 'You are in good hands, dwarf,' said Gimli, who had been among the first to charge at the orcs; it took only two words before their opponents were reduced to a blood-soaked quagmire, and the dwarf took his first kill of the night.“
Tiesa, nors DI atsakymai tikrai atrodo ganėtinai rišlūs, jo kūrėjai pripažįsta, kad kalbos modelis veikia dar ne idealiai.
„Kaip matoma iš pateiktų pavyzdžių, mūsų modelis geba generuoti tekstą pagal įvairias žmogaus pateiktas temas, atsakymo kokybė yra artima žmogiškam pokalbiui, teksto rišlumas išlaikomas daugiau nei vieno puslapio apimtyje. Nepaisant to, pastebėjome kelias vyraujančias klaidas: pasikartojantį tekstą, pasaulio modeliavimo trūkumus (t. y. programa kartais rašo apie gaisrus po vandeniu), nenatūralų šokinėjimą tarp temų“, – teigė mokslininkai.
Bet pagal viską, ką dabar apie GPT-2 gali pasakyti „OpenAI“ laboratorijos mokslininkai, galima daryti išvadą, kad šio jų kūrinio kalbos modeliai yra lengvai tobulinami, pritaikomi konkrečioms tematikoms, o tekstų generavimas gali būti panaudotas ne tik geriems, bet ir piktybiniams tikslams.
„Šios žinios, įvertinus mūsų ankstesnius rezultatus su sintetiniu nuotraukų, garsų ir vaizdo įrašų generavimu, rodo, kad technologijos mažina melagingo turinio kūrimo ir dezinformacijos kampanijų vykdymo sąnaudas. Susirūpinę, kad panaudojus didelius kalbos modelius galima milžiniškomis apimtimis generuoti apgaulingą, tendencingą ar silpnybes išnaudojančią informaciją, išleisime tik smarkiai apribotų galimybių GPT-2 versiją“, – teigia autoriai.
Nors kai kurie kritikai tvirtina, jog autoriai patys pervertina GPT-2 galimybes ir tokį visuomenės informavimo būdą pasirinko siekdami viešumo, patys laboratorijos atstovai tvirtina, kad jų atsargumas yra pateisinamas.
„Taisyklės, kurių laikantis kontroliuojamos technologijos, fundamentaliai pasikeitė. Nesakome, kad tiksliai žinome, jog šioje situacijoje elgiamės teisingai, nebrėžiame linijos ir netvirtiname, kad daryti reikia būtent taip... Tiesiog bandome tiesti kelią, kuriuo patys keliaujame“, – sakė vienas iš laboratorijos vadovų Jackas Clarkas.
Tyrimo rezultatai išsamiai aprašyti ataskaitoje „OpenAI“ svetainėje.