Gyvename realybėje, kai kas sekundę kiekvienas interneto naudotojas sukuria apytiksliai 1,7 megabaito (MB) naujos informacijos – kasmet visam duomenų kiekiui saugoti reikia 418 mlrd. 1 terabaito (TB) talpos duomenų kaupiklių. Kadangi duomenų centrams reikia daug energijos išteklių ir dabartiniai milžiniško duomenų kiekio įrašymo būdai yra tinkami informaciją saugoti ne ilgiau nei šimtmetį, turime ieškoti tvaresnio informacijos saugojimo būdo.
Inovatyvūs informacijos saugojimo būdai vystomi ir Lietuvoje
DNR molekulės nepaprastai stabilios – jos gali išsaugoti šimtų tūkstančių metų senumo genetinę informaciją, o jai įrašyti nereikia daug energijos. Negana to, DNR gali saugoti milžinišką kiekį duomenų ir tam nereikia didelių patalpų serveriams ar kitai techninei įrangai.
Lietuvos genetinių tyrimų įmonė „Genomika“ su savo partneriais iš Silicio slėnio, sintetinės biologijos ekspertais „Twist Bioscience“, sėkmingai vysto inovatyvią idėją DNR grandinę pritaikyti taip, kad į ją, tarsi į skaitmeninę laikmeną, būtų galima įrašyti bet kokius duomenis. „Genomika“ su kolegomis pirmieji Lietuvoje užkodavo skaitmeninę informaciją DNR grandinėje ir toliau tobulina į DNR įrašytų duomenų nuskaitymo metodus.
Komandos siekis – palengvinti į DNR įrašytų duomenų nuskaitymo technologiją, kad ji taptų prieinamesnė visuomenei, greitesnė ir pigesnė už šiuo metu pasaulyje naudojamus metodus.
Istorija
Pirmasis mokslininkas, pasiūlęs idėją DNR panaudoti kaip skaitmeninės informacijos saugojimo terpę, buvo legendinis fizikas Richardas P. Feynmanas. Apie tai jis 1959 m. kalbėjo savo garsiojoje paskaitoje „There's Plenty of Room at the Bottom“ – dar tada, kai žinios apie dvigrandę DNR struktūrą buvo labai ribotos. Teorinių pasvarstymų apie tokį DNR panaudojimo būdą būta ir praėjusio amžiaus 7 deš., tačiau apie praktiką nebuvo jokios kalbos – to neleido tuometės techninės galimybės.
DNR sekoskaitos technologijos buvo tobulinamos itin sparčiai: 1977 m. Nobelio premijos laureatas Frederickas Sangeris pristatė savo sukurtą DNR sekoskaitos metodą, o 2001 m. publikuoti pirmieji žmogaus genomo sekoskaitos rezultatai. 2015 m. Oksfordo universiteto mokslininkai pristatė unikalią nanoporų sekoskaitos technologiją, leidžiančią šį procesą vykdyti itin nebrangiai naudojant gana paprastą ir kompaktišką įrangą – delne telpantį prietaisą, jungiamą prie kompiuterio. Būtent tokį prietaisą Lietuvos mokslininkai ketina pritaikyti į DNR įrašytai informacijai nuskaityti.
Drastiškai atpigo ir DNR sekoskaita. Amžiaus pradžioje vieno žmogaus DNR sekoskaitos kaina siekė maždaug 1 mlrd. JAV dolerių, o šiandien ji yra mažesnė nei 1 000 dolerių – per beveik du dešimtmečius kaina sumažėjo net milijoną kartų ir toliau nuolat krinta.
Pirmasis sintetinėje DNR grandinėje užkoduotas duomenų fragmentas buvo menininko Joe Davido kūrinys – senovinė runa, simbolizuojanti gyvenimą ir Motiną Žemę. Harvardo universiteto mokslininkai 1988 m. šią runą, kurią sudarė 5 x 7 taškų matrica, įrašė į bakterijų E. coli sekoskaitą.
Pirmieji praktinio pritaikymo būdai
Didžiausi tokios duomenų saugyklos pranašumai yra ypač didelis tankis ir tvarumas. Pavyzdžiui, duomenų analizės bendrovė „Statista“ nurodo, kad 2021 m. pasaulyje bus sugeneruota 74 mlrd. TB, arba 74 zetabaitai (ZB), duomenų. 1 grame DNR, mokslininkų skaičiavimu, gali tilpti 455 eksabaitai (EB) – milijonai terabaitų – duomenų. Taigi, visus duomenis, kurie pasaulyje bus sugeneruoti per šiuos metus, teoriškai galima sukelti į mažiau nei 163 gramus sveriančią DNR grandinę.
Net jeigu tokios duomenų saugojimo technologijos efektyvumas siektų vos 1 proc., jos pranašumas prieš bet kurias dabartines duomenų saugojimo technologijas būtų milžiniškas. Be to, informacijos saugojimo problema ateityje taps vis aktualesnė – prognozuojama, kad generuojamų duomenų kiekis augs maždaug po 20 proc. kasmet.
Dar vienas DNR molekulių pranašumas yra jų stabilumas. Mokslininkų teigimu, jų pusamžis yra apie 500 metų įprastinėmis sąlygomis arba šimtai tūkstančių metų saugant molekules itin žemos temperatūros sąlygomis. Fosilijų ilgaamžiškumas – vienas geriausių to įrodymų.
Šiandien praktinis duomenų įrašymo į DNR grandinę technologijos panaudojimas žengia dar tik pirmus žingsnius. Kol kas jie lėti ir netvirti: vien į DNR įrašytai informacijai nuskaityti reikalingi tam tikri molekulinės biologijos metodai, o grandinės nuskaitymas gali užtrukti keletą dienų. Vis dėlto, įvertinus tai, kaip veikė pirmieji diskiniai kaupikliai, atsiradę kompiuterių eros pradžioje, ir matant, į ką jie išsivystė per keletą dešimtmečių, DNR, kaip skaitmeninių duomenų saugojimo terpės, ateitis – daug žadanti. Moksliniai tyrimai ir technologijų vystymas šioje srityje vykdomi itin aktyviai, todėl galima pagrįstai tikėtis spartaus DNR kaip informacijos įrašymo terpės galimybių augimo. Šio informacijos saugojimo būdo perspektyvumą praėjusiais metais pademonstravo ir JAV įmonė „Twist Bioscience“, į DNR grandinę įrašiusi „Netflix“ serialą „Biohackers“.
Taikant dabartines technologijas užkoduoti 1 MB informacijos DNR grandinėje kainuoja apie 3 500 JAV dolerių, tačiau drastiškas kainos mažėjimas yra būdingas ne tik biotechnologijoms (kaip jau minėtai DNR sekoskaitai). Neįtikėtinu tempu krenta ir skaitmeninių technologijų kainos. Palyginkime: prieš daugiau nei 40 metų pirmieji IBM pagaminti diskiniai kaupikliai, kuriuose tilpo 5 MB duomenų, buvo dviejų šaldytuvų dydžio, svėrė 1 toną ir kainavo 10 000 JAV dolerių už kiekvieną megabaitą, arba daugiau nei 98 000 JAV dolerių šiandienos verte. Šiandien į delną teplančio 1 TB diskinio kaupiklio kaina svyruoja apie 40 JAV dolerių. Taigi, 1 MB saugojimo kaina per šį laiką atpigo beveik 2,5 mlrd. karto.
Kas laukia ateityje?
Pirmieji sėkmingi šios technologijos praktinio pritaikymo pavyzdžiai teikia vilčių, kad bus sukurta stabili, tvari ir gamtai nekenksminga (mažai išteklių eikvojanti) duomenų saugyklų alternatyva. Net jei informacijos saugojimas DNR molekulėse netaps plačiausiai naudojamu informacijos saugojimo metodu, mokslininkai jau dabar beveik įsitikinę, kad tai bus pati patraukliausia technologija, kuomet reikės išsaugoti milžiniškus duomenų kiekius arba bus numatyta duomenis saugoti itin ilgą laiką.
Prisiminus, kaip sparčiai informacijos saugojimo technologijos buvo tobulinamos dar visai netolimoje praeityje, galbūt visai netrukus, be išorinių standžiųjų diskų ar USB atmintinių, kaip dar vieną pasirinkimą turėsime ir šią inovatyvią technologiją?