Primer ravnanja z biološkimi in biotehnološkimi podatki v okviru raziskovalnih projektov na NIB

dr. Marko Petek, Nacionalni inštitut za biologijo

V bioloških in biotehnoloških raziskavah za analizo vzorcev pogosto uporabljamo omske metode, s katerimi preučujemo odzive organizmov ali bioloških sistemov na nivoju genomov, vseh izraženih genov, metabolitov itd. Te visoko-zmogljivostne metode generirajo velike količine podatkov (nekaj GB – nekaj TB na študijo) zato predstavlja njihovo obvladovanje po načelih FAIR velik izziv. Za večino uveljavljenih metodogij so vzpostavljeni centralni repozitorji za surove podatke ter pripadajočimi ontologijami, podatkovnimi standardi in minimalnimi standardi poročanja. V praksi tekom izvajanja raziskovalnih projektov le-to ni dovolj za transparenten pregled in timsko delo, predvsem ker podatke večinoma najprej hranimo lokalno. Prav tako repozitoriji in standardi za nekatere novejše metodologije še niso vzpostavljeni.

Za varno, urejeno in interoperabilno naravnano lokalno shranjevanje podatkov za raziskovalne projekte smo na Oddelku za biotehnologijo in sistemsko biologijo razvili sistem pISA-tree. Ta temelji na shranjevanju podatkov v hierarhičnih mapah na treh nivojih, preiskava/študija/poskus (angl. »Investigation/Study/Assay«; ISA), in metapodatkov za vsak nivo v tekstovnih datotekah v ISA-Tab formatu. Uporabljajo ga tako raziskovalci, ki delajo v molekularno-bioloških laboratorijih (angl. »wet lab«), kot tudi tisti, ki se ukvarjajo samo s statistično in bioinformatsko obdelavo podatkov ali modeliranjem (angl. »dry lab«). Dodatno omogoča pISA-tree tudi avtomatski prenos podatkov na odprti podatkovni repozitorj FAIRDOMHub.

Dodaj odgovor

Vaš e-naslov ne bo objavljen. * označuje zahtevana polja