Data v mikrobiologii CORE042: Data – odpověď na základní otázku života, vesmíru a vůbec... 6. přednáška Stanislava Bezdíček Králová a kol. Externista – Přírodovědecká fakulta MU CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU2 Přednášející a spoluautoři ̶ Václav Šeda ̶ CEITEC ̶ Mikroprostředí imunitních buněk ̶ FAIR data v klinickém a univerzitním výzkumu ̶ Matěj Bezdíček ̶ Fakultní nemocnice Brno ̶ Interní hematologická a onkologická klinika ̶ FAIR data v klinické mikrobiologii ̶ Stanislava Bezdíček Králová ̶ University of Vienna, Center of Microbial Ecology a nd System Science ̶ Přírodovědecká fakulta MU, externista ̶ Life science projekty, FAIR Data v mikrobiologii CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU3 Osnova ̶ Life cycle ̶ Historie vs. současnost ̶ Plánování ̶ Sběr/získávání dat ̶ Zpracování dat ̶ Analýza dat ̶ Uchování dat ̶ Poskytování dat ̶ Opakované využití dat CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU4 Historie V minulosti ̶ méně dat ̶ menší výpočetní náročnost ̶ jednoduší na uchování, organizaci, vyhodnocení Současnost ̶ změna instrumentace ̶ změna charakteru dat (pozorování vs. sekvenace) ̶ enormní nárust množství dat – digitální forma ̶ vyšší nároky na rutinní procesovaní – zisk, organizace dat, jejich sdílení, uchovávaní, procesovaní (úpravy), analýzy Raban & Gordon, Scientometrics (2020) CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU5 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU6 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU7 Plánování Co? – stanovení cíle Jak? – určení metodologického postupu (máme vše co potřebujeme?) – určení znalostního základu (dokážeme uskutečnit všechny kroky?) – dohodnutí spolupráce – rozložení finančních prostředků Kdo? – jeden výzkumník? – tým? – studenti? – kdo to zaplatí?! Kde? – získat vzorek + logistika – máme potřebnou instrumentaci? – dílčí časti u spolupracujícího pracoviště? (tuzemsko/zahraničí) Kdy? – časové plánovaní je extrémně důležité – kdy odeberu vzorky – stihnu je pak zpracovat? – kolik vzorků zpracuji? – potřebuji více odběrů v různých časech? – dílčí kroky vs. celkový projekt CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU8 Plánování – specifika klinického výzkumu Etická komise – Lidská DNA ve vzorcích = etický problém → nutné schválení – Ochrana osobních údajů – Informovaný souhlas Původ vzorků? – ambulantní vs. hospitalizovaný pacient – transport – krátkodobé uchování – dlouhodobé uchování – jeden výzkumník? – tým? – studenti? – kdo to zaplatí?! Kdy? – časové plánovaní je extrémně důležité – jak často budeme odebírat vzorky? – hledám něco typické nebo spíš raritní?? → někdy extrémně dlouhá doba do vytvoření dostačujícího souboru vzorků Kdo? – interpretace: často nutný klinik – často nutné zapojení více pracovišť Financování – nemocnice – granty → klinický vs základní výzkum CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU9 Plánování – příklady Terénní výzkum (Antarktida) ̶ chystání materiálu (6 měsíců před expedicí) ̶ chystání sensitivního materiálu (1 měsíc před expedicí) ̶ jak budou vzorky cestovat? ̶ jaké vybavení budu mít k dispozici? ̶ jak dokážu zpracovat vzorky? Přílet na Antarktidu: 1. příprava kultivačních médií 2. sterilizace materiálu po cestě 3. odběry na začátku expedice (kultivace 6–8 týdnů) 4. zpracovávaní vzorků 5. odběry na konci expedice (přenos do ČR) ✓ nesmí roztát ✓ nesmí se zahřát ✓ nesmí se střídat teploty ✓ kolik gramů ✓ kolik replikátů ✓ původ vzorků CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU10 Když plánovaní experimentu nevyjde – příklad z klinické praxe Studium invazivních mykóz – Zahájení nového projektu současně se sběrem vzorků – Spolupráce s klinikou v rámci nemocnice – Za rok sběru vzorků nasbírám 2 potvrzené a 3 suspektní vzorky na invazivní mykózu – výsledky → z výsledků u 5 vzorků neudělám relevantní závěry, nic nepublikuji Studium invazivních mykóz – Zahájení spolupráce s dalšími centry a po dlouhodobém bankování vzorků – Zahájení projektu s již získaným větším množstvím vzorků – výsledky → signifikantní počet vzorků k vyšetření umožňuje výsledky hodnotit, korelovat a dělat statisticky významné závěry, publikaci práce založené na takovém souboru nic nebrání CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU11 Když plánovaní experimentu nevyjde – příklad z praxe Myší experiment – nepromyšlené – ráno: podaní sulfoquinolózy žrádle (10mg/l) – kontrolní skupina – bez přídavku – po 12 hodinách odběr stolice – sekvenování – výsledky → žádný rozdíl kontrola vs. testovaná skupina Myší experiment – kvalitní plán – večer podání sulfoquinolózy žrádle (10mg/l) – kontrolní skupina – bez přídavku – po 3, 6,12 a 24 hodinách odběr stolice – sekvenování každé vzorky – výsledky → rozdíl mezi skupinami pouze v 6 h CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU12 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU13 Získávání dat Terén – pozorování + zápis – měření + zápis Laboratoř – pozorování + zápis – měření + zápis – generace dat přístrojem → hrubá data experimentálně (původce = vy) Sdílená data – použití dat v databázích s open access – použití poskytnutých dat – „share and re-use“ Placená data – placené databáze původce je někdo jiný CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU14 Organizace dat Složky → podsložky → soubory – konzistentní pojmenování (název projektu, název analýzy, datum provedení analýzy) – hierarchický systém – oddělení probíhajících a uzavřených projektů – najít si vlastní systém který jste schopní dlouhodobě sledovat a udržet Pojmenování souborů – konzistentně – datumy v určitém sledu – interpunkce (_ / . mezery???) – číselné pořadí na začátku / na konci CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU15 Organizace dat Zlatý standard – tabulky – jasně – stručně – jedna poznámka jedno místo – stejný formát v danem sloupci – jeden nadpis na sloupec – žádné slučování buněk – žádné prázdné buňky – kde to jde dělat vybírací seznamy (víc lidí pracuje se stejnou tabulkou) – žádné výpočty v raw data souboru CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU16 Organizace dat a metadat Doplňkové informace ̶ mohou být uloženy separátně od metadat nebo dat • dotazníky (pacienti, probandi) • laboratorní deníky • metadata • reporty • publikace Rozšiřující informace – přesné popisky míst z tabulky – přesný popis odběru vzorků z míst v tabulce CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU17 Doplňkové informace → nutnost?! Laboratorní deníky – novinka grantových agentur i některých pracovišť (zejména zahraničí) – každý člen týmu vede laboratorní deník – přesné záznamy – skladovaní i po skončení grantu – varianty: papírová i elektronická Příklad: Rakousko – přísná pravidla – denně podrobné zápisy o průběhu experimentů – žádné škrtání – žádné trhání listu – elektronická verze musí byt opatřena časovým zámkem • naučit se zaznamenávat práci v laboratoři • případné změny = lehčí implementace • nutnost u projektů i grantů, i když to nevyžadují CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU18 Metadata v biologii Metadata = informace o nasbíraných datech ̶ Fotky: jak-kde-kdy vznikli, čím byli pořízeny, barevný profil, čočky, zoom… ̶ Vzorek: kde se odebral, GPS, kolik, typ zdrojového materiálu, jak se skladoval, jak se transportoval, jak se zpracoval ̶ Bakteriální izolát: Z jaké vzorky pochází, za jaké teploty roste, na jakých mikrobiologických půdách roste, do jaké BSL kategorie spadá ̶ Experimentální data: design jednotlivých experimentů, teploty, pH, živiny, obsah vody, salinita, objemy, hmotnosti, trvání, jakékoliv změny CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU19 Metadata v biologii Sekvenační data: https://www.ncbi.nlm.nih.gov/genbank/ CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU20 Metadata v biologii Tvorba a uchování metadat – jedno pravidlo: „There is no good reason not to save metadata“ EU projekty – musíte uchovávat vše (musíte mít odhad o velikosti a typu dat) – po dobu projektu + 5 let po ukončení (nutno přemyslet dopředu, kdo bude odpovědná osoba?) – aktuálně: metadata musíte nahrát do veřejně dostupných databází a spárovat s daty CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU21 A co klinická data ve výzkumu? – Specifické – Přísná pravidla na sdílení informaci – Pseudonymizace – identifikace pacienta + dat možná dle klíče ( př. náhodné čísla jako ID) – Anonymizace (de-identifikace) → oddělení dat od identifikace pacienta – Neanonymizované data nesmí opustit nemocnici CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU22 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU23 Data processing – Vložená nasbíraná data „input“ – Příprava dat (filtrace, kontrola kvality) – Zpracovaní (z raw, tedy tzv. surových dat) – Interpretace „output“ jednodušší zobrazení raw data často nečitelná člověkem CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU24 Krok 1: Filtrace dat RAW DATA → ZPRACOVANÁ DATA – Kvalitativní vyhodnocení dat – Normalizace získaných dat pro možnost porovnání – Odstranění chybných/nevyhovujících dat – Organizace – Anotace CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU25 Příklady – filtrace dat Genomická data ̶ sekvenace genomu • výsledek tisíce čtení (readů) – nejsou stejné • jiná délka • jiná kvalita bází • přítomnost adaptorů • přítomnost kontaminací • nekvalitní koncové sekvence (jiné báze než v skutečnosti) Kontrola kvality → filtrace Phred skóre kvality – kvalita jednotlivých bází Minimální délka readů Výsledný soubor CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU26 Příklady – filtrace dat čistá sekvence smíšená sekvence CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU27 Příklady – filtrace dat nedostatečná kvalita CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU28 Příklady – filtrace dat Metagenom – lidský střevní mikrobiom – PCR – výběr pouze jednoho genu (16S rRNA) – sekvenace – výsledek je nutné filtrovat (obdobně jako příklad 1) – výsledek je nutné normalizovat příklad – výsledek tvrdí že máme v stolici: – 100× Bacteroides fragilis a 100× Prevotella copri → 1:1 – normalizace genem 16S rRNA – B.fragilis 6 kopií X P. copri 4 kopie → 3:2 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU29 Příklad normalizace sekvenačních dat bez normalizace tzv „relativní početnosti“ po normalizaci vzhledem k velikosti vzorku tzv „absolutní početnosti“ Michaelsen, Albertsen Lab, 2018 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU30 Kontrola kvality dat ̶ Stanovení postupu kontroly kvality dat (kvalita fotek, kvalita sekvencí, úplnost metadat, kompatibilita dat, odstranění chybějících hodnot) ̶ Parametry kontroly vždy dle daných dat • sekvenace: hloubka čtení, délka čtení, překrytí, kontaminace… • experimentální data: pozitivní a negativní kontroly, minimální počet opakování, reprodukovatelnost, statistické vyhodnocení… ̶ kvalita kontroly dat je nutná prakticky v každém kroku – sběr, generace dat, zpracování dat ̶ možná automatizace CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU31 Problémy se zpracováváním dat ̶ Zejména BIOINFORMATIKA → tj. sekvenační data ̶ neexistují robustní univerzální pipeliny ̶ každý si vytváří vlastní systém: • reprodukovatelnost = těžká až nemožná • jedna data = různé výsledky!!! CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU32 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU33 Analýza dat ̶ biochemické a fyziologické data + způsoby vyhodnocení ̶ genomická data – bioinformatika (různé cíle = různé zpracování + příklady) ̶ metagenomická data (dtto) ̶ analýza dat od pacientu a asociace s výzkumnými daty Příklady: ̶ popisy nových bakteriálních druhů, fylogeneze, genomika ̶ sledování epidemiologie klinických kmenů ̶ hledání nových antibiotik CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU34 Příklad analýzy 1 (nové bakteriální druhy – fylogeneze) ̶ Vstup: filtrovaná sekvenační data jednotlivé geny 1. ukazatel: → Cut-off value: 98.65% podobnosti genu 16S rRNA 2. ukazatel: → fylogeneze Králová et al., 2021 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU35 Příklad analýzy 1 (genomika) ̶ Vstup: filtrovaná sekvenační data, po kvalitě kontroly 1. ukazatel: → Cut-off value: 95% podobnosti genomu 2. ukazatel: → fylogeneze CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU36 Příklad analýzy 1 (genomika) ̶ Vstup: filtrovaná sekvenační data, po kvalitě kontroly • nejenom, jestli je bakterie „nová“ • můžeme přidat vlastnosti kódované v genomu Králová et al., 2021 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU37 Příklad analýzy 2 (epidemiologie) Stanovení příbuznosti izolátů VRE na základě WGS ̶ Vstup ̶ Složené genomy ̶ Metadata ̶ Výstupy ̶ Rozdělení do clusterů na základě počtu rozdílů v alelách jednotlivých genů ̶ Srovnání izolátů v rámci clusteru s dostupnými metadaty ̶ Na základě výsledků případně zahájení epidemiologického šetření a zavedení příslušných opatření CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU38 Příklad analýzy 3 (biosyntetika) ̶ Vstup: filtrovaná sekvenační data, po kvalitě kontroly ̶ Vstup: fotografie ̶ Vstup: chromatografická data CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU39 Příklad analýzy 3 (biosyntetika) CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU40 Příklad analýzy 3 (biosyntetika) ̶ Vstup: filtrovaná sekvenační data, po kontrole kvality ̶ Vstup: fotografie ̶ Vstup: chromatografická data P12377, inhibition of Micrococcus luteus P12377, inhibition of Staphylococcus aureus UV100, inhibition of Saccharomyces cerevisiae CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU41 Příklad analýzy 3 (biosyntetika) ̶ Vstup: filtrovaná sekvenační data, po kvalitě kontroly ̶ Vstup: fotografie ̶ Vstup: chromatografická data K. pneumoniae E. coli P. putida S. aureus E. faecium M. luteus Arthrobacter sp. P12200 Streptomyces sp. UV100 Streptomyces sp. P12413 M. luteus CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU42 Příklad analýzy 3 (biosyntetika) ̶ Vstup: filtrovaná sekvenační data, po kvalitě kontroly ̶ Vstup: fotografie ̶ Vstup: chromatografická data CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU43 Příklad analýzy 3 (biosyntetika) CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU44 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU45 Archivace dat – data v tištěné podobě – doba uchování, katalogizace – data v elektronické podobě – lokální úložiště – cloudové úložiště – uzavřené databáze – open access databáze – ovlivnění grantovými agenturami – podmínky + příklady CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU46 Archivace dat – příklad: srovnání univerzit Česká sbírka mikroorganismů, MU – katalogizace v tištěné podobě – katalogizace v digitální podobě, software MINE – výhody: • dva systémy (záloha v tištěné podobě) – nevýhody: • digitální systém zastaralý, neexistuje IT podpora • neexistuje záloha přístupná vzdáleně • neexistuje záloha přístupná všem CMESS, UniVie – katalogizace/návody primárně digitální – papírové formy pouze výjimečně (návody k strojům) – výhody: • univerzálně dostupném všem • pokud aktualizace, okamžitě u všech • vzdálený přístup samozřejmostí, pro všechny • denní zálohování na 3 serverech – nevýhody: • nutný tisk pokud chcete vlastní kopii CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU47 Archivace dat – online databáze a repozitáře Ukládaní dat online má v biologii pravidla: – NUTNOST před každou publikací – minimální doba – 5 let po publikaci – perzistentní identifikátor (DataCite DOI) – umožněno review ukládaných datasetů! – ideálně specifické repozitáře dle povahy dat nebo dle standardu v daném oboru – open access • (výjimka: klinická data mohou vyžadovat „Data Usage Agreements“) CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU48 Archivace dat – příklady Data – nukleové kyseliny Data – proteinové sekvence Data – funkční genomika Data – obrázky nature/repositories CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU49 Archivace vzorků – mikrobiologie TAXONOMIE: živé kultury – reprezentující nové druhy → musí byt dostupné – nejde ale o open access! – uchovávaní zabezpečují sbírky mikroorganismů → poskytování je placené BIODIVERZITA/EKOLOGIE: živé kultury – nejde o nutnost, ale často jsou uložené volně dostupné soubory izolátů – nejde/jde o open access – uchovávaní zabezpečují sbírky mikroorganismů / university → placené/neplacené CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU50 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU51 Data sharing Sielemann et al., 2020 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU52 Data sharing – význam V biologii nutnost: ̶ poskytnout všechna data ̶ nebo poskytnou „minimální dataset“ → replikace výsledků (všechny data z článku, metadata, metody) „Data Availability Statement“ při submitování článku ̶ bez restrikce přístupu – open access ̶ pokud restrikce → etické/legální → jiný přístup nutný (agreement, official request, official permit) CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU53 Data sharing V biologii nutnost: ̶ validace výsledků ̶ replikace, re-analýza, re-interpretace ̶ nové analýzy ̶ reprodukovatelnost ̶ archivace dat → investice do výzkumu má dlouhodobé výsledky ̶ citace dat → viditelnost a rozeznatelnost autorů, tvůrců dat, kurátorů CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU54 Data sharing – význam i v praxi! Sledování, reakce, predikce: – infekční onemocnění (SARS-Cov-19, HAV v Brně, opičí neštovice...) – šíření rezistentních patogenů (nemocnice, čističky vod...) – šíření rezistence Zrychlení výzkumu: – infekční onemocnění – mikrobiom a související onemocnění – Human Genome Project • rakovina • vzácná genetická onemocnění • farmakogenomika Šíření rezistence k cefalosporinům v Evropě – Klebsiella pneumoniae ECDC ECDC 2005 2020 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU55 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU56 Data reusability ̶ Použití dříve nasbíraných/zpracovaných dat za jiným účelem oproti původnímu plánu ̶ Podmínka: • vysoká kvalita • eticky v pořádku • dostatečně popsané – metadata • aktuální verze dat • uvedené podmínky opakovaného použití • NUTNO OCITOVAT, UVÉST REFERENCI!!! CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU57 Data reusability – význam ̶ nezávislé studium dat různými skupinami/vědci ̶ šetření finančních zdrojů ̶ urychlení výzkumu ̶ násobné možnosti zpracování a vyhodnocení (jedny data = mnoho výsledků) ̶ Nevýhody: • neúplné/nesprávné metadata • nízká kvalita dat • chybná data CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU58 Sielemann et al., 2020 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU59 Data reusability – příklad ̶ každá fylogenetická analýza data z repozitářů/databází vlastní data vlastní data data z repozitářů/databází Králová et al., 2021 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU60 Data reusability – příklad Pangenomická analýza – Klebsiella pneumoniae * - nová data opětovně použitá data Arabaghian et al., 2019 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU61 Data reusability – příklad – klinický výzkum Tvorba epidemiologickych schémat • využití NCBI databází • využití genómové subdatabáze • možnost filtrování výsledků • možnost stáhnutí celého souboru 61 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU62 Data reusability – příklad – klinický výzkum Tvorba epidemiologickych schémat 62 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU63 Data reusability – příklad – klinický výzkum Tvorba epidemiologickych schémat • příklad využití dat uložených za účelem publikace • nový účel → epidemiologie CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU64 Shrnutí 6. přednáška CORE042 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU65 Shrnutí ̶ Cyklus dat v mikrobiologii/biologii → využíváme všechny kroky ̶ Generujeme velké množství variabilních dat (fotografie, HPLC, sekvence, měření, popisky, …) ̶ Generujeme enormní množství metadat (GPS souřadnice, typy materiálů, množství materiálů, časy/doby odběrů, klinická data, asociovaná data, …) ̶ Vysoká náročnost na plan → collect → process → analyse ̶ Výrazný podíl sharing + reusability ̶ Výrazný tlak na FAIR data (zejména preserve + share → to be reused!) • velké množství databází • specifické databáze • nevýhoda – databáze bez review procesu a kontroly → chyby CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU66 Diskuse Zdroj: Communicate_communication_conference_2028004 od OpenClipart-Vectors z Pixabay