Data v mikrobiologii CORE042 – Výzkum v 21. století: data pohledem vaším a vašich kolegů 6. přednáška Stanislava Bezdíček Králová a kol. Externista PřF – Ústav experimentální biologie MU CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU2 Přednášející a spoluautoři ̶ Václav Šeda ̶ CEITEC ̶ Microenvironment of Immune Cells group ̶ FAIR data in clinical and university biology research ̶ Matěj Bezdíček ̶ The University Hospital Brno ̶ Department of Internal Medicine, Hematology and Oncology ̶ FAIR data in clinical microbiology ̶ Stanislava Bezdíček Králová ̶ PřF MU, Ústav Experimentální Biologie, externista ̶ University of Vienna, Center of Microbial Ecology and System Science ̶ Life science fundings, FAIR Data in Microbiology CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU3 Osnova ̶ Life cycle ̶ Historie vs. současnost ̶ Plánování ̶ Sběr/získávání dat ̶ Zpracování dat ̶ Analýza dat ̶ Uchování dat ̶ Poskytování dat ̶ Opakované využití dat CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU4 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU5 Historie V minulosti ̶ méně dat ̶ menší výpočetní náročnost ̶ jednoduší na uchování, organizaci, vyhodnocení Současnost ̶ změna instrumentace ̶ změna charakteru dat (pozorování vs. sekvenace) ̶ enormní nárust množství dat – digitální forma ̶ vyšší nároky na rutinní procesovaní – zisk, organizace dat, jejich sdílení, uchovávaní, procesovaní (úpravy), analýzy Raban & Gordon, Scientometrics (2020) CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU6 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU7 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU8 Plánování Co? – stanovení cíle Jak? – určení metodologického postupu (máme vše co potřebujeme?) – určení znalostního základu (dokážeme uskutečnit všechny kroky?) – dohodnutí spolupráce – rozložení finančních prostředků Kdo? – jeden výzkumník? – tým? – studenti? – kdo to zaplatí?! Kde? – získat vzorek + logistika – máme potřebnou instrumentaci? – dílčí časti u spolupracujícího pracoviště? (tuzemsko/zahraničí) Kdy? – časové plánovaní je extrémně důležité – kdy odeberu vzorky – stihnu je pak zpracovat? – kolik vzorků zpracuji? – potřebuji více odběrů v různých časech? – dílčí kroky vs. celkový projekt CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU9 Plánování – specifika klinického výzkumu Etická komise – Lidská DNA ve vzorcích = etický problém → nutné schválení – Ochrana osobních údajů – Informovaný souhlas Původ vzorků? – ambulantní vs. hospitalizovaný pacient – transport – krátkodobé uchování – dlouhodobé uchování – jeden výzkumník? – tým? – studenti? – kdo to zaplatí?! Kdy? – časové plánovaní je extrémně důležité – jak často budeme odebírat vzorky? – hledám něco typické nebo spíš raritní?? → někdy extrémně dlouhá doba do vytvoření dostačujícího souboru vzorků Kdo? – interpretace: často nutný klinik – často nutné zapojení více pracovišť Financování – nemocnice – granty → klinický vs základní výzkum CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU10 Plánování – příklady Terénní výzkum (Antarktida) ̶ chystání materiálu (6 měsíců před expedicí) ̶ chystání sensitivního materiálu (1 měsíc před expedicí) ̶ jak budou vzorky cestovat? ̶ jaké vybavení budu mít k dispozici? ̶ jak dokážu zpracovat vzorky? Přílet na Antarktidu: 1. příprava kultivačních médií 2. sterilizace materiálu po cestě 3. odběry na začátku expedice (kultivace 6–8 týdnů) 4. zpracovávaní vzorků 5. odběry na konci expedice (přenos do ČR) ✓ nesmí roztát ✓ nesmí se zahřát ✓ nesmí se střídat teploty ✓ kolik gramů ✓ kolik replikátů ✓ původ vzorků CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU11 Když plánovaní experimentu nevyjde – příklad z klinické praxe Studium invazivních mykóz – Zahájení nového projektu současně se sběrem vzorků – Spolupráce s klinikou v rámci nemocnice – Za rok sběru vzorků nasbírám 2 potvrzené a 3 suspektní vzorky na invazivní mykózu – výsledky → z výsledků u 5 vzorků neudělám relevantní závěry, nic nepublikuji Studium invazivních mykóz – Zahájení spolupráce s dalšími centry a po dlouhodobém bankování vzorků – Zahájení projektu s již získaným větším množstvím vzorků – výsledky → signifikantní počet vzorků k vyšetření umožňuje výsledky hodnotit, korelovat a dělat statisticky významné závěry, publikaci práce založené na takovém souboru nic nebrání CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU12 Když plánovaní experimentu nevyjde – příklad z praxe Myší experiment – nepromyšlené – ráno: podaní sulfoquinolózy žrádle (10mg/l) – kontrolní skupina – bez přídavku – po 12 hodinách odběr stolice – sekvenování – výsledky → žádný rozdíl kontrola vs. testovaná skupina Myší experiment – kvalitní plán – večer podání sulfoquinolózy žrádle (10mg/l) – kontrolní skupina – bez přídavku – po 3, 6,12 a 24 hodinách odběr stolice – sekvenování každé vzorky – výsledky → rozdíl mezi skupinami pouze v 6 h CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU13 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU14 Získávání dat Terén – pozorování + zápis – měření + zápis Laboratoř – pozorování + zápis – měření + zápis – generace dat přístrojem → hrubá data experimentálně (původce = vy) Sdílená data – použití dat v databázích s open access – použití poskytnutých dat – „share and re-use“ Placená data – placené databáze původce je někdo jiný CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU15 Organizace dat Složky → podsložky → soubory – konzistentní pojmenování (název projektu, název analýzy, datum provedení analýzy) – hierarchický systém – oddělení probíhajících a uzavřených projektů – najít si vlastní systém který jste schopní dlouhodobě sledovat a udržet Pojmenování souborů – konzistentně – datumy v určitém sledu – interpunkce (_ / . mezery???) – číselné pořadí na začátku / na konci CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU16 Organizace dat Zlatý standard – tabulky – jasně – stručně – jedna poznámka jedno místo – stejný formát v danem sloupci – jeden nadpis na sloupec – žádné slučování buněk – žádné prázdné buňky – kde to jde dělat vybírací seznamy (víc lidí pracuje se stejnou tabulkou) – žádné výpočty v raw data souboru CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU17 Organizace dat a metadat Doplňkové informace ̶ mohou být uloženy separátně od metadat nebo dat • dotazníky (pacienti, probandi) • laboratorní deníky • metadata • reporty • publikace Rozšiřující informace – přesné popisky míst z tabulky – přesný popis odběru vzorků z míst v tabulce CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU18 Doplňkové informace → nutnost?! Laboratorní deníky – novinka grantových agentur i některých pracovišť (zejména zahraničí) – každý člen týmu vede laboratorní deník – přesné záznamy – skladovaní i po skončení grantu – varianty: papírová i elektronická Příklad: Rakousko – přísná pravidla – denně podrobné zápisy o průběhu experimentů – žádné škrtání – žádné trhání listu – elektronická verze musí byt opatřena časovým zámkem • naučit se zaznamenávat práci v laboratoři • případné změny = lehčí implementace • nutnost u projektů i grantů, i když to nevyžadují CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU19 Metadata v biologii Metadata = informace o nasbíraných datech ̶ Fotky: jak-kde-kdy vznikli, čím byli pořízeny, barevný profil, čočky, zoom… ̶ Vzorek: kde se odebral, GPS, kolik, typ zdrojového materiálu, jak se skladoval, jak se transportoval, jak se zpracoval ̶ Bakteriální izolát: Z jaké vzorky pochází, za jaké teploty roste, na jakých mikrobiologických půdách roste, do jaké BSL kategorie spadá ̶ Experimentální data: design jednotlivých experimentů, teploty, pH, živiny, obsah vody, salinita, objemy, hmotnosti, trvání, jakékoliv změny CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU20 Metadata v biologii Sekvenační data: https://www.ncbi.nlm.nih.gov/genbank/ CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU21 Metadata v biologii Tvorba a uchování metadat – jedno pravidlo: „There is no a good reason not to save metadata“ EU projekty – musíte uchovávat vše (musíte mít odhad o velikosti a typu dat) – po dobu projektu + 5 let po ukončení (nutno přemyslet dopředu, kdo bude odpovědná osoba?) – aktuálně: metadata musíte nahrát do veřejně dostupných databází a spárovat s daty CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU22 A co klinická data ve výzkumu? – Specifické – Přísná pravidla na sdílení informaci – Pseudonymizace – identifikace pacienta + dat možná dle klíče ( př. náhodné čísla jako ID) – Anonymizace (de-identifikace) → oddělení dat od identifikace pacienta – Neanonymizované data nesmí opustit nemocnici CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU23 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU24 Data processing – Vložená nasbíraná data „input“ – Příprava dat (filtrace, kontrola kvality) – Zpracovaní (z raw, tedy tzv. surových dat) – Interpretace „output“ jednodušší zobrazení raw data často nečitelná člověkem CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU25 Krok 1: Filtrace dat RAW DATA → ZPRACOVANÁ DATA – Kvalitativní vyhodnocení dat – Normalizace získaných dat pro možnost porovnání – Odstranění chybných/nevyhovujících dat – Organizace – Anotace CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU26 Příklady – filtrace dat Genomická data ̶ sekvenace genomu • výsledek tisíce čtení (readů) – nejsou stejné • jiná délka • jiná kvalita bází • přítomnost adaptorů • přítomnost kontaminací • nekvalitní koncové sekvence (jiné báze než v skutečnosti) Kontrola kvality → filtrace Phred skóre kvality – kvalita jednotlivých bází Minimální délka readů Výsledný soubor CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU27 Příklady – filtrace dat čistá sekvence smíšená sekvence CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU28 Příklady – filtrace dat nedostatečná kvalita CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU29 Příklady – filtrace dat Metagenom – lidský střevní mikrobiom – PCR – výběr pouze jednoho genu (16S rRNA) – sekvenace – výsledek je nutné filtrovat (obdobně jako příklad 1) – výsledek je nutné normalizovat příklad – výsledek tvrdí že máme v stolici: – 100× Bacteroides fragilis a 100× Prevotella copri → 1:1 – normalizace genem 16S rRNA – B.fragilis 6 kopií X P. copri 4 kopie → 3:2 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU30 Příklad normalizace sekvenačních dat bez normalizace tzv „relativní početnosti“ po normalizaci vzhledem k velikosti vzorku tzv „absolutní početnosti“ Michaelsen, Albertsen Lab, 2018 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU31 Kontrola kvality dat ̶ Stanovení postupu kontroly kvality dat (kvalita fotek, kvalita sekvencí, úplnost metadat, kompatibilita dat, odstranění chybějících hodnot) ̶ Parametry kontroly vždy dle daných dat • sekvenace: hloubka čtení, délka čtení, překrytí, kontaminace… • experimentální data: pozitivní a negativní kontroly, minimální počet opakování, reprodukovatelnost, statistické vyhodnocení… ̶ kvalita kontroly dat je nutná prakticky v každém kroku – sběr, generace dat, zpracování dat ̶ možná automatizace CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU32 Problémy se zpracováváním dat ̶ Zejména BIOINFORMATIKA → tj. sekvenační data ̶ neexistují robustní univerzální pipeliny ̶ každý si vytváří vlastní systém: • reprodukovatelnost = těžká až nemožná • jedna data = různé výsledky!!! CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU33 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU34 Analýza dat ̶ biochemické a fyziologické data + způsoby vyhodnocení ̶ genomická data – bioinformatika (různé cíle = různé zpracování + příklady) ̶ metagenomická data (dtto) ̶ analýza dat od pacientu a asociace s výzkumnými daty Příklady: ̶ popisy nových bakteriálních druhů, fylogeneze, genomika ̶ sledování epidemiologie klinických kmenů ̶ hledání nových antibiotik CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU35 Příklad analýzy 1 (nové bakteriální druhy – fylogeneze) ̶ Vstup: filtrovaná sekvenační data jednotlivé geny 1. ukazatel: → Cut-off value: 98.65% podobnosti genu 16S rRNA 2. ukazatel: → fylogeneze Králová et al., 2021 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU36 Příklad analýzy 1 (genomika) ̶ Vstup: filtrovaná sekvenační data, po kvalitě kontroly 1. ukazatel: → Cut-off value: 95% podobnosti genomu 2. ukazatel: → fylogeneze CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU37 Příklad analýzy 1 (genomika) ̶ Vstup: filtrovaná sekvenační data, po kvalitě kontroly • nejenom, jestli je bakterie „nová“ • můžeme přidat vlastnosti kódované v genomu Králová et al., 2021 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU38 Příklad analýzy 2 (epidemiologie) Stanovení příbuznosti izolátů VRE na základě WGS ̶ Vstup ̶ složené genomy ̶ Metadata ̶ Výstupy ̶ Rozdělení do clusterů na základě počtu rozdílů v alelách jednotlivých genů ̶ Srovnání izolátů v rámci clusteru s dostupnými metadaty ̶ Na základě výsledků případně zahájení epidemiologického šetření a zavedení příslušných opatření CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU39 Příklad analýzy 3 (biosyntetika) ̶ Vstup: filtrovaná sekvenační data, po kvalitě kontroly ̶ Vstup: fotografie ̶ Vstup: chromatografická data CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU40 Příklad analýzy 3 (biosyntetika) CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU41 Příklad analýzy 3 (biosyntetika) ̶ Vstup: filtrovaná sekvenační data, po kontrole kvality ̶ Vstup: fotografie ̶ Vstup: chromatografická data P12377, inhibition of Micrococcus luteus P12377, inhibition of Staphylococcus aureus UV100, inhibition of Saccharomyces cerevisiae CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU42 Příklad analýzy 3 (biosyntetika) ̶ Vstup: filtrovaná sekvenační data, po kvalitě kontroly ̶ Vstup: fotografie ̶ Vstup: chromatografická data K. pneumoniae E. coli P. putida S. aureus E. faecium M. luteus Arthrobacter sp. P12200 Streptomyces sp. UV100 Streptomyces sp. P12413 M. luteus CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU43 Příklad analýzy 3 (biosyntetika) ̶ Vstup: filtrovaná sekvenační data, po kvalitě kontroly ̶ Vstup: fotografie ̶ Vstup: chromatografická data CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU44 Příklad analýzy 3 (biosyntetika) RT: 0.00 - 50.00 0 5 10 15 20 25 30 35 40 45 50 Time (min) 0 20 40 60 80 100 0 20 40 60 80 100 RelativeAbundance 0 20 40 60 80 100 2.58 4.99 11.147.37 12.90 13.52 1.34 2.97 9.585.09 18.75 18.696.84 20.43 31.73 42.7613.06 46.3433.2021.07 40.2714.09 21.20 2.99 7.49 13.81 6.60 8.78 1.37 10.80 4.60 18.77 20.45 31.95 33.45 43.5739.1020.5416.55 46.9235.9521.99 NL: 4.38E7 Base Peak F: FTMS + p ESI Full ms [140.00-2000.00] MS 89002_01_R2B_control NL: 3.12E7 Base Peak F: FTMS + p ESI Full ms [140.00-2000.00] MS 89004_03_Edaphobacter_ sp_SLOG3A_ES NL: 4.28E7 Base Peak F: FTMS + p ESI Full ms [140.00-2000.00] MS 89011_10_Edaphobacter_ sp_SLOG3A_LS R2B control Edaphobacter sp. SLOG3A ES Edaphobacter sp. SLOG3A LS CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU45 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU46 Archivace dat – data v tištěné podobě – doba uchování, katalogizace – data v elektronické podobě – lokální úložiště – cloudové úložiště – uzavřené databáze – open access databáze – ovlivnění grantovými agenturami – podmínky + příklady CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU47 Archivace dat – příklad: srovnání univerzit Česká sbírka mikroorganismů, MU – katalogizace v tištěné podobě – katalogizace v digitální podobě, MINE – výhody: • dva systémy (záloha v tištěné podobě) – nevýhody: • digitální systém zastaralý, neexistuje IT podpora • neexistuje záloha přístupná vzdáleně • neexistuje záloha přístupná všem CMESS, UniVie – katalogizace/návody primárně digitální – papírové formy pouze výjimečně (návody k strojům) – výhody: • univerzálně dostupném všem • pokud aktualizace, okamžitě u všech • vzdálený přístup samozřejmostí, pro všechny • denní zálohování na 3 serverech, lokální + cloud – nevýhody: • nutný tisk pokud chcete vlastní kopii CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU48 Archivace dat – online databáze a repozitáře Ukládaní dat online má v biologii pravidla: – NUTNOST před každou publikací – minimální doba – 5 let po publikaci – perzistentní identifikátor (DataCite DOI) – umožněno review ukládaných datasetů! – ideálně specifické repozitáře dle povahy dat nebo dle standardu v daném oboru – open access • (výjimka: klinická data mohou vyžadovat „Data Usage Agreements“) CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU49 Archivace dat – příklady Data – nukleové kyseliny Data – proteinové sekvence Data – funkční genomika Data – obrázky nature/repositories CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU50 Archivace vzorků – mikrobiologie TAXONOMIE: živé kultury – reprezentující nové druhy → musí byt dostupné – nejde ale o open access! – uchovávaní zabezpečují sbírky mikroorganismů → poskytování je placené BIODIVERZITA/EKOLOGIE: živé kultury – nejde o nutnost ale často jsou uložené volně dostupné soubory izolátů – nejde/jde o open access – uchovávaní zabezpečují sbírky mikroorganismů / university → placené/neplacené CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU51 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU52 Data sharing Sielemann et al., 2020 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU53 Data sharing – význam V biologii nutnost: ̶ poskytnout všechna data ̶ nebo poskytnou „minimální dataset“ → replikace výsledků (všechny data z článku, metadata, metody) „Data Availability Statement“ při submitování článku ̶ bez restrikce přístupu – open access ̶ pokud restrikce → etické/legální → jiný přístup nutný (agreement, official request, official permit) CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU54 Data sharing V biologii nutnost: ̶ validace výsledků ̶ replikace, re-analýza, re-interpretace ̶ nové analýzy ̶ reprodukovatelnost ̶ archivace dat → investice do výzkumu má dlouhodobé výsledky ̶ citace dat → viditelnost a rozeznatelnost autorů, tvůrců dat, kurátorů CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU55 Data sharing – význam i v praxi! Sledování, reakce, predikce: – infekční onemocnění (SARS-Cov-19, HAV v Brně, opičí neštovice...) – šíření rezistentních patogenů (nemocnice, čističky vod...) – šíření rezistence Zrychlení výzkumu: – infekční onemocnění – mikrobiom a související onemocnění – Human Genome Project • rakovina • vzácná genetická onemocnění • farmakogenomika Šíření rezistence k cefalosporinům v Evropě – Klebsiella pneumoniae ECDC ECDC 2005 2020 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU56 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU57 Data reusability ̶ Použití dříve nasbíraných/zpracovaných dat za jiným účelem oproti původnímu plánu ̶ Podmínka: • vysoká kvalita • eticky v pořádku • dostatečně popsané – metadata • aktuální verze dat • uvedené podmínky opakovaného použití • NUTNO OCITOVAT, UVÉST REFERENCI!!! CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU58 Data reusability – význam ̶ nezávislé studium dat různými skupinami/vědci ̶ šetření finančních zdrojů ̶ urychlení výzkumu ̶ násobné možnosti zpracování a vyhodnocení (jedny data = mnoho výsledků) ̶ Nevýhody: • neúplné/nesprávné metadata • nízká kvalita dat • chybná data CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU59 Sielemann et al., 2020 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU60 Data reusability – příklad ̶ každá fylogenetická analýza data z repozitářů/databází vlastní data vlastní data data z repozitářů/databází Králová et al., 2021 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU61 Data reusability – příklad Pangenomická analýza – Klebsiella pneumoniae * - nová data opětovně použitá data Arabaghian et al., 2019 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU62 Data reusability – příklad – klinický výzkum Tvorba epidemiologickych schémat • využití NCBI databází • využití genómové subdatabáze • možnost filtrování výsledků • možnost stáhnutí celého souboru 62 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU63 Data reusability – příklad – klinický výzkum Tvorba epidemiologickych schémat 63 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU64 Data reusability – příklad – klinický výzkum Tvorba epidemiologickych schémat • příklad využití dat uložených za účelem publikace • nový účel → epidemiologie CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU65 Shrnutí 6. přednáška CORE042 CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU66 Shrnutí ̶ Cyklus dat v mikrobiologii/biologii → využíváme všechny kroky ̶ Generujeme velké množství variabilních dat (fotografie, HPLC, sekvence, měření, popisky, …) ̶ Generujeme enormní množství metadat (GPS souřadnice, typy materiálů, množství materiálů, časy/doby odběrů, klinická data, asociovaná data, …) ̶ Vysoká náročnost na plan → collect → process → analyse ̶ Výrazný podíl sharing + reusability ̶ Výrazný tlak na FAIR data (zejména preserve + share → to be reused!) • velké množství databází • specifické databáze • nevýhoda – databáze bez review procesu a kontroly → chyby CORE042 | 6. přednáška | Stanislava Bezdíček Králová | ÚEB PřF MU67 Diskuse Zdroj: Communicate_communication_conference_2028004 od OpenClipart-Vectors z Pixabay