1 Epigenetic prediction of complex traits and death D. McCartney et al., 2018 Vladimír Bača FI MUNI Brno IV106 Bioinformatics seminar April 2020 2 Problémy: ● zhodnotenie rizika rôznych typov ochorení ● presné meranie zdravotných a lifestyle faktorov ● zaujatosť a nepresnosť self-reportingu Motivácia 3 Problémy: ● zhodnotenie rizika rôznych typov ochorení ● presné meranie zdravotných a lifestyle faktorov ● zaujatosť a nepresnosť self-reportingu Riešenie: ● analýza epigenetických dát! Motivácia 4 Metylácia DNA ● chemická modifikácia DNA ● C, A, typicky CpG Asociácie: ● výskyt v promotore – represia génov – blokovanie transkripcie, modifikácia histónov (heterchromatín) ● kódujúce regióny často transkribovaných génov ● imprinting, inaktivácia X-chromozómu, represia transpozónov ● starnutie, rakovina, fyzická aktivita... 5 Detekcia DNA metylácie ● Illumina HumanMethylationEPIC BeadChip, Illumina 450k ● 850 000, resp. 450 000 detekovaných miest metylácie 6 Štúdia ● predikcia zdravotných, lifestyle faktorov a mortality z dát o DNA metylácii (DNAm) ● trénovacia množina: 5000 rôznorodých jednotlivcov ● testovacia množina: 900 jednotlivcov (~70 rokov) ● DNA vzorky z krvi ● CpG autozomálne miesta z Illumina 450k 7 Analyzované faktory ● BMI [kg/m2] ● WHR (obvod pásu / obvod bokov) ● cholesterol: celkový, HDL (dobrý), LDL (zlý) + zvyškový (celkový - HDL) [mmol/L], celkový / HDL ● telesný tuk [%] ● konzumácia alkoholu [jednotky/týždeň] ● fajčenie [krabičky denne * roky], resp. ne/fajčiar/bývalý ● vzdelanie (ordinálna stupnica 0–10 podľa rokov) 8 LASSO regresia ● lineárna regresia s penalizáciou (absolútnej hodnoty) sklonu ● eliminácia prebytočných nezávislých premenných ● nezávislé premenné: DNAm miesta ● závislé premenné: namerané/reportované hodnoty faktorov korigované voči veku, pohlaviu a 10 genetickým principiálnym komponentám ● krížová validácia (10x) 9 Polygenické skóre ● prediktor faktorov podľa genetickej sekvencie ● genome-wide association studies (GWAS) ● pre každý faktor váhy viacerých génov 10 Porovnanie 11 AUC analýza ● dichotomizácia faktorov ● logistická regresia 12 Výsledok 13 AUC analýza ● presnosť klasifikácie ovplyvnená mierou, trvaním a časom expozície (alkohol vs. fajčenie) – rôzne vhodné pre rôzne faktory 14 Mortalita ● 12-ročný follow-up testovacej množiny (212 mŕtvych z 895) ● Cox proportional-hazards model ● asociácia medzi DNAm skóre a rizikom úmrtia ● korekcia o vek, pohlavie, počet bielych krviniek, fenotyp a polygenické skóre 15 DNAm prediktory vs. polygenické skóre 16 DNAm prediktory vs. fenotypy 17 Mortalita ● fenotypy pre alkohol a vzdelanie – nepreukázaná asociácia s mortalitou, narozdiel od príslušného DNAm skóre – DNAm zrejme zachycuje viacej faktorov súvisiacich s fenotypom, ktoré majú biologické dôsledky na mortalitu ● korekcia modelov naviac o DNAm smoking skóre: – oslabenie asociácie mortality s alkoholom a vzdelaním – zachovanie asociácie WHR 18 Záver Prínos štúdie: ● veľká vzorka ľudí so zhodným protokolom zberu dát – simultánne modelovanie všetkých CpG miest ● slušná predikcia zdravotných a lifestyle faktorov ● predikovanie nielen fenotypu, ale aj klinicky relevantných dôsledkov (mortalita) ● ďalší výskum: zameranie na ďalšie klinické dôsledky (srdcovocievne ochorenia, rakovina atď.) ● forenzné metódy? 19 Záver Prínos štúdie: ● veľká vzorka ľudí so zhodným protokolom zberu dát – simultánne modelovanie všetkých CpG miest ● slušná predikcia zdravotných a lifestyle faktorov ● predikovanie nielen fenotypu, ale aj klinicky relevantných dôsledkov (mortalita) ● ďalší výskum: zameranie na ďalšie klinické dôsledky (srdcovocievne ochorenia, rakovina atď.) ● forenzné metódy? 20 Zdroj ● McCartney, D.L., Hillary, R.F., Stevenson, A.J. et al. Epigenetic prediction of complex traits and death. Genome Biology 19, 136 (2018). https://doi.org/10.1186/s13059-018-1514-1 ● Obrázky: https://commons.wikimedia.org/