Projekt z Matematické biologie (Bi4012) …because none of us are as bad ass as all of us… Projekt z Matematické biologie (Bi4012) … je týmový projekt! Bi4012 Projekt z Matematické biologie, 2018 Týmový projekt • Rozdělení projektu na úkoly Bi4012 Projekt z Matematické biologie, 2018 Týmový projekt • Rozdělení projektu na úkoly • Vůdcovství (leadership) Bi4012 Projekt z Matematické biologie, 2018 Týmový projekt • Rozdělení projektu na úkoly • Vůdcovství (leadership) • Komunikace, pomoc Bi4012 Projekt z Matematické biologie, 2018 Týmový projekt • Rozdělení projektu na úkoly • Vůdcovství (leadership) • Komunikace, pomoc • Řízení změn, dokumentace Bi4012 Projekt z Matematické biologie, 2018 Týmový projekt (1) KONTROLNÍ DEN: obhajoba zvolených metod a postupů (2) ZÁVĚREČNÉ PREZENTACE: obhajoba celého projektu včetně realizace algoritmu a výsledků • Rozdělení projektu na úkoly • Vůdcovství (leadership) • Komunikace, pomoc • Řízení změn, dokumentace • Dvě obhajoby Bi4012 Projekt z Matematické biologie, 2018 Týmový projekt • Rozdělení projektu na úkoly • Vůdcovství (leadership) • Komunikace, pomoc • Řízení změn, dokumentace • Dvě obhajoby • Hackathon Bi4012 Projekt z Matematické biologie, 2018 Týmový projekt • Rozdělení projektu na úkoly • Vůdcovství (leadership) • Komunikace, pomoc • Řízení změn, dokumentace • Dvě obhajoby • Hackathon • Zápočet • Závěrečnou zprávu k projektu není potřeba vypracovávat. • Zápočet bude udělen na základě úspěšné obhajoby. • Na hodnocení se budou podílet mentoři společně se studenty z dalších týmů. Bi4012 Projekt z Matematické biologie, 2018 Týmový projekt – témata zadání • zpracování a analýza signálů či obrazů, • algoritmy strojového učení, • dolování dat a jejich vizualizace … v biologii, environmentálních vědách a zdravotnictví. Bi4012 Projekt z Matematické biologie, 2018 Týmový projekt – mentoři 2018 • Roman Vyškovský • Vendula Churová • Martin Komenda • Matěj Karolyi • Jakub Ščavnický • Daniel Schwarz Bi4012 Projekt z Matematické biologie, 2018 Týmový projekt – mentoři 2018 • Roman Vyškovský • Vendula Churová • Martin Komenda • Matěj Karolyi • Jakub Ščavnický • Daniel Schwarz • …a Jiří Holčík! Bi4012 Projekt z Matematické biologie, 2018 Together we can accomplish anything! Projekt z Matematické biologie (Bi4012) … je týmový projekt! Bi4012 Projekt z Matematické biologie, 2018 Sestavení týmů Dračková, Tereza Maršálová, Kateřina Martináková, Tereza Nováková, Tereza Růžičková, Petra Vespalcová, Hana Bi4012 Projekt z Matematické biologie, 2018 Buďa, Jan Ivan, Matej Jurková, Tereza Klechová, Anna Lakotová, BarboraMazalová, Monika Timárová, Martina Vu Thu, Hoa Web boti Obrazy Dippeři Kováčová, Ingrid Týmový projekt - termíny 17. října 2018 14. listopadu 2018 12. prosince 2018 Vytěžování zdravotnických dat z online zdrojů Bi4012 Projekt z Matematické biologie Jakub Ščavnický, Matěj Karolyi, Martin Komenda Motivace Práce s reálnými daty Osvojení si nových technologií Publikační potenciál Soulad se strategií MZ ČR Bi4012 Projekt z Matematické biologie, 2018 17 Cíle projektu ̶ Strojově vytěžit data z odborných portálů v oblasti zdravotnictví. ̶ Zanalyzovat dostupná data. ̶ Přehledně výsledné reporty vizualizovat. ̶ Porozumět vybrané metodice pro úlohy z oblasti vytěžování dat. ̶ Spolupracovat v týmu s garanty z Webstudia IBA LF MU. Bi4012 Projekt z Matematické biologie, 2018 18 Zadání 1. Proveďte analýzu dostupných online portálů, které prezentují garantované informace o zdravotní péči v ČR. 2. Vyberte vhodné zdroje. 3. Osvojte si techniky pro strojové vytěžování dat (keyword-based crawling). 4. Použijte doporučenou metodiku CRISP-DM, stanovte výzkumné otázky (research questions). 5. Vytěžte požadovaná data, proveďte jejich optimalizaci a zpracujte 3 analytické reporty prezentující popisné informace, zajímavosti a anomální charakteristiky vstupních dat. Bi4012 Projekt z Matematické biologie, 2018 19 Webstudio – garanti projektu Bi4012 Projekt z Matematické biologie, 2018 20 Metodika: CRISP-DM Bi4012 Projekt z Matematické biologie, 2018 21 Nástroj pro procházení webu: Aragog ̶ Prochází web ̶ Ukládá si obsah webových stránek ̶ Napsán v Pythonu ̶ Pro uložení výsledků využívá Mongo DB (NoSQL databázi) ̶ Běží „věčně“ Bi4012 Projekt z Matematické biologie, 2018 22 http://www.expeliarmus.estranky.cz/clanky/kouzelna-stvoreni/aragog/ Nástroj pro čištění textu: Rango ̶ Čistí text ̶ Modifikuje záznamy v databázi, které připravil Aragog (nebo jiný program) ̶ Napsán v Pythonu ̶ Běží pokud má co čistit Bi4012 Projekt z Matematické biologie, 2018 23 https://play-reactor.com/2011/03/09/resena-rango/ Nástroj pro potřeby tohoto projektu: „Matbiol Bot“ ̶ Hledá informace ve vyčištěném textu ̶ Předkládá finální výstupy ̶ Ideálně napsaný v Pythonu ̶ Aplikačně nezávislý na předchozích dvou ̶ Snad poběží ;) Bi4012 Projekt z Matematické biologie, 2018 24 http://cyberneticzoo.com/tag/noo-noo-vacuum-cleaner/ V případě dotazů pište kterémukoli z garantů projektu! {scavnicky,karolyi,komenda}@iba.muni.cz Analýza signálů z měření krevního tlaku při sledování cirkadiánních rytmů Bi4012 Projekt z Matematické biologie Daniel Schwarz Analýza signálů z měření krevního tlaku při sledování cirkadiánních rytmů Bi4012 Projekt z Matematické biologie, 2018  24-hodinové monitorování krevního tlaku  diurnální cyklus, riziko kardiovaskulárního onemocnění  dippers, non-dippers  běžná metoda: stanovení procentuálního poměru mezi průměrným tlakem v době bdění a spánku  Stanovit dipping pacientů s čerstvě zjištěnou hypertenzí před a po 3-měsíční léčbě kardioselektivními betablokátory. Analýza signálů z měření krevního tlaku při sledování cirkadiánních rytmů Bi4012 Projekt z Matematické biologie, 2018 Analýza signálů z měření krevního tlaku při sledování cirkadiánních rytmů Bi4012 Projekt z Matematické biologie, 2018  data o systolickém krevním tlaku, diastolickém krevním tlaku a o tepové frekvenci  60 pacientů, 2 různé terapie Analýza signálů z měření krevního tlaku při sledování cirkadiánních rytmů Bi4012 Projekt z Matematické biologie, 2018 Cíl: Navrhnout a realizovat model cirkadianních rytmů tlaku krve. Na základě modelu stanovit dipping pacientů s čerstvě zjištěnou hypertenzí před a po 3-měsíční léčbě kardioselektivními betablokátory. Porovnat dosažené výsledky s výsledky klasických metod (popisná statistika). Návrh pracovních balíků (work packages) : WP1) Přehled existujících metod pro modelování denních průběhů tlaku krve ve vztahu k hodnocení dippingu. Vysvětlení podstaty a rizik dippingu x nondippingu. WP2) Import dat a jejich předzpracování. Návrh a realizace vlastního modelu. Hodnocení dippingu na předaném souboru pacientů. WP3) Porovnání klasických metod (popisná statistika) a nové vlastní metody (s využitím modelu). Klasifikace obrazů pomocí konvolučních neuronových sítí Vedoucí: Roman Vyškovský a Vendula Churová Motivace snaha o vytvoření objektivního nástroje pro počítačovou podporu diagnostiky psychiatrických a neurodegenerativních onemocnění (schizofrenie a Alzheimerova choroba) včasná diagnostika = včasná léčba = lepší prognóza Konvoluční neuronová síŤ state-of-the-art pro klasifikaci obrazových dat strojové učení – klasifikace – konvoluční neuronové sítě (machine learning – classification – convolutional neural networks) https://towardsdatascience.com/build-your-own-convolution-neural-network-in-5-mins-4217c2cf964f Ale • horší výsledky klasifikace na malých datových souborech • existuje množství předučených konvolučních neuronových sítí: - AlexNet, - GoogLeNet, - VGG-16, - VGG-19, - a jiné.  využití předučených neuronových sítí pomocí tzv. transfer learning (přenosového učení) https://www.mathworks.com/solutions/deep-learning/convolutional-neural-network.html Výzkumná otázka to transer or not to transfer that is the question Pomůže „transfer learning“ vylepšit klasifikaci 2D obrazů mozků schizofreniků/zdravých jedinců oproti náhodně inicializované konvoluční neuronové síti? https://towardsdatascience.com/build-your-own-convolution-neural-network-in-5-mins-4217c2cf964f Úkoly Teoretická část: - nastudovat si konvoluční neuronové sítě (samostudium) - nastudovat si metody validace modelu (Bi0034) Praktická část: - aplikovat 2D konvoluční neuronovou síť na problém klasifikace obrazů - na stejný problém využít metodu „transfer learning“ - vyhodnotit výsledky a srovnat je Data a software Data: - předzpracované 2D obrazy ze strukturální MRI - schizofrenici a zdraví jedinci, - libovolný datový soubor s 2D obrazy z internetu (Alzheimer, melanom aj.) Programové prostředí: - Matlab - Python Kde začít? Klasifikace • https://is.muni.cz/auth/predmet/sci/podzim2018/Bi0034 Neuronové sítě • https://www.digitaltrends.com/cool-tech/what-is-an-artificial-neural-network/ Matlab • https://www.mathworks.com/help/deeplearning/examples/create-simple-deep-learning- network-for-classification.html Navíc http://www.vlfeat.org/matconvnet/pretrained/ a https://github.com/BVLC/caffe/wiki/Model-Zoo - předučené sítě https://github.com/KaimingHe/deep-residual-networks#models - popis vrstev předučených modelů resnetu https://www.cad.cz/vzdelavani/83-vzdelavani/8024-deep-learning-v-prostredimatlab.html