Bi8700 Vybrané kapitoly ze zpracování, analýzy a vizualizace dat Mapování nejen medicínského kurikula Jaro 2019, Institut biostatistiky a analýz Bi8700 Vybrané kapitoly ze zpracování, analýzy a vizualizace dat (jaro 2019) Co si představujete pod pojmem mapování? Jaro 2019, Institut biostatistiky a analýz 2 1 Co si představujete pod pojmem mapování? Jaro 2019, Institut biostatistiky a analýz Co si představujete pod pojmem mapování? Zdroj: https://en.wikipedia.org Jaro 2019, Institut biostatistiky a analýz Příklady dobré praxe měst ČR Případová studie Jaro 2019, Institut biostatistiky a analýz Jaro 2019, Institut biostatistiky a analýz Zdroj: www.partnerskamesta.cz Jaro 2019, Institut biostatistiky a analýz Mapování dobré praxe měst ČR Porozumění problematice vybrané oblasti Porozumění dostupným datům Příprava dat Modelování Vyhodnocení výsledků Využití výsledků a nasazení v praxi Jaro 2019, Institut biostatistiky a analýz Mapování dobré praxe měst ČR Bi8700 Vybrané kapitoly ze zpracování, analýzy a vizualizace dat (jaro 2019) Jakým způsobem vhodně vizualizovat tato data s cílem maximalizovat přehlednost, pochopitelnost a úplnost informací? Jaro 2019, Institut biostatistiky a analýz 10 9 8 7 6 5 4 3 2 1 Jakým způsobem vhodně vizualizovat tato data s cílem maximalizovat přehlednost, pochopitelnost a úplnost informací? Jaro 2019, Institut biostatistiky a analýz Komplexní popis kurikula Případová studie Jaro 2019, Institut biostatistiky a analýz Definice ̶ Curriculum mapping is a procedure for reviewing the operational curriculum as it is entered into an electronic database at any education setting. Starr, Linda (29 May 2006). "Virtual Workshop: Curriculum Mapping". Education World. Retrieved 14 May 2009. ̶ Curriculum mapping is concerned with what is taught, how it is taught, when it is taught, and the measures used to determine whether or not the student has achieved the expected learning outcomes. Harden, R. M. (2001). AMEE Guide No. 21: Curriculum mapping: a tool for transparent and authentic teaching and learning. Medical teacher, 23(2), 123-137. Jaro 2019, Institut biostatistiky a analýz Jaro 2019, Institut biostatistiky a analýz Jaro 2019, Institut biostatistiky a analýz Komplexní popis kurikula Porozumění problematice vybrané oblasti Porozumění dostupným datům Příprava dat Modelování Vyhodnocení výsledků Využití výsledků a nasazení v praxi Jaro 2019, Institut biostatistiky a analýz Komplexní popis kurikula Bi8700 Vybrané kapitoly ze zpracování, analýzy a vizualizace dat (jaro 2019) Pochopte datový model a následně vysvětlete, jak jsou osnovy výuky popsány. Definujte alespoň dvě výzkumné otázky, které povedou k optimalizaci kurikula, případně zlepšení kvality výuky. Jaro 2019, Institut biostatistiky a analýz 10 9 8 7 6 5 4 3 2 1 Pochopte datový model a následně vysvětlete, jak jsou osnovy výuky popsány. Definujte alespoň dvě výzkumné otázky, které povedou k optimalizaci kurikula, případně zlepšení kvality výuky. Jaro 2019, Institut biostatistiky a analýz Mapování kurikula Případová studie Jaro 2019, Institut biostatistiky a analýz Jaro 2019, Institut biostatistiky a analýz Interaktivní algoritmy Akutně.cz Jaro 2019, Institut biostatistiky a analýz Portál LF MU Jaro 2019, Institut biostatistiky a analýz Popis kurikula Jaro 2019, Institut biostatistiky a analýz Komplexní popis kurikula Porozumění problematice vybrané oblasti Porozumění dostupným datům Příprava dat Modelování Vyhodnocení výsledků Využití výsledků a nasazení v praxi Jaro 2019, Institut biostatistiky a analýz Bi8700 Vybrané kapitoly ze zpracování, analýzy a vizualizace dat (jaro 2019) Navrhněte algoritmus, který by umožňoval na základě dostupných informací dané výukové jednotce/předmětu související studijní materiály. Jaro 2019, Institut biostatistiky a analýz 10 9 8 7 6 5 4 3 2 1 Navrhněte algoritmus, který by umožňoval na základě dostupných informací dané výukové jednotce/předmětu související studijní materiály. Jaro 2019, Institut biostatistiky a analýz Jaro 2019, Institut biostatistiky a analýz Business understanding ̶ OPTIMED curriculum management system* ̶ General Medicine study field ̶ 1342 of learning units, 6977 of learning outcomes ̶ Approx. 600 standard pages ̶ Pilot experiment covers only Nursing and Psychiatry * Komenda M. et al. Portal OPTIMED [online]. Faculty of Medicine, Masaryk University. Available from WWW: http://opti.med.muni.cz. ISSN 2336-6648. Jaro 2019, Institut biostatistiky a analýz Data understanding ̶ OPTIMED database (PostgreSQL) Attribute (data type) Sample value Name of learning unit (varchar) Biologic therapy in psychiatry Importance of learning unit (text) The aim of the study unit is to introduce types of biological therapy in psychiatry, including psychopharmacotherapy, electroconvulsive therapy (ECT)… Description of learning unit (text) Psychopharmaceuticals can be classified in several ways. Lehman diversification is often used and is based on effects on three mental functions: vigilance, effectivity and mental integration (thinking)… Group learning outcome (varchar) Main indications, differences from adults (indications, efficacy), adverse effects, ethical aspects Index (varchar) Psychopharmacological drugs in relation to children, Antipsychotics, antidepressants, stimulants, thymoprophylactics Learning outcome (varchar) Student knows key indicators relating to psychopharmacological drugs. Jaro 2019, Institut biostatistiky a analýz Data preparation ̶ Table, record and attribute selection ̶ Data transformation (PostrgreSQL -> CSV) ̶ Data cleaning & stop-word list Jaro 2019, Institut biostatistiky a analýz Data preparation Jaro 2019, Institut biostatistiky a analýz Modeling – Input data Word2vec model Bag of words Word similarity threshold t Number of keywords n Modeling Jaro 2019, Institut biostatistiky a analýz Modeling – Algorithm ̶ All terms selection (occurrence >= 2) ̶ Cosine similarity computation of word2vec representations ̶ Graph G creation ̶ Centrality computation ̶ Select n terms as keywords Jaro 2019, Institut biostatistiky a analýz Modeling – Centrality measures ̶ Closeness centrality of vertices in the graph G https://www.youtube.com/watch?v=NgUj8DEH5Tc Jaro 2019, Institut biostatistiky a analýz Modeling – Centrality measures ̶ Betweenness centrality of vertices in the graph G https://www.youtube.com/watch?v=NgUj8DEH5Tc Jaro 2019, Institut biostatistiky a analýz Modeling – Centrality measures ̶ Eigenvector centrality of vertices in the graph G https://www.youtube.com/watch?v=DGVvm-j-NG4 Jaro 2019, Institut biostatistiky a analýz Modeling – Results (Psychiatry) Rank Closeness Betweenness Eigenvector 1 disorders neurological dopamine 2 neurological dysfunction neurotransmitter 3 schizophrenia stimulation acetylcholine 4 disorder inhibition serotonin 5 anxiety serotonin neurotransmitters 6 psychological anxiety receptors 7 symptoms antidepressant receptor 8 dysfunction brain neurons 9 psychopathology cortex noradrenaline 10 brain disorders presynaptic Settings: t = 0,6; n = 10 Jaro 2019, Institut biostatistiky a analýz Modeling – Results (Nursing) Rank Closeness Betweenness Eigenvector 1 ability able necessary 2 skills techniques required 3 able ability possible 4 techniques skills sufficient 5 method application desired 6 necessary implementation need 7 required method able 8 methods evaluation can 9 application necessary proper 10 technique essential essential Settings: t = 0,6; n = 10 Jaro 2019, Institut biostatistiky a analýz Modeling – Results (Nursing) Rank Closeness Betweenness Eigenvector 1 ability able necessary 2 skills techniques required 3 able ability possible 4 techniques skills sufficient 5 method application desired 6 necessary implementation need 7 required method able 8 methods evaluation can 9 application necessary proper 10 technique essential essential Settings: t = 0,6; n = 10 Jaro 2019, Institut biostatistiky a analýz Evaluation ̶ Senior expert assessment ̶ The best threshold value ̶ The most suitable centrality type ̶ Duplicities vs. Invalid keyword identification Jaro 2019, Institut biostatistiky a analýz Deployment ̶ New online dynamic visualization ̶ Attractive keyword representation ̶ Filtering features ̶ OPTIMED reporting tools ̶ D3.js JavaScript library ̶ Available at: http://opti.med.muni.cz/en/reporting/web/ Jaro 2019, Institut biostatistiky a analýz 6th International Workshop on Artificial Intelligence in Medical Applications Jaro 2019, Institut biostatistiky a analýz Research questions 1. Are we able to automatically generate sets of keywords? • Yes Jaro 2019, Institut biostatistiky a analýz Research questions 2. Are the extracted keywords relevant and do they express properly individual medical discipline? • Partly, further optimization is needed Jaro 2019, Institut biostatistiky a analýz Research questions 3. Which kind of centrality does identify the most accurate set of keywords and what is the proper value of determined threshold? • Threshold for cosine similarity = 0.6 • Closeness centrality Jaro 2019, Institut biostatistiky a analýz