Interactive Syllabus

Analýza a management dat pro zdravotnické obory - seminář

Info

Cíl předmětu:

Předmět je úvodem do praktické analýzy dat pro studenty klinických vědních oborů. Látka navazuje na přednášku MIKAM021p Analýza a management dat pro zdravotnické obory z pohledu praktického řešení problémů analýzy dat ve statistickém software. Studenti budou podrobně seznámeni se všemi aspekty práce s daty a jejich statistického hodnocení (popisná statistika, jedno-výběrové a dvou-výběrové testy, testy pro kategoriální data, ANOVA, korelační analýza, vizualizace dat). Kurz vede k osvojení základních principů statistické analýzy dat a připravuje uchazeče k jejímu samostatnému využití ve vlastní vědecké práci.

Požadavky pro ukončení předmětu:

1. Aktivita ve výuce

2. 100% účast na seminářích, za který je udělen zápočet

Doporučená literatura:

HAVRÁNEK, Tomáš. Statistika pro biologické a lékařské vědy. 1. vyd. Praha: Academia, 1993, 476 s. ISBN 8020000801.

ALTMAN, Douglas G. Practical statistics for medical research. 1st ed. Boca Raton: Chapmann & Hall/CRC, 1991, xii, 611. ISBN 0412276305.

POCOCK, Stuart J. Clinical trials : a practical approach. Chichester: John Wiley & Sons, 1999, xii, 266. ISBN 0471901555.

ZAR, Jerrold H. Biostatistical analysis. 5th ed. Upper Saddle River, N.J.: Prentice Hall, 2010, xiii, 944. ISBN 9780131008465.

MCFADDEN, Eleanor. Management of data in clinical trials. New York: John Wiley & Sons, 1998, xi, 210. ISBN 047130316X.

Seminář 1 Statistika ve vědecké praxi

Open

Statistická analýza biologických dat je jedním z nástrojů, s jejichž pomocí se snažíme zjistit odpovědi na naše otázky týkající se pochopení živé přírody. Jako každý nástroj je i statistickou analýzu nezbytné na jedné straně korektně využívat a na druhou stranu nepřeceňovat její možnosti. Klíčovým faktem při statistické analýze dat je nahlížení na realitu prostřednictvím vzorku a přijmutí toho, že výsledky naší analýzy jsou jen tak dobré, jak dobrý je náš vzorek. Reprezentativnost, nezávislost a náhodnost vzorku spolu s jeho velikostí jsou důležité faktory ovlivňující věrohodnost našich závěrů.

Teacher recommends to study from 17/2/2025 to 23/2/2025.

Seminář 2 Klíčové principy biostatistiky a příprava dat

Open

Ve statistické analýze biologických a klinických dat musíme vždy nad prováděným výzkumem a jeho výsledky přemýšlet v kontextu 5 klíčových principů biostatistiky. Zkreslení – skutečně vidíme to co si myslíme, že vidíme? Reprezentativnost – vypovídá naše analýza o skupině objektů, která nás zajímá? Srovnatelnost – co ve skutečnosti v analýze srovnáváme? Spolehlivost – jak spolehlivé jsou naše výsledky, dají se zopakovat? Významnost – jak moc je pravděpodobné, že pozorujeme výsledky pouhé náhody? Zanedbání těchto principů může vést k chybné interpretaci výsledků. Současná statistická analýza se neobejde bez zpracování dat pomocí statistických software. Předpokladem úspěchu je správné uložení dat ve formě „databázové“ tabulky umožňující jejich zpracování v libovolné aplikaci. Neméně důležité je věnovat pozornost čištění dat předcházející vlastní analýze. Každá chyba, která vznikne nebo není nalezeno ve fázi přípravy dat se promítne do všech dalších kroků a může zapříčinit neplatnost výsledků a nutnost opakování analýzy

Teacher recommends to study from 24/2/2025 to 2/3/2025.

Study now

Seminář 3 Informace a rozdělení dat, základní typy dat

Open

Základním principem statistiky je pravděpodobnost výskytu nějaké události. Prostřednictvím vzorkování se snažíme odhadnout skutečnou pravděpodobnost událostí. Klíčovou otázkou je velikost vzorku, čím větší vzorek, tím větší šance na projevení se skutečné pravděpodobnosti výskytu jevu. Realitu můžeme popisovat různými typy dat, každý z nich se specifickými vlastnostmi, výhodami, nevýhodami a vlastní sadou využitelných statistických metod Od binárních přes kategoriální, ordinální až po spojitá data roste míra informace v nich obsažené. Základním přístupem k popisné analýze dat je tvorba frekvenčních tabulek a jejich grafických reprezentací – histogramů.

Teacher recommends to study now - from 3/3/2025 to 9/3/2025.

Seminář 4 Modelová rozložení

Open

Klasickým postupem statistické analýzy je na základě vzorku cílové populace identifikovat typ a charakteristiky modelového rozložení dat, využít jeho matematického modelu k popisu reality a získané výsledky zobecnit na hodnocenou cílovou populaci. Využití tohoto přístupu je možné pouze v případě shody reálných dat s modelovým rozložením, v opačném případě hrozí získání zavádějících výsledků. Nejklasičtějším modelovým rozložením, od něhož je odvozena celá řada statistických analýz je tzv. normální rozložení, známé též jako Gaussova křivka.

Teacher recommends to study from 10/3/2025 to 16/3/2025.

Seminář 5 Provádění odhadů, základy testování hypotéz

Open

Dva základní přístupy statistického hodnocení jsou popis dat a testování hypotéz. Při popisu dat je třeba si uvědomit, že popisné statistiky získané ze vzorku nejsou skutečnou hodnotou v cílové populaci, ale pouze jejím odhadem. Přesnost odhadu závisí jednak na variabilitě dat, jednak na velikosti vzorku, při vzorkování celé cílové populace by výsledná popisná statistika již byla přesnou hodnotou, nikoliv odhadem. Odhady a s nimi související intervaly spolehlivosti jsou univerzálním statistickým postupem a je možné je dopočítat k libovolné popisné statistice. Testování hypotéz je po popisné statistice druhým hlavním směrem statistických analýz. Při testování pokládáme hypotézy, které se snažíme s určitou pravděpodobností potvrdit nebo vyvrátit. Tzv. nulovou hypotézu lze nejlépe popsat jako situaci, kdy předpokládáme vliv náhody (rozdíl mezi skupinami je pouhá náhoda, vztah dvou proměnných je pouhá náhoda apod.), alternativní hypotéza předpokládá vliv nenáhodného faktoru. Výsledkem statistického testu je v zásadě pravděpodobnost nakolik je hodnocený jev náhodný nebo ne, při překročení určité hranice (nejčastěji méně než 5% pravděpodobnost, že jev je pouhá náhoda) deklarujeme, že pravděpodobnost náhody je pro nás dostatečně nízká abychom jev prohlásili za nenáhodný Statistická významnost je ovlivnitelná velikostí vzorku a tak je pouze indicií k prohlášení např. rozdílu dvou skupin pacientů za skutečně významný. V ideální situaci je nezbytné aby rozdíl byl významný nejenom statisticky (=nenáhodný), ale i prakticky (=nejde pouze o artefakt velikosti vzorku).

Teacher recommends to study from 17/3/2025 to 23/3/2025.

Seminář 6 Pojmy z oblasti statistického testování, statistické testy pro spojitá data

Open

Jednovýběrové statistické testy srovnávají některou popisnou statistiku vzorku (průměr, směrodatnou odchylku) s jediným číslem, jehož význam je ze statistické hlediska hodnota cílové populace Z hlediska statistické teorie jde o ověření, zda daný vzorek pochází z testované cílové populace. Jedním z nejčastějších úkolů statistické analýzy dat je srovnání spojitých dat ve dvou skupinách pacientů. Na výběr je celá škála testů, výběr konkrétního testu se pak odvíjí od toho, zda je o srovnání párové nebo nepárové a zda je vhodné použít test parametrický (má předpoklady o rozložení dat) nebo neparametrický (nemá předpoklady o rozložení dat, nicméně má nižší vypovídací sílu). Nejznámějšími testy z této skupiny jsou tzv. t-testy používané pro srovnání průměrů dvou skupin hodnot

Teacher recommends to study from 24/3/2025 to 30/3/2025.

Seminář 7 Neparametrické dvouvýběrové statistické testy, binomické rozdělení

Open

Kromě spojitých dat se setkáváme také s daty kategoriálními, jejichž nejjednodušším případem jsou data binární. Binární data jsou popsána binomickým rozdělením, od chování binomického rozdělení je odvozena popisná statistika binárních dat (procento výskytu jevu), její interval spolehlivosti a binomické testy pro srovnání procentuálního výskytů jevů v různých skupinách.

Teacher recommends to study from 31/3/2025 to 6/4/2025.

Seminář 8 Kontingenční tabulky

Open

Analýza kontingenčních tabulek umožňuje analyzovat vazbu mezi dvěma kategoriálními proměnnými. Základním způsobem testování je tzv. chi-square test, který srovnává pozorované četnosti kombinací kategorií oproti očekávaným četnostem, které vychází z teoretické situace, kdy je vztah mezi proměnnými náhodný. Test dobré shody je využíván také pro srovnání pozorovaných četností proti očekávaným četnostem daným určitým pravidlem (typickým příkladem je Hardy-Weinbergova rovnováha v genetice) Specifickým typem výstupů odvozených z kontingenčních tabulek jsou tzv. odds ratia a relativní rizika, využívaná často v medicíně pro identifikaci a popis rizikových skupin pacientů.

Teacher recommends to study from 7/4/2025 to 13/4/2025.

Seminář 9 Poissonovo rozdělení, analýza rozptylu

Open

Poissonovo rozdělení se používá pro popis četnosti výskytu jevu na experimentální jednotku, příkladem může být počet mutací bakterií na Petriho misku nebo počet srdečních poruch na jednotku času Analýza rozptylu je základním nástrojem pro analýzu rozdílů mezi průměry v několika skupinách objektů. Základní myšlenka, na níž je ANOVA založena, je rozdělení celkové variability v datech (neznámé, dané pouze náhodným rozložením) na část systematickou (spjatou s kategoriemi pacientů, vysvětlená variabilita) a část náhodnou. Pokud systematická, tedy nenáhodná a vysvětlitelná část variability převažujeme, považujeme daný kategoriální faktor za významný pro vysvětlení variability dat. Analýza rozptylu vyhodnocuje pouze celkový vliv faktoru na variabilitu, v případě analýzy jednotlivých kategorií je třeba využít tzv. post-hoc testy

Teacher recommends to study from 14/4/2025 to 20/4/2025.

Seminář 10 Korelace a regrese

Open

Korelační analýza je využívána pro vyhodnocení míry vztahu dvou spojitých proměnných. Obdobně jako jiné statistické metody, i korelace mohou být parametrické nebo neparametrické Regresní analýza vytváří model vztahu dvou nebo více proměnných, tedy jakým způsobem jedna proměnná (vysvětlovaná) závisí na jiných proměnných (prediktorech). Regresní analýza je obdobně jako ANOVA nástrojem pro vysvětlení variability hodnocené proměnné

Teacher recommends to study from 21/4/2025 to 27/4/2025.

Videozáznamy výuky

Open

V odkazech níže naleznete videomateriály - záznamy přednášek z roku 2020, jednotlivá videa neodpovídají přesně přednáškám, 10 přednášek je v 8 videozáznamech.

Další výukové materiály

Open

Doplňující materiály obsahují základní sumarizaci metodiky statistické analýzy dat a ovládání software Statistica.

Analýza a management dat pro zdravotnické obory - seminář
- Study now
  
  Seminář 1 Statistika ve vědecké praxi
- Study now
  
  Seminář 2 Klíčové principy biostatistiky a příprava dat
- Study now
  
  Seminář 3 Informace a rozdělení dat, základní typy dat
- Study now
  
  Seminář 4 Modelová rozložení
- Study now
  
  Seminář 5 Provádění odhadů, základy testování hypotéz
- Study now
  
  Seminář 6 Pojmy z oblasti statistického testování, statistické testy pro spojitá data
- Study now
  
  Seminář 7 Neparametrické dvouvýběrové statistické testy, binomické rozdělení
- Study now
  
  Seminář 8 Kontingenční tabulky
- Study now
  
  Seminář 9 Poissonovo rozdělení, analýza rozptylu
- Study now
  
  Seminář 10 Korelace a regrese
- Study now
  
  Videozáznamy výuky
- Study now
  
  Další výukové materiály

Operations

View all