Bi8601 Pokročilé statistické metody

Přírodovědecká fakulta
jaro 2021
Rozsah
0/3/0. 3 kr. (plus ukončení). Ukončení: z.
Vyučující
RNDr. Jiří Jarkovský, Ph.D. (přednášející)
Mgr. Lucie Kubínová (cvičící)
RNDr. Simona Littnerová, Ph.D. (cvičící)
Garance
prof. RNDr. Ladislav Dušek, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: RNDr. Jiří Jarkovský, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta
Rozvrh
Po 1. 3. až Pá 14. 5. Út 8:00–10:50 D29/347-RCX2
Předpoklady
Kurz základní biostatistiky - např. Bi5040 Biostatistika - základní kurz nebo Bi5045 Biostatistika pro matematickou biologii. Znalost základních statistických technik jednorozměrné analýzy dat, analýza rozptylu, korelační analýza, jednoduchá regresní analýza přímky.
Omezení zápisu do předmětu
Předmět je otevřen studentům libovolného oboru.
Cíle předmětu
Cílem předmětu je představit studentům oblast vícerozměrné analýzy biologických dat v přehledné formě zaměřené na základní principy, limitace a praktickou interpretaci vícerozměrných analýz. V průběhu kurzu budou studenti seznámeni s možnostmi popisu a vizualizace vícerozměrného souboru dat, základními metodami shlukové a ordinační analýzy a strategií vícerozměrného stochastického modelování.
Výstupy z učení
Student bude po absolvování předmětu schopen:
Korektně připravit datový soubor pro vícerozměrnou analýzu;
Popsat vícerozměrná data; Použít vícerozměrné statistické testy;
Vybrat vhodnou metriku podobnosti nebo vzdálenosti;
Spočítat a vizualizovat asociační matice;
Ovládat aplikaci a principy různých shlukovacích algoritmů;
Ovládat aplikaci a principy různých ordinačních metod;
Ovládat aplikaci a principy základních regresních metod, ANOVA a ROC analýzy;
Zvolit adekvátní metodu pro analýzu vícerozměrných dat na základě výhod a omezení jednotlivých dostupných metod;
Interpretovat výsledky vícerozměrné analýzy dat.
Osnova
  • Smysl a cíle vícerozměrné analýzy dat a modelování – příklady užití vícerozměrných analýz, výhody a nevýhody vícerozměrné analýzy dat, datová matice a značení, tabulkové a grafické zpracování vícerozměrných dat.
  • Maticový počet – operace s maticemi, inverzní matice, vlastní čísla a vektory.
  • Vícerozměrná rozdělení pravděpodobnosti – náhodný vektor a jeho realizace, popisné statistiky, interval spolehlivosti, odlehlá pozorování.
  • Vícerozměrné statistické testy – vícerozměrný t-test, vícerozměrná analýza rozptylu.
  • Podobnosti a vzdálenosti ve vícerozměrném prostoru.
  • Asociační matice – výpočet a vizualizace, popisná analýza, operace s asociačními maticemi (Mantelův test, MEANSIM, ANOSIM, regrese na asociačních maticích).
  • Shluková analýza hierarchická – hierarchické aglomerativní shlukování, hierarchické divizivní shlukování.
  • Shluková analýza nehierarchická a identifikace optimálního počtu shluků.
  • Ordinační analýzy – principy redukce dimenzionality, selekce a extrakce proměnných.
  • Ordinační analýzy – analýza hlavních komponent (PCA).
  • Ordinační analýzy – korespondenční analýza (CA), mnohorozměrné škálování (MDS).
  • Ordinační analýzy - diskriminační analýza.
  • Základy stochastického modelování - ANOVA, lineární regrese, ROC analýza, logistická regrese, strategie regresního modelování.
  • Ucelený souhrn aplikace vícerozměrných metod v analýze dat.
Literatura
  • LEGENDRE, Pierre a Louis LEGENDRE. Numerical ecology. 3rd engl. ed. Amsterdam: Elsevier, 2012, xvi, 990. ISBN 9780444538680. info
  • BORCARD, Daniel, François GILLET a Pierre LEGENDRE. Numerical ecology with R. New York: Springer, 2011, xi, 306. ISBN 9781441979759. info
  • ZAR, Jerrold H. Biostatistical analysis. 5th ed. Upper Saddle River, N.J.: Prentice Hall, 2010, xiii, 944. ISBN 9780131008465. info
Výukové metody
Teoretické přednášky doplněné komentovanými příklady a cvičením na počítačích, studenti jsou podporováni v kladení otázek týkajících se probírané látky.
Metody hodnocení
Předmět je ukončen písemnou zkouškou zaměřenou zejména na principy vícerozměrných metod, předpoklady výpočtů a jejich aplikaci a interpretaci.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích jaro 2020, jaro 2022.