PřF:Bi7490 Prediktivní modelování - Informace o předmětu
Bi7490 Prediktivní modelování
Přírodovědecká fakultajaro 2010
- Rozsah
- 2/0/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k.
- Vyučující
- prof. RNDr. Ladislav Dušek, Ph.D. (přednášející)
RNDr. Jiří Jarkovský, Ph.D. (přednášející)
Mgr. Klára Komprdová, Ph.D. (cvičící) - Garance
- prof. RNDr. Ladislav Dušek, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: prof. RNDr. Ladislav Dušek, Ph.D. - Rozvrh
- Po 13:00–16:50 F01B1/709
- Předpoklady
- Bi5040 Biostatistika - základní kurz && Bi8600 Vícerozměrné statistické met.
Nutným předpokladem je dobrá znalost základní metodologie biostatistiky . Doporučeno je absolvování předmětu Vícerozměrných statických metod (Bi8600). - Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- předmět má 11 mateřských oborů, zobrazit
- Cíle předmětu
- Na koncitohoto kurzu bude student schopen:
- kriticky zhodnotit datový soubor z hlediska rozložení dat
- určit prostorou závislost v datech
- používat metody pro prostorové a prediktivní modelování
- osvojení si různých SW pro tvorbu modelů (R-project, Matlab, Statistica)
- vybrat vhodnou prediktivní metodu metodu v závislosti na rozložení dat
- srovnat výhody a nevýhod jednotlivých metod - Osnova
- Úvod do prediktivního modelování
- Základy vícerozměrných metod
- Parametrická a neparametrická vícerozměrná statistika – srovnání různých přístupů
- Statistické SW pro vícerozměrnou analýzu dat – představení různých SW (STATISTIKA, R-project, MATLAB)
- Parametrické a semiparametrické regresní metody (LM, GLM, GAM) – výběr linkovací funkce, multikolinearita, odhad parametrů modelu, hodnocení vhodnosti modelu
- Lineární regrese
- Zobecněné lineární modely
- Zobecněné aditivní modely
- Neparametrické metody I: Rozhodovací stromy – různé algoritmy tvorby stromů, stabilita stromu, krosvalidace
- Klasifikační stromy
- Regresní stromy
- Neparametrické metody II: Náhodné lesy - nadstavba nad rozhodovacími stromy
- Bagging, Boosting, Arcing, Random forest
- Analýza prostorových dat
- Prostorová autokorelace, Pseudoreplikace
- Interpolace x Extrapolace
- Použití parametrických a neparametrických metod pro prostorovou analýzu
- Reálné aplikace vícerozměrných prediktivních metod:
- srovnání prediktivních metod pro spojitá i kategoriální data (CCA, RDA, ENFA, regresní metody, stromy, lesy...)
- Příklady: prediktivní modelování rozšíření druhů, výběr významných druhů a prediktorů pro různé habitaty, valenční křivky, typologické mapy, modelování koncentrací polutantů
- Literatura
- Legendre P., Legendre L. (1998) Numerical ecology (second ed.), Elsevier, Amsterdam
- Breiman, L. et al (1984) Classification and Regression Trees, Chapman and Hall
- Breiman L. (2001) Random forests. Machine Learning 45, pp. 5 32.
- Hastie T., Tibshirani R., Friedman J.: The Elements of Statistical Learning, Data mining, Inference and Prediction, Springer 2003
- Hengl T. (2007) A Practical Guide to Geostatistical Mapping of Environmental Variables
- Lemeshow, Stanley & Hosmer, David W., Jr.. Logistic regression, p. 1-11. In Encyclopaedia of Biostatistics, 1st ed. [Online.] Wiley, London.
- Jan Klaschka, Emil Kotrč: Klasifikační a regresní lesy, sborník konference ROBUST 2004
- McCullagh C. E., Searle S. R. (2001): Generalized, Linear, and Mixed Models, John Wiley & Sons.
- Breiman L. (1996) Bagging predictors. Machine Learning 24, pp.123 140.
- McCullagh, P., Nelder, J.A. (1989): Generalized Linear Models (2nd edition), Chapman & Hall
- Harrel F. E., Jr. (2001): Regression Modeling Strategies. With Applications to Linear Models, Logistic Regression and Survival Analysis. Springer, Springer Series in Statistics, New York
- Lažanský et. Kol.: Umělá inteligence I.- IV.
- Výukové metody
- Výuka probíhá formou powerpointových prezentací. Každý blok bude doplněn praktickou částí na PC, kde bude možno si jednotlivé modely vyzkoušet v různých SW. Budou řešeny praktické úlohy na reálných datech z oblasti experimentální biologie, ekologie, chemie. Student vypracuje během semestru projekt na jedno ze zadaných témat.
- Metody hodnocení
- Zakončením předmětu bude písemná zkouška zaměřená na ověření teoretické pochopení probíraných metod a hodnocení projektu.
- Informace učitele
- http://www.cba.muni.cz/vyuka/
- Další komentáře
- Studijní materiály
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je vyučován každoročně.
- Statistika zápisu (jaro 2010, nejnovější)
- Permalink: https://is.muni.cz/predmet/sci/jaro2010/Bi7490