M5VM05 Statistické modelování

Přírodovědecká fakulta
podzim 2015
Rozsah
2/1. 3 kr. (příf plus uk plus > 4). Ukončení: zk.
Vyučující
doc. Mgr. Jan Koláček, Ph.D. (přednášející)
Garance
prof. RNDr. Ivanka Horová, CSc.
Ústav matematiky a statistiky – Ústavy – Přírodovědecká fakulta
Kontaktní osoba: doc. Mgr. Jan Koláček, Ph.D.
Dodavatelské pracoviště: Ústav matematiky a statistiky – Ústavy – Přírodovědecká fakulta
Rozvrh
Pá 10:00–11:50 M3,01023
  • Rozvrh seminárních/paralelních skupin:
M5VM05/01: Pá 12:00–12:50 M3,01023, J. Koláček
Předpoklady
KREDITY_MIN(80)||TYP_STUDIA(N)
Základní pojmy teorie pravděpodobnosti a matematické statistiky. Základy jazyka R.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Kurz je zaměřen na základní statistické metody a modely. V úvodních partiích jsou studovány základní pojmy matematické statistiky. Potom následuje regresní analýza, nejprve je studován lineární regresní model, dále pak zobecněné lineární modely. Jde o kurz, jehož praktické využití v dalších oborech je bezprostřední a velmi časté. Na konci tohoto kurzu bude student schopen pochopit principy matematické statistiky a analýzy dat; naučit se tyto výsledky využívat pro konkrétní modely; pochopit vztahy mezi jednotlivými druhy těchto modelů; interpretovat jejich výsledky.
Osnova
  • 1.Průzkumová analýza dat: číselné charakteristiky datového souboru, diagnostické grafy - boxplot,N-P plot, Q-Q plot, P-P plot, histogram.
  • 2.Základní pojmy matematické statistiky: náhodný výběr, základní výběrové statistiky a jejich vlastnosti, testování statistických hypotéz. Výběrová distribuční funkce a funkce přežití.
  • 3.Základy regresní a korelační analýzy: pojem regrese a korelace, korelační koeficient, koeficient mnohonásobné korelace, parciální korelační koeficient.
  • 4.Lineární regresní model: jeho definice, odhady neznámých parametrů, testování hypotéz, verifikace modelu. Nedůležitější aplikace: dvouvýběrový t-test, analýza rozptylu, klasické regresní modely – regresní přímka, polynomická a trigonometrická regrese. Regresní modely pro korelovaná data.
  • 5.Analýza rozptylu. Konstrukci modelu a testování hypotézy o shodě středních hodnot. Testy shody rozptylů. Metody mnohonásobného porovnávání.
  • 6.Zobecněné lineární modely: popis komponent modelu (linkovací funkce, lineární prediktor, rozdělení exponenciálního typu pro závisle proměnnou veličinu). Nejdůležitější aplikace: gamma regrese, regresní modely pro alternativní (binární) a binomická data, modely dávka odpověď, modely pro nominální a ordinální data, poissonovská regrese, log-lineární modely.
  • 7.Modelování závislostí mezi kvalitativními proměnnými – kontingenční tabulky. Testování nezávislosti a homogenity, čtyřpolní kontingenční tabulky.
Literatura
    doporučená literatura
  • ANDĚL, Jiří. Základy matematické statistiky. Vyd. 1. Praha: Matfyzpress, 2005, 358 s. ISBN 8086732401. info
  • An introduction to generalized linear models. Edited by Annette J. Dobson. 2nd ed. Boca Raton: CRC Press, 2002, vii, 225 s. ISBN 1-58488-165-8. info
  • DUPAČ, Václav a Marie HUŠKOVÁ. Pravděpodobnost a matematická statistika. Praha: Karolinum, 2001, 162 s. ISBN 8024600099. info
  • CLEVELAND, William S. Visualizing data. Murray Hill: AT & T Bell Laboratories, 1993, 360 s. ISBN 0-9634884-0-6. info
  • ANDĚL, Jiří. Matematická statistika. Praha: SNTL - Nakladatelství technické literatury, 1985. info
  • RAO, C. Radhakrishna. Lineární metody statistické indukce a jejich aplikace. Translated by Josef Machek. Vyd. 1. Praha: Academia, 1978, 666 s. URL info
Výukové metody
Přednáška: teoretická výuka kombinovaná s praktickými příklady Cvičení: počítačová cvičení zaměřená na osvojení základních pojmů, řešení jednoduchých úloh v jazyce R
Metody hodnocení
Přednáška s cvičením. Aktivní práce na cvičeních. Jeden test na počítačích ke konci semestru. Test obsahuje 2-3 příklady a je hodnocený maximálně 30 body. K úspěšnému zvládnutí je potřeba dosáhnout alespoň polovinu bodů. Zkouška písemná i ústní. Písemná část obsahuje 8 teoretických otázek, každou za 10 bodů. Celkový výsledek zkoušky je korigován ústní částí. Závěrečné hodnocení: A: 72 - 80 bodů B: 63 - 71 bodů C: 54 - 62 bodů D: 45 - 53 bodů E: 36 - 44 bodů F: 0 - 35 bodů
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2007 - akreditace, podzim 2011 - akreditace, podzim 2013, podzim 2014, podzim 2016, podzim 2017, podzim 2018, podzim 2019.