Základní informace o předmětu Výpočetní statistika Náplň předmětu 1. Průzkumová analýza jednorozměrných dat, diagnostické grafy - datový soubor - bodové a intervalové rozložení četností - typy znaků, číselné charakteristiky znaků - krabicový diagram, N-P plot, P-P plot, Q-Q plot, histogram 2. Průzkumová analýza vícerozměrných dat - vícerozměrný datový soubor - vizualizace vícerozměrných dat - snížení dimenze dat metodou hlavních komponent - shluková analýza 3. Základní pojmy matematické statistiky I - náhodný výběr z jednorozměrného a vícerozměrného rozložení - statistika jako funkce náhodného výběru - bodové a intervalové odhady parametrů a parametrických funkcí 4. Základní pojmy matematické statistiky II 4.1. Základní typy uspořádání pokusů - jednoduché pozorování - dvojné pozorování - mnohonásobné pozorování 4.2. Úvod do testování hypotéz - nulová a alternativní hypotéza - chyba 1. a 2. druhu - testování pomocí kritického oboru - testování pomocí intervalu spolehlivosti - testování pomocí p-hodnoty 4.3. Testování normality - Kolmogorovův – Smirnovův test a jeho Lilieforsova varianta - Shapirův – Wilkův test - srovnání S-W testu a Lilieforsova testu pomocí simulačních studií 5. Úlohy o parametrech jednoho normálního rozložení - rozložení statistik odvozených z výběrového průměru a výběrového rozptylu - vzorce pro meze intervalů spolehlivosti pro střední hodnotu a rozptyl - jednotlivé typy testů pro parametry normálního rozložení (z-test, jednovýběrový t-test, test o rozptylu, párový t-test) 6. Úlohy o parametrech dvou normálních rozložení - rozložení statistik odvozených ze dvou výběrových průměrů a rozptylů - vzorce pro meze intervalů spolehlivosti pro rozdíl středních hodnot a podíl rozptylů - jednotlivé typy testů pro parametry dvou normálních rozložení (dvouvýběrový z-test, dvouvýběrový t-test, F-test) - Cohenův koeficient věcného účinku 7. Úlohy o parametrech jednoho a dvou alternativních rozložení 7.1. Případ jednoho náhodného výběru - asymptotické rozložení statistiky odvozené z výběrového průměru alternativního rozložení - vzorec pro meze intervalu spolehlivosti pro parametr alternativního rozložení - testování hypotézy o parametru alternativního rozložení 7.2. Případ dvou nezávislých náhodných výběrů - asymptotické rozložení statistiky odvozené z výběrových průměrů dvou nezávislých alternativních rozložení - vzorec pro meze intervalu spolehlivosti pro rozdíl parametrů dvou alternativních rouložení - testování hypotézy o rozdílu parametrů dvou alternativních rozložení 8. Parametrické úlohy o více nezávislých náhodných výběrech 8.1. Porovnání aspoň tří nezávislých náhodných výběrů z normálních rozložení (jednofaktorová analýza rozptylu) - testování hypotézy o shodě středních hodnot - testování hypotézy o shodě rozptylů (testy homogenity rozptylů) - zkoumání vlastností testů homogenity pomocí simulačních studií - post-hoc metody mnohonásobného porovnávání 8.2. Porovnání aspoň tří nezávislých náhodných výběrů z alternativních rozložení - test homogenity binomických rozložení - mnohonásobné porovnávání 9. Neparametrické testy o mediánech - jednovýběrové a párové testy - dvouvýběrové testy - neparametrické obdoby jednofaktorové analýzy rozptylu 10. Porovnání empirického a teoretického rozložení - testy dobré shody pro diskrétní a spojité rozložení při úplně i neúplně specifikovaném problému - jednoduchý test pro exponenciální a Poissonovo rozložení 11. Hodnocení kontingenčních tabulek - zavedení kontingenční tabulky - testování hypotézy o nezávislosti a měření síly závislosti - test homogenity - analýza čtyřpolních tabulek 12. Jednoduchá korelační analýza - Spearmanův koeficient pořadové korelace - testování pořadové nezávislosti - Pearsonův koeficient korelace a výběrový koeficient korelace - testování nezávislosti - porovnání koeficientu korelace s danou konstantou - porovnání dvou koeficientů korelace - interval spolehlivosti pro koeficient korelace 13. Jednoduchá lineární regrese - specifikace klasického modelu lineární regrese a jeho maticový zápis - intervaly spolehlivosti pro regresní parametry - celkový F-test - dílčí t-testy - kritéria pro posouzení vhodnosti zvolené regresní funkce - detailní rozbor modelu regresní přímky Povinná literatura Budíková, Marie – Lerch, Tomáš – Mikoláš, Štěpán: Základní statistické metody. První dotisk prvního vydání. Brno : Masarykova univerzita, 2009. 180 s. ISBN 978-80-210-3886-8 Budíková, Marie – Králová, Marie – Maroš, Bohumil: Průvodce základními statistickými metodami. Vydání první. Praha: Grada Publishing, a.s., 2010. 272 s. edice Expert. ISBN 978-80-247-3243-5 Doporučená literatura Anděl, Jiří: Statistické metody. Vydání první. Praha: MATFYZPRESS, 1993. 246 s. Hendl, Jan: Přehled statistických metod zpracování dat. Vydání první. Praha: Portál, 2004. 584 s. ISBN 80-7178-820-1 Způsob výuky Přednášky: Prezentace látky prokládané praktickými ukázkami aplikace statistických metod. Cvičení: 1. hodina v posluchárně, počítání příkladů na tabuli. 2. hodina v počítačové učebně, zpracování datových souborů s využitím systému STATISTICA podle návodů umístěných v Učebních materiálech, průběžná kontrola znalostí pomocí Odpovědníků. Instalace software STATISTICA je dostupná na adrese https://inet.muni.cz/app/soft/licence Způsob zakončení předmětu: Průběžný elektronický test v 7. týdnu výuky. Písemná zkouška sestávající ze dvou částí. 1. část – písemka s několika úkoly (na 50 minut, možno získat až 40 bodů) 2. část – praktické zpracování dat pomocí statistického software (na 60 minut, možno získat až 60 bodů) Pro zájemce: samostatné zpracování rozsáhlejšího datového souboru, bonus až 10 bodů. Podmínky připuštění k zkoušce: maximálně tři omluvené absence ve cvičeních, úspěšné zvládnutí elektronického testu. Kontakt na vyučující Marie Budíková budikova@math.muni.cz Konzultační hodiny: středa 8.00 – 9.30 h