Bi8660 Analýza dat na PC II

Přírodovědecká fakulta
jaro 2003
Rozsah
0/2/0. 2 kr. (příf plus uk plus > 4). Ukončení: kz.
Vyučující
RNDr. Jiří Jarkovský, Ph.D. (cvičící)
prof. RNDr. Ladislav Dušek, Ph.D. (cvičící)
prof. RNDr. Luděk Bláha, Ph.D. (cvičící)
Mgr. Adam Svobodník, Ph.D. (cvičící)
RNDr. Jan Mužík, Ph.D. (cvičící)
RNDr. Jiří Polách (cvičící)
Garance
RNDr. Jiří Jarkovský, Ph.D.
Ústav botaniky a zoologie – Biologická sekce – Přírodovědecká fakulta
Kontaktní osoba: RNDr. Jiří Jarkovský, Ph.D.
Předpoklady
Základy práce s MS Windows, základy práce s MS Office, přehled o základních statistických metodách. Navazuje na kurz Analýza dat na PC I (Bi 7541).
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Kurz navazuje volně na výuku základů biostatistiky (Bi5040) a na kurz Analýza dat na PC I (Bi 7541). Cílem je v efektivní a blokové formě usnadnit orientaci posluchače v ovládání a realizaci výpočtů v software STATISTICA for Windows (v5.5; v6.0). Kurz je zaměřen pouze prakticky, výuka probíhá výhradně na PC. Jsou řešeny praktické úlohy na reálných datech z oblasti experimentální biologie, ekologie, medicíny. Kurz je tématicky flexibilní, lze provést i orientaci na data posluchačů nebo připravit nová témata dle návrhu.
Osnova
  • A) Základy ovládání software Statistica for Windows a práce s daty Seznámení s programem; instalace programu Statistica (systémové požadavky, instalace); organizace nabídek a logika práce s programem; Statistica 5.5 a 6 - rozdíly ve struktuře a organizaci programu, přehled jednotlivých menu, nastavení programu, práce s nápovědou, internetové stánky; Práce s daty; import dat (načtení dat z MS Excel, textových a databázových souborů, struktura souborů); Operace s daty (typy proměnných, úpravy záznamů a proměnných, odvozené a vypočítané proměnné - transformace, transponování, chybějící hodnoty); výstup výsledků; typy výstupů (pracovní sešity Statistiky 6 a jejich možnosti, výstupy ve Statistice 5.5); export grafů a tabulek (výstupní formáty grafů, výstupní formáty tabulek); spolupráce s programy MS Office (vkládání tabulek a grafů do dokumentů Office, jejich úpravy)
  • B) Deskriptivní analýza, modul "Basic statistics" programu Statistica Popisná statistika; popisné parametry proměnných (průměr, směrodatná odchylka, standardní chyba, medián, kvantity, rozsah hodnot, šikmost, špičatost); popisné grafy a tabulky (histogram, box and whisker plot, frekvenční tabulky); normalita dat (Kolgomorov-Smirnovův test normality, Shapiro-Wilk`s test) Grafy; základní typy grafů (scatter plot, histogram, box and whisker plot, sloupcové, koláčové a čárové grafy); matice grafů a speciální typy grafů (matrix plots, categorized plots, 3D grafy); korelace parametrická (Pearsonův korelační koeficient, partial correlation); korelace neparametrická (Spearman, Kendal Tau, Gamma)
  • C) Testování a analýza dat Parametrické testy; one sample t-test (předpoklady, využití); two sample t-test (two sample t-test s závislými a nezávislými proměnnými, předpoklady, využití); F-test (porovnání rozptylů); Neparametrické testy; srovnání dvou nezávislých vzorků (Man-Whitney U test, Kolgomorov-Smirnovův test); srovnání dvou závislých vzorků (Wilcoxonův test, znaménkový test); srovnání více nezávislých vzorků (Kruskal-Wallis ANOVA, mediánový test); one way ANOVA (předpoklady, využití)
  • D) Praktické cvičení ze základů stochastického modelování Základy regresních technik; analýza rozptylu a korelační analýza v regresní analýze; polynomiální regrese; nelineární regrese; modely dávka-odpověď; logistická regrese. Práce s maticemi a vektory v procvičovaném software, vzorcová pole. Hodnocení závislosti/nezávislosti binárních a kategoriálních znaků.
  • E) Praktické cvičení ze základů vícerozměrných statistických metod Práce s vícerozměrnými soubory; multidimensional scaling; normalizace, centralizace; hodnocení podobnosti a vzdálenosti objektů; shluková analýza; binární koeficienty podobnosti; korelační analýza a parciální korelace; faktorová analýza; korespondenční analýza; diskriminační analýza; vícerozměrná logistická regrese.
Literatura
  • Snedecor, G.W., Cochran, W.G.: Statistical methods, Iowa 1971, Iowa State University Press.
  • Zar, J.H.: Biostatistical analysis. New Jersey 1984, Prentice-Hall
  • Benedík, J., Dušek, L: Sbírka příkladů z biostatistiky. Nakladatelství Konvoj 1993, Brno.
  • HEBÁK, Petr a Jiří HUSTOPECKÝ. Vícerozměrné statistické metody s aplikacemi. Praha: SNTL - Nakladatelství technické literatury, 1987. info
Informace učitele
http://www.cba.muni.cz/vyuka/
Další komentáře
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je vyučován každoročně.
Výuka probíhá každý týden.
Poznámka k četnosti výuky: možno i blokově.
Předmět je zařazen také v obdobích jaro 2008 - akreditace, jaro 2004, jaro 2005, jaro 2006, jaro 2007, jaro 2008, jaro 2009, jaro 2010, jaro 2011.