Bi8660 Analýza dat na PC II

Přírodovědecká fakulta
jaro 2005
Rozsah
0/2/0. 2 kr. (příf plus uk plus > 4). Ukončení: kz.
Vyučující
RNDr. Jiří Jarkovský, Ph.D. (cvičící)
prof. RNDr. Ladislav Dušek, Ph.D. (cvičící)
RNDr. Danka Haruštiaková, Ph.D. (cvičící)
RNDr. Jan Mužík, Ph.D. (cvičící)
Garance
RNDr. Jiří Jarkovský, Ph.D.
Ústav botaniky a zoologie – Biologická sekce – Přírodovědecká fakulta
Kontaktní osoba: RNDr. Jiří Jarkovský, Ph.D.
Rozvrh
St 14:00–15:50 Kontaktujte učitele
Předpoklady
Základy práce s MS Windows, základy práce s MS Office, přehled o základních statistických metodách. Navazuje na kurz Analýza dat na PC I (Bi 7541).
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Kurz navazuje volně na výuku základů biostatistiky (Bi5040) a na kurz Analýza dat na PC I (Bi 7541). Cílem je v efektivní a blokové formě usnadnit orientaci posluchače v ovládání a realizaci výpočtů v software STATISTICA for Windows (v5.5; v6.0). Kurz je zaměřen pouze prakticky, výuka probíhá výhradně na PC. Jsou řešeny praktické úlohy na reálných datech z oblasti experimentální biologie, ekologie, medicíny. Kurz je tématicky flexibilní, lze provést i orientaci na data posluchačů nebo připravit nová témata dle návrhu.
Osnova
  • A) Základy ovládání software Statistica for Windows a práce s daty Seznámení s programem; instalace programu Statistica (systémové požadavky, instalace); organizace nabídek a logika práce s programem; Statistica 5.5 a 6 - rozdíly ve struktuře a organizaci programu, přehled jednotlivých menu, nastavení programu, práce s nápovědou, internetové stánky; Práce s daty; import dat (načtení dat z MS Excel, textových a databázových souborů, struktura souborů); Operace s daty (typy proměnných, úpravy záznamů a proměnných, odvozené a vypočítané proměnné - transformace, transponování, chybějící hodnoty); výstup výsledků; typy výstupů (pracovní sešity Statistiky 6 a jejich možnosti, výstupy ve Statistice 5.5); export grafů a tabulek (výstupní formáty grafů, výstupní formáty tabulek); spolupráce s programy MS Office (vkládání tabulek a grafů do dokumentů Office, jejich úpravy)
  • B) Deskriptivní analýza, modul "Basic statistics" programu Statistica Popisná statistika; popisné parametry proměnných (průměr, směrodatná odchylka, standardní chyba, medián, kvantity, rozsah hodnot, šikmost, špičatost); popisné grafy a tabulky (histogram, box and whisker plot, frekvenční tabulky); normalita dat (Kolgomorov-Smirnovův test normality, Shapiro-Wilk`s test) Grafy; základní typy grafů (scatter plot, histogram, box and whisker plot, sloupcové, koláčové a čárové grafy); matice grafů a speciální typy grafů (matrix plots, categorized plots, 3D grafy); korelace parametrická (Pearsonův korelační koeficient, partial correlation); korelace neparametrická (Spearman, Kendal Tau, Gamma)
  • C) Testování a analýza dat Parametrické testy; one sample t-test (předpoklady, využití); two sample t-test (two sample t-test s závislými a nezávislými proměnnými, předpoklady, využití); F-test (porovnání rozptylů); Neparametrické testy; srovnání dvou nezávislých vzorků (Man-Whitney U test, Kolgomorov-Smirnovův test); srovnání dvou závislých vzorků (Wilcoxonův test, znaménkový test); srovnání více nezávislých vzorků (Kruskal-Wallis ANOVA, mediánový test); one way ANOVA (předpoklady, využití)
  • D) Praktické cvičení ze základů stochastického modelování Základy regresních technik; analýza rozptylu a korelační analýza v regresní analýze; polynomiální regrese; nelineární regrese; modely dávka-odpověď; logistická regrese. Práce s maticemi a vektory v procvičovaném software, vzorcová pole. Hodnocení závislosti/nezávislosti binárních a kategoriálních znaků.
  • E) Praktické cvičení ze základů vícerozměrných statistických metod Práce s vícerozměrnými soubory; multidimensional scaling; normalizace, centralizace; hodnocení podobnosti a vzdálenosti objektů; shluková analýza; binární koeficienty podobnosti; korelační analýza a parciální korelace; faktorová analýza; korespondenční analýza; diskriminační analýza; vícerozměrná logistická regrese.
Literatura
  • Snedecor, G.W., Cochran, W.G.: Statistical methods, Iowa 1971, Iowa State University Press.
  • Zar, J.H.: Biostatistical analysis. New Jersey 1984, Prentice-Hall
  • Benedík, J., Dušek, L: Sbírka příkladů z biostatistiky. Nakladatelství Konvoj 1993, Brno.
  • HEBÁK, Petr a Jiří HUSTOPECKÝ. Vícerozměrné statistické metody s aplikacemi. Praha: SNTL - Nakladatelství technické literatury, 1987. info
Informace učitele
http://www.cba.muni.cz/vyuka/
Další komentáře
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích jaro 2008 - akreditace, jaro 2003, jaro 2004, jaro 2006, jaro 2007, jaro 2008, jaro 2009, jaro 2010, jaro 2011.