ESF:BPE_AVED Analýza a vizualizace dat - Informace o předmětu
BPE_AVED Analýza a vizualizace ekonomických dat
Ekonomicko-správní fakultapodzim 2020
- Rozsah
- 1/1. 6 kr. Ukončení: zk.
- Vyučující
- Ing. Michal Kvasnička, Ph.D. (cvičící)
doc. Ing. Štěpán Mikula, Ph.D. (cvičící) - Garance
- Ing. Michal Kvasnička, Ph.D.
Katedra ekonomie – Ekonomicko-správní fakulta
Kontaktní osoba: Mgr. Jarmila Šveňhová
Dodavatelské pracoviště: Katedra ekonomie – Ekonomicko-správní fakulta - Rozvrh seminárních/paralelních skupin
- BPE_AVED/01: St 8:00–9:50 VT204, M. Kvasnička, Š. Mikula
- Předpoklady
- Není vyžadována žádná předchozí znalost programování, jazyka R, statistiky ani ekonometrie. Vyžadována je pouze základní schopnost pracovat s počítačem a ochota naučit se programovat.
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 50 stud.
Momentální stav registrace a zápisu: zapsáno: 3/50, pouze zareg.: 0/50, pouze zareg. s předností (mateřské obory): 0/50 - Mateřské obory/plány
- předmět má 19 mateřských oborů, zobrazit
- Cíle předmětu
- Cílem předmětu je poskytnout studentům praktické nástroje pro přípravu, analýzu a vizualizaci ekonomických dat.
Získané dovednosti mohou studenti využít nejen při zpracování svých bakalářských a diplomových prací, ale i v komerční praxi, zejména v analýze finančních trhů, mezinárodního obchodu, organizace trhů, migrace, dopravy, ekonomii hospodářské soutěže, mikroekonomických, makroekonomických a dalších úlohách. Předmět také položí potřebný základ pro další studium a použití pokročilých statistických metod, ekonometrie, data miningu a data science.
Důraz je v předmětu kladen na praktické ovládnutí nástrojů, které jsou nejčastěji používány při analýze ekonomických dat.
Příklady použití nástrojů najdete na adrese https://is.muni.cz/auth/el/1456/podzim2017/BPE_AVED/um/62799066/priklad_analyzy_a_vizualizace_dat.html
Výuka bude probíhat v systému R. R je světově nejpoužívanější statistický nástroj pro analýzu dat, který umožňuje aplikovat veškeré statistické, ekonometrické, data-miningové a jiné metody bez nutnosti používání dodatečného pomocného software (například Excelu, Gretlu, Statistica, SPSS a podobně). R se používá jak v akademické sféře, tak v komerční praxi. Používají ho například firmy Google, Facebook a Microsoft. R je zdarma ke stažení pro všechny operační systémy na https://cran.r-project.org/.
Většina potřebné literatury (včetně povinné) je dostupná legálně on-line. - Výstupy z učení
- Absolvováním předmětu studenti získají následující dovednosti:
- Budou umět načíst data v téměř libovolném formátu a struktuře z lokálních zdrojů i on-line databází, vyčistit je a převést do přehledné struktury, která umožní jejich snadnou analýzu.
- Budou schopni zpracovávat velké objemy dat – transformovat je, agregovat a spojovat různé datové soubory.
- Budou umět systematicky odhalovat chyby v datových souborech.
- Dokážou pokročilým způsobem vizualizovat individuální veličiny různých typů i vztahy mezi nimi.
- Budou schopni provést jak počáteční průzkumnou analýzu dat, tak jejich následnou statistickou a ekonometrickou analýzu.
- Budou umět své projekty zpracovávat tak, aby je bylo možné replikovat a automaticky aktualizovat, například v případě získání nových dat.
- Osnova
- 1. Úvod do systému R: instalace, spuštění a ukončení systému R, instalace a používání knihoven, nápověda, viněty, vývojové prostředí (RStudio), psaní a spouštění skriptů
- 2. Data a proměnné: přiřazení dat do proměnných; datové typy, převody mezi nimi, datové struktury; aritmetické operace; načítání a ukládání dat
- 3. Informace k datům: atributy, subsety, faktory, datumy, objekty a jejich třídy
- 4. Automatické zpracování dat 1: volání funkcí, základní matematické a statistické funkce a testy
- 5. Automatické zpracování dat 2: tvorba vlastních funkcí, funkcionály; sekvence, samplování a množinové operace
- 6. Automatické zpracování dat 3: Práce s řetězci - regulární výrazy, transformace řetězů a získávání dat z řetězců
- 7. Automatické zpracování dat 4: Dobře formátovaná data - struktura dobře formátovaných dat a převod dat na dobře formátovaná data
- 8. Automatické zpracování dat 5: Transformace dat, výběry z dat, agregace dat, spojování informací z různých datových souborů
- 9. Vizualizace dat 1: gramatika grafů a vizualizace jednorozměrných dat
- 10. Vizualizace dat 2: vizualizace vztahů v datech
- 11. Úvod do ekonometrie v R
- 12. Průzkumná analýza dat (EDA)
- 13. Reprodukovatelný výstup: návrh přehledné a udržovatelné struktury dat a kódu, tvorba automaticky generovaných dokumentů, které obsahují text i výstupy analýzy dat
- Literatura
- povinná literatura
- WICKHAM, Hadley a Garrett GROLEMUND. R for data science : import, tidy, transform, visualize, and model data. First edition. Sebastopol, CA: O'Reilly, 2016, xxv, 492. ISBN 9781491910399. info
- PENG, Roger D. R Programming for Data Science. Leanpub, 2015, 182 s. info
- WICKHAM, Hadley a Carson SIEVERT. Ggplot2 : elegant graphics for data analysis. Second edition. Switzerland: Springer, 2016, xvi, 260. ISBN 9783319242750. info
- doporučená literatura
- HADLEY, Wickham. Tidy Data. Advances in Business-Related Scientific Research Conference 2014 in Roma (ABSRC 2014 Roma). 2014, roč. 59, č. 10. info
- KABACOFF, Robert. R in action : data analysis and graphics with R. Shelter Island, NY: Manning, 2011, xxiv, 447. ISBN 9781935182399. info
- WICKHAM, Hadley. Advanced R. Boca Raton: CRC Press, 2015, xxii, 456. ISBN 9781466586963. info
- KLEIBER, Christian a Achim ZEILEIS. Applied Econometrics with R. [New York]: Springer, 2008, x, 221. ISBN 9780387773162. info
- VERZANI, John. Using R for introductory statistics. Boca Raton: Chapman & Hall/CRC, 2005, xvi, 414. ISBN 1584884509. info
- Výukové metody
- Výuka se skládá z domácí přípravy, ve které si studenti nastudují připravené materiály (nahrávky přednášek a lecture notes, které vysvětlují základní teorii a koncepty), a z prezenčních cvičení. Cvičení probíhají v počítačové laboratoři a jsou věnována praktickému použití získaných dovedností na skutečných nebo stylizovaných datových souborech.
- Metody hodnocení
- Předmět je hodnocen na základě účasti (10 %), prezenčních testů na začátku hodiny (10 %), průběžně odevzdávaných domácích úkolů (40 %) a závěrečné praktické zkoušky (40 %). Domácí úkoly i závěrečná praktická zkouška spočívají v přípravě, analýze a vizualizaci zadaných dat. K úspěšnému absolvování předmětu je třeba získat aspoň 50 % možných bodů ze závěrečné zkoušky i 50 % možných bodů celkem.
Úkoly se odevzdávají průběžně ve formě kódu.
Při zkoušce je možné používat veškeré materiály dostupné ve vývojovém prostředí, na internetu i vlastní poznámky. Zakázána je komunikace s živými lidmi, a to všemi prostředky.
Jakékoli opisování, zaznamenávání nebo vynášení testů, používání nedovolených pomůcek jakož i komunikačních prostředků nebo jiné narušování objektivity zkoušky (zápočtu) bude považováno za nesplnění podmínek k ukončení předmětu a za hrubé porušení studijních předpisů. Následkem toho uzavře vyučující zkoušku (zápočet) hodnocením v ISu známkou "F" a děkan zahájí disciplinární řízení, jehož výsledkem může být až ukončení studia. - Informace učitele
- https://is.muni.cz/auth/el/1456/podzim2016/BPE_AVED/
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně. - Nachází se v prerekvizitách jiných předmětů
- Statistika zápisu (podzim 2020, nejnovější)
- Permalink: https://is.muni.cz/predmet/econ/podzim2020/BPE_AVED