ESF:MPE_AVED Analýza a vizualizace dat - Informace o předmětu
MPE_AVED Analýza a vizualizace ekonomických dat
Ekonomicko-správní fakultapodzim 2023
- Rozsah
- 1/1/0. 6 kr. Ukončení: zk.
- Vyučující
- Ing. Michal Kvasnička, Ph.D. (cvičící)
doc. Ing. Štěpán Mikula, Ph.D. (cvičící) - Garance
- Ing. Michal Kvasnička, Ph.D.
Katedra ekonomie – Ekonomicko-správní fakulta
Kontaktní osoba: Mgr. Jarmila Šveňhová
Dodavatelské pracoviště: Katedra ekonomie – Ekonomicko-správní fakulta - Rozvrh seminárních/paralelních skupin
- MPE_AVED/01: St 8:00–9:50 VT204, kromě St 20. 9., kromě St 8. 11., M. Kvasnička, Š. Mikula
- Předpoklady
- ! BPE_AVED Analýza a vizualizace dat
Není vyžadována žádná předchozí znalost programování ani jazyka R. Vyžadována je pouze základní schopnost pracovat s počítačem a ochota naučit se programovat. - Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 50 stud.
Momentální stav registrace a zápisu: zapsáno: 35/50, pouze zareg.: 0/50, pouze zareg. s předností (mateřské obory): 0/50 - Mateřské obory/plány
- Ekonomie (program ESF, B-EKON) (3)
- Ekonomie (program ESF, B-EKT)
- Ekonomie (program ESF, N-EKON) (3)
- Matematické a statistické metody v ekonomii (program ESF, N-MSME)
- Cíle předmětu
- Cílem předmětu je poskytnout studentům praktické nástroje pro přípravu, analýzu a vizualizaci ekonomických dat.
Získané dovednosti mohou studenti využít nejen při zpracování svých diplomových prací, ale i v komerční praxi, zejména v analýze finančních trhů, mezinárodního obchodu, organizace trhů, migrace, dopravy, ekonomii hospodářské soutěže, mikroekonomických, makroekonomických a dalších úlohách. Předmět také položí potřebný základ pro další studium a použití pokročilých statistických metod, ekonometrie, data miningu a data science.
Důraz je v předmětu kladen na praktické ovládnutí nástrojů, které jsou nejčastěji používány při analýze ekonomických dat.
Příklady použití nástrojů najdete na adrese https://aved.econ.muni.cz/appetizer.html.
Výuka bude probíhat v jazyce R. R je světově nejpoužívanější statistický nástroj pro analýzu dat, který umožňuje aplikovat veškeré statistické, ekonometrické, data-miningové a jiné metody bez nutnosti používání dodatečného pomocného software (například Excelu, Gretlu, Statistica, SPSS a podobně). R se používá jak v akademické sféře, tak v komerční praxi. Používají ho například firmy Google, Facebook a Microsoft. R je zdarma ke stažení pro všechny operační systémy na https://cran.r-project.org/.
Většina potřebné literatury (včetně povinné) je dostupná legálně on-line. - Výstupy z učení
- Absolvováním předmětu studenti získají následující dovednosti:
- Budou umět načíst data v téměř libovolném formátu a struktuře z lokálních zdrojů i on-line databází, vyčistit je a převést do přehledné struktury, která umožní jejich snadnou analýzu.
- Budou schopni zpracovávat velké objemy dat: transformovat je, agregovat a spojovat různé datové soubory.
- Budou umět systematicky odhalovat chyby v datových souborech.
- Dokážou pokročilým způsobem vizualizovat individuální veličiny různých typů i vztahy mezi nimi.
- Budou schopni provést jak počáteční průzkumnou analýzu dat, tak jejich následnou statistickou a ekonometrickou analýzu.
- Budou umět své projekty zpracovávat tak, aby je bylo možné replikovat a automaticky aktualizovat, například v případě získání nových dat.
- Osnova
- Úvod do systému R: instalace, spuštění a ukončení systému R, instalace a používání knihoven, nápověda, viněty, vývojové prostředí (RStudio), psaní a spouštění skriptů.
- Data a proměnné: přiřazení dat do proměnných; datové typy, převody mezi nimi, datové struktury; aritmetické operace; načítání a ukládání dat.
- Informace k datům: atributy, subsety, faktory, datumy, objekty a jejich třídy.
- Automatické zpracování dat 1: volání funkcí, základní matematické a statistické funkce a testy.
- Automatické zpracování dat 2:tvorba vlastních funkcí, funkcionály; sekvence, samplování a množinové operace.
- Automatické zpracování dat 3:Práce s řetězci - regulární výrazy, transformace řetězů a získávání dat z řetězců.
- Automatické zpracování dat 4: Dobře formátovaná data - struktura dobře formátovaných dat a převod dat na dobře formátovaná data.
- Automatické zpracování dat 5: Transformace dat, výběry z dat, agregace dat, spojování informací z různých datových souborů.
- Vizualizace dat 1: gramatika grafů a vizualizace jednorozměrných dat.
- Vizualizace dat 2: vizualizace vztahů v datech.
- Úvod do ekonometrie v R.
- Průzkumná analýza dat (EDA).
- Reprodukovatelný výstup: návrh přehledné a udržovatelné struktury dat a kódu, tvorba automaticky generovaných dokumentů, které obsahují text i výstupy analýzy dat (pokud bude v semestru 13 týdnů).
- Literatura
- povinná literatura
- Kvasnička--Mikula: Analýza a vizualizace dat v jazyce R, 2023, https://aved.econ.muni.cz/.
- doporučená literatura
- WICKHAM, Hadley a Garrett GROLEMUND. R for data science : import, tidy, transform, visualize, and model data. First edition. Sebastopol, CA: O'Reilly, 2016, xxv, 492. ISBN 9781491910399. info
- WICKHAM, Hadley a Carson SIEVERT. Ggplot2 : elegant graphics for data analysis. Second edition. Switzerland: Springer, 2016, xvi, 260. ISBN 9783319242750. info
- HADLEY, Wickham. Tidy Data. Advances in Business-Related Scientific Research Conference 2014 in Roma (ABSRC 2014 Roma). 2014, roč. 59, č. 10. info
- KABACOFF, Robert. R in action : data analysis and graphics with R. Shelter Island, NY: Manning, 2011, xxiv, 447. ISBN 9781935182399. info
- WICKHAM, Hadley. Advanced R. Boca Raton: CRC Press, 2015, xxii, 456. ISBN 9781466586963. info
- KLEIBER, Christian a Achim ZEILEIS. Applied Econometrics with R. [New York]: Springer, 2008, x, 221. ISBN 9780387773162. info
- VERZANI, John. Using R for introductory statistics. Boca Raton: Chapman & Hall/CRC, 2005, xvi, 414. ISBN 1584884509. info
- Výukové metody
- Výuka se skládá z domácí přípravy, ve které si studenti nastudují připravené materiály (nahrávky přednášek a lecture notes, které vysvětlují základní teorii a koncepty), a z prezenčních cvičení. Cvičení probíhají v počítačové laboratoři a jsou věnována praktickému použití získaných dovedností na skutečných nebo stylizovaných datových souborech.
- Metody hodnocení
- Předmět je hodnocen na základě účasti (10 %), prezenčních testů na začátku hodiny (10 %), průběžně odevzdávaných domácích úkolů (40 %) a závěrečné praktické zkoušky (40 %). Domácí úkoly i závěrečná praktická zkouška spočívají v přípravě, analýze a vizualizaci zadaných dat. K úspěšnému absolvování předmětu je třeba získat aspoň 50 % možných bodů ze závěrečné zkoušky i 50 % možných bodů celkem.
Úkoly se odevzdávají průběžně ve formě kódu.
Při zkoušce je možné používat veškeré materiály dostupné ve vývojovém prostředí, studijní materiály předmětu i vlastní poznámky. Zakázána je komunikace s živými lidmi a přístup na Internet.
Kurz je možné si zapsat i během studia v zahraničí (např. Erasmus). Student si v průběhu semestru vypracuje domácí úkoly a po návratu ze zahraničí napíše závěrečný test. Před odjezdem se prosím spojte s vyučujícími.
Jakékoli opisování, zaznamenávání nebo vynášení testů, používání nedovolených pomůcek jakož i komunikačních prostředků nebo jiné narušování objektivity zkoušky (zápočtu) bude považováno za nesplnění podmínek k ukončení předmětu a za hrubé porušení studijních předpisů. Následkem toho uzavře vyučující zkoušku (zápočet) hodnocením v ISu známkou "F" a děkan zahájí disciplinární řízení, jehož výsledkem může být až ukončení studia. - Informace učitele
- https://aved.econ.muni.cz/appetizer.html
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (podzim 2023, nejnovější)
- Permalink: https://is.muni.cz/predmet/econ/podzim2023/MPE_AVED