MPE_AVED Analýza a vizualizace ekonomických dat

Ekonomicko-správní fakulta
podzim 2023
Rozsah
1/1/0. 6 kr. Ukončení: zk.
Vyučující
Ing. Michal Kvasnička, Ph.D. (cvičící)
doc. Ing. Štěpán Mikula, Ph.D. (cvičící)
Garance
Ing. Michal Kvasnička, Ph.D.
Katedra ekonomie – Ekonomicko-správní fakulta
Kontaktní osoba: Mgr. Jarmila Šveňhová
Dodavatelské pracoviště: Katedra ekonomie – Ekonomicko-správní fakulta
Rozvrh seminárních/paralelních skupin
MPE_AVED/01: St 8:00–9:50 VT204, kromě St 20. 9., kromě St 8. 11., M. Kvasnička, Š. Mikula
Předpoklady
! BPE_AVED Analýza a vizualizace dat
Není vyžadována žádná předchozí znalost programování ani jazyka R. Vyžadována je pouze základní schopnost pracovat s počítačem a ochota naučit se programovat.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 50 stud.
Momentální stav registrace a zápisu: zapsáno: 35/50, pouze zareg.: 0/50, pouze zareg. s předností (mateřské obory): 0/50
Mateřské obory/plány
předmět má 8 mateřských oborů, zobrazit
Cíle předmětu
Cílem předmětu je poskytnout studentům praktické nástroje pro přípravu, analýzu a vizualizaci ekonomických dat.


Získané dovednosti mohou studenti využít nejen při zpracování svých diplomových prací, ale i v komerční praxi, zejména v analýze finančních trhů, mezinárodního obchodu, organizace trhů, migrace, dopravy, ekonomii hospodářské soutěže, mikroekonomických, makroekonomických a dalších úlohách. Předmět také položí potřebný základ pro další studium a použití pokročilých statistických metod, ekonometrie, data miningu a data science.


Důraz je v předmětu kladen na praktické ovládnutí nástrojů, které jsou nejčastěji používány při analýze ekonomických dat.


Příklady použití nástrojů najdete na adrese https://aved.econ.muni.cz/appetizer.html.



Výuka bude probíhat v jazyce R. R je světově nejpoužívanější statistický nástroj pro analýzu dat, který umožňuje aplikovat veškeré statistické, ekonometrické, data-miningové a jiné metody bez nutnosti používání dodatečného pomocného software (například Excelu, Gretlu, Statistica, SPSS a podobně). R se používá jak v akademické sféře, tak v komerční praxi. Používají ho například firmy Google, Facebook a Microsoft. R je zdarma ke stažení pro všechny operační systémy na https://cran.r-project.org/.



Většina potřebné literatury (včetně povinné) je dostupná legálně on-line.

Výstupy z učení
Absolvováním předmětu studenti získají následující dovednosti:

  • Budou umět načíst data v téměř libovolném formátu a struktuře z lokálních zdrojů i on-line databází, vyčistit je a převést do přehledné struktury, která umožní jejich snadnou analýzu.
  • Budou schopni zpracovávat velké objemy dat: transformovat je, agregovat a spojovat různé datové soubory.
  • Budou umět systematicky odhalovat chyby v datových souborech.
  • Dokážou pokročilým způsobem vizualizovat individuální veličiny různých typů i vztahy mezi nimi.
  • Budou schopni provést jak počáteční průzkumnou analýzu dat, tak jejich následnou statistickou a ekonometrickou analýzu.
  • Budou umět své projekty zpracovávat tak, aby je bylo možné replikovat a automaticky aktualizovat, například v případě získání nových dat.
  • Osnova
    • Úvod do systému R: instalace, spuštění a ukončení systému R, instalace a používání knihoven, nápověda, viněty, vývojové prostředí (RStudio), psaní a spouštění skriptů.
    • Data a proměnné: přiřazení dat do proměnných; datové typy, převody mezi nimi, datové struktury; aritmetické operace; načítání a ukládání dat.
    • Informace k datům: atributy, subsety, faktory, datumy, objekty a jejich třídy.
    • Automatické zpracování dat 1: volání funkcí, základní matematické a statistické funkce a testy.
    • Automatické zpracování dat 2:tvorba vlastních funkcí, funkcionály; sekvence, samplování a množinové operace.
    • Automatické zpracování dat 3:Práce s řetězci - regulární výrazy, transformace řetězů a získávání dat z řetězců.
    • Automatické zpracování dat 4: Dobře formátovaná data - struktura dobře formátovaných dat a převod dat na dobře formátovaná data.
    • Automatické zpracování dat 5: Transformace dat, výběry z dat, agregace dat, spojování informací z různých datových souborů.
    • Vizualizace dat 1: gramatika grafů a vizualizace jednorozměrných dat.
    • Vizualizace dat 2: vizualizace vztahů v datech.
    • Úvod do ekonometrie v R.
    • Průzkumná analýza dat (EDA).
    • Reprodukovatelný výstup: návrh přehledné a udržovatelné struktury dat a kódu, tvorba automaticky generovaných dokumentů, které obsahují text i výstupy analýzy dat (pokud bude v semestru 13 týdnů).
    Literatura
      povinná literatura
    • Kvasnička--Mikula: Analýza a vizualizace dat v jazyce R, 2023, https://aved.econ.muni.cz/.
      doporučená literatura
    • WICKHAM, Hadley a Garrett GROLEMUND. R for data science : import, tidy, transform, visualize, and model data. First edition. Sebastopol, CA: O'Reilly, 2016, xxv, 492. ISBN 9781491910399. info
    • WICKHAM, Hadley a Carson SIEVERT. Ggplot2 : elegant graphics for data analysis. Second edition. Switzerland: Springer, 2016, xvi, 260. ISBN 9783319242750. info
    • HADLEY, Wickham. Tidy Data. Advances in Business-Related Scientific Research Conference 2014 in Roma (ABSRC 2014 Roma). 2014, roč. 59, č. 10. info
    • KABACOFF, Robert. R in action : data analysis and graphics with R. Shelter Island, NY: Manning, 2011, xxiv, 447. ISBN 9781935182399. info
    • WICKHAM, Hadley. Advanced R. Boca Raton: CRC Press, 2015, xxii, 456. ISBN 9781466586963. info
    • KLEIBER, Christian a Achim ZEILEIS. Applied Econometrics with R. [New York]: Springer, 2008, x, 221. ISBN 9780387773162. info
    • VERZANI, John. Using R for introductory statistics. Boca Raton: Chapman & Hall/CRC, 2005, xvi, 414. ISBN 1584884509. info
    Výukové metody
    Výuka se skládá z domácí přípravy, ve které si studenti nastudují připravené materiály (nahrávky přednášek a lecture notes, které vysvětlují základní teorii a koncepty), a z prezenčních cvičení. Cvičení probíhají v počítačové laboratoři a jsou věnována praktickému použití získaných dovedností na skutečných nebo stylizovaných datových souborech.
    Metody hodnocení
    Předmět je hodnocen na základě účasti (10 %), prezenčních testů na začátku hodiny (10 %), průběžně odevzdávaných domácích úkolů (40 %) a závěrečné praktické zkoušky (40 %). Domácí úkoly i závěrečná praktická zkouška spočívají v přípravě, analýze a vizualizaci zadaných dat. K úspěšnému absolvování předmětu je třeba získat aspoň 50 % možných bodů ze závěrečné zkoušky i 50 % možných bodů celkem.


    Úkoly se odevzdávají průběžně ve formě kódu.


    Při zkoušce je možné používat veškeré materiály dostupné ve vývojovém prostředí, studijní materiály předmětu i vlastní poznámky. Zakázána je komunikace s živými lidmi a přístup na Internet.



    Kurz je možné si zapsat i během studia v zahraničí (např. Erasmus). Student si v průběhu semestru vypracuje domácí úkoly a po návratu ze zahraničí napíše závěrečný test. Před odjezdem se prosím spojte s vyučujícími.



    Jakékoli opisování, zaznamenávání nebo vynášení testů, používání nedovolených pomůcek jakož i komunikačních prostředků nebo jiné narušování objektivity zkoušky (zápočtu) bude považováno za nesplnění podmínek k ukončení předmětu a za hrubé porušení studijních předpisů. Následkem toho uzavře vyučující zkoušku (zápočet) hodnocením v ISu známkou "F" a děkan zahájí disciplinární řízení, jehož výsledkem může být až ukončení studia.

    Informace učitele
    https://aved.econ.muni.cz/appetizer.html
    Další komentáře
    Studijní materiály
    Předmět je vyučován každoročně.
    Předmět je zařazen také v obdobích podzim 2024.