Cíl předmětu a postup k cíli

Cíl:

  • abyste na konci dokázali sami analyzovat a vizualizovat data


Postup:

  • něco málo teorie
  • nástroj: jazyk R


Předpoklad, že se v jiných kurzech naučíte:

  • statistiku
  • ekonometrii

Výběr obsahu

Co ano:

  • to, co sami používáme nejčastěji
  • to, co potřebujete, abyste se mohli učit dál
  • jak jazyk R myslí + filosofie datové analýzy
  • tidyverse


Co ne:

  • jednotlivé funkce ze statistiky, ekonometrie atd.
  • (tj. ne věci, které snadno vygooglujete)

Struktura kurzu

  1. crash course in R (5 týdnů)
    • co bude potřeba v tomto kurzu
    • co potřebujete k dalšímu studiu R
  2. analýza a vizualizace dat (6 týdnů)
    • práce s řetězci (regulární výrazy a spol.)
    • tidy data (a na ně převést to, co máte)
    • transformace dat
    • vizualizace dat
    • exploratory data analysis
  3. ekonometrie v R (1 týden)
  4. reproducible research (1 týden)

Způsob výuky

  • domácí studium
    • nahrávky přednášek
    • dané kapitoly v knize (obsahují více než přednášky)
  • cvičení
    • praktické použití získaných dovedností na datech v počítačovém labu
  • předpokládáme, že se to chcete naučit, takže
    • budete sledovat přednášky
    • budete číst knihu a dokumentaci
    • budete hledat na webu
    • budete si s R hrát

Struktura cvičení

Dnes mimořádně

  • administrativa
  • skoro přednáška s drobnou aplikací na konci.


Ostatní semináře:

  • mini test (testuje znalost z příslušné “přednášky”: videa / knihy)
  • řešení domácí úlohy
  • vysvětlování nejasností z nové teorie
  • procvičení nové teorie na (snad užitečných) příkladech

Pedagogika kurzu

Občas budeme ukazovat / po vás chtít použít kus kódu, kterému nebudete rozumět: bude používat něco,

  • co jsme ještě nevysvětlili
  • co možná nevysvětlíme nikdy


Nelekejte se: to je pedagogický záměr:

  • takhle vypadá realita
  • naučíte se problémy řešit (googlovat)
  • až uvidíte koncept později, lépe jej pochopíte

Studijní materiály

Studijní materiály v ISu:

  • nahrávky přednášek
  • kniha
  • odkazy na užitečné zdroje


Dále v ISu:

  • data ke cvičením
  • kódy a data k domácím úkolům

Hodnocení předmětu

Hodnocení předmětu se skládá ze čtyř částí:

  • docházka (10 normovaných bodů)
  • testy na cvičení (10 normovaných bodů)
  • domácí úkoly (40 normovaných bodů)
  • zkouška (40 normovaných bodů)


Ke složení zkoušky je třeba získat zároveň:

  • aspoň 30 bodů z průběžné práce (dohromady)
  • aspoň 20 bodů ze zkoušky

Hodnocení předmětu: známka

V případě složení zkoušky se známka určí podle tabulky:

známka A B C D E
normované body 80–100 70–79 60–69 55–59 50–54

Účast ve výuce

Účast ve výuce je

  • dobrovolná
  • součástí hodnocení předmětu


Normované body za účast ve výuce:

body_ucast <- round(10 * pocet_ucasti / pocet_probehlych_setkani)


Normované body za průběžné testy se spočítají takto:

norm_body_testy <- round(10 * pocet_bodu_z_testu / max_pocet_bodu_z_testu)

Domácí úkoly

Řešením domácího úkolu je R skript.

Vaše řešení musí fungovat pro každá data, která splňují zadání úkolu.

Můžete spolupracovat, ale každý odevzdá vlastní řešení, na kterém se podílel.

Vložíte do příslušné odevzdávárny nejpozději den před následujícím cvičením do 18.00.

Opravuje se strojově. Hodnocení se objeví v poznámkovém bloku

Body za domácí úkoly se přepočtou na normované body takto:

body_ukoly <- round(40 * body_ukoly / max_pocet_bodu_ukoly)


Přečtěte si pokyny, jak řešit domácí úkoly – najdete je v separátním dokumentu.

Zkouška

Praktická zkouška u počítače.

Povolené jsou veškeré materiály s výjimkou jakékoli komunikace s živými lidmi.

Výjimky

  • Krátkodobá nemoc, reprezentace MU nebo ČR, účast na výcviku či bojové operaci Armády České republiky: možnost prodloužení termínu odevzdání domácího úkolu.

  • Dlouhodobá nemoc a mateřství: budeme postupovat ad hoc.

Veškeré případy musejí být doloženy relevantní omluvenkou v ISu.

Dotazy a konzultace

Oficiální konzultační hodiny nejsou vypsané.

Konzultaci si domluvte individuálně

  • na semináři
  • mailem

Netelefonujte!


Konzultujte!

Nepropadejte panice!

Obsahu je hodně. Pokud jste nikdy neprogramovali, může to být těžké.

Pokud se však budete učit a konzultovat, zvládnete to!


Výnosy ze znalosti datové analýzy jsou na trhu práce vysoké a rostou!



Nepropadejte panice!