Data mining II
RNDr. Radim Navrátil, Ph.D.
Data mining II
Info
Období
podzim 2020

Výuka bude probíhat distančně přes MS Teams. Kód týmu je 4azgduc.

Předpokládaný harmonogram seminářů:

7.10. Klasická diskriminační analýza (Navrátil)
14.10. Moderní metody diskriminační analýzy (Navrátil)
21.10. Organizace datových tabulek (Pokora)
4.11. Pokročilé metody SQL (Pokora)
11.11. Text mining (Buček)
18.11. Text mining (Buček)
25.11. Data mining na cloudu Kapasný)
2.12. Data mining na cloudu (Kapasný)
9.12.   Grafická prezentace (Selingerová) 
16.12. Grafická prezentace (Selingerová)
6.1.  Prezentace studentských projektů
13.1. Seminář odpadá

Podmínky pro získání kolokvia:

- vypracování domácích úkolů během semestru
- prezentace studentského projektu na závěrečném semináři

Úkoly ze seminářů 03 a 04

V R vyřešte úkoly zadané na konci skriptů cv03-2.R a cv04-1.R.

Řešení ve formě R-skriptů pomocí příkazů knihovny dplyr nebo SQL příkazů v sqldf vložte do Odevzdávárny předmětu do 18. 11. 2020. Není nutné vyřešit správně všechny úkoly, ale alespoň se o řešení pokuste.

Odevzdávárna
Domácí úkoly, sběr souborů.

Poznámky k projektům:

Utvořte maximálně tříčlenný tým, vyberte si vhodný datový soubor a položte otázky, na které se budete snažit odpovědět.
- O této skutečnosti nás informujte e-mailem - uveďte, prosím, složení týmu, název projektu a jednu až dvě věty, co budete dělat.
- Proveďte vlastní analýzu (v libovolném softwaru).
- Připravte krátkou prezentaci (15 min.).
- Vlastní prezentaci vložte do Odevzdávárny nejpozději 5. ledna 20:00.
- Prezentace projektů budou probíhat 6. ledna od 12:00 formou videokonference přes MS Teams.
- V prezentaci publikum seznamte s vaším problémem, jak jste jej řešili a na co jste přišli.
- Rozhodně není nutné popisovat použité metody a jiné technické záležitosti, zaměřte se hlavně na výsledky a jejich interpretaci.
- Prezentace je týmová práce ("mluví každý" aspoň chvilku). Doporučujeme si vyzkoušet ovládání a vaši synchronizaci dopředu.

Předchozí
Následující