Data mining I - informace ke zkoušce
RNDr. Radim Navrátil, Ph.D.
Data mining I - informace ke zkoušce
Info
Období
jaro 2020

Zkouška

Zkouška bude mít dvě části -- obhajobu projektu a teoretické otázky. Po úspěšném obhájení projektu (0 - 4b) si vylosujete jednu teoretickou (0 - 2b) a jednu matematickou metodologickou otázku (0 - 4b). Seznam matematických otázek zveřejním před zkouškou.
Na základě získaných bodů ze všech částí získáte následující hodnocení:
10     A
 9      B
 8      C
 7      D
 6      E
0-5    F

Budete mít možnost vykonat zkoušku prezenční nebo distanční formou. Jakmile si jeden typ zvolíte jako řádný termín, případné opravné termíny musíte skládat téhož typu (toto se nevztahuje na mimořádné situace - karanténa, zavřené
hranice apod.).

Prezenční forma - bude probíhat standardním způsobem: nejprve obhájení projektu = představení projektu + diskuze nad projektem (donesete si projekt vytištěný), poté si vylosujete dvě otázky a budete mít čas na přípravu. Následně se o těchto
otázkách společně pobavíme.

Distanční forma - bude probíhat videohovorem přes MS Team. Nejprve obhájení projektu = představení projektu + diskuze nad projektem (budete listovat v pdf na vašem počítači), poté si vylosujete dvě otázky a rovnou bez přípravy budete
odpovídat. V tomto případě bude zkouška více zaměřena na porozumění metodám, rychlé reakce na položené dotazy apod.
V případě přerušení spojení bude zkouška anulována.
Požadavky na studenta:
- Počítač, tablet nebo mobilní telefon s rychlým připojením na internet, kamerou a mikrofonem
- Nainstalovaná aplikace MS Teams (webová aplikace je možná, ale v některých ohledech nedostačující)
- Přihlášení do MS Teams pod univerzitní identitou
- Měl by si nanečisto vyzkoušet (třeba s kolegou), zda mu vše funguje


Podmínky cvičení

- maximálně 3 absence
- úspěšné napsání písemky u počítače (alespoň na 50 procent bodů)

Pokyny k vypracování projektu z M8DM1

Vypracování projektu je SAMOSTATNÁ práce. Pokud bude zjištěn opak, dotyční budou hodnoceni známkou F a podle Studijního a zkušebního řádu s nimi bude zahájeno disciplinární řízení.

Výběr a zadání tématu

Každý student si ze seznamu témat vybere jedno, které si zapíše v Rozpisu témat v ISu. Seznam témat:

Přihlašování bude možné od 16.4.2020 10:00 do 17.5.2020. Kdo si žádné téma ve stanoveném termínu nezapíše, nebude připuštěn ke zkoušce a bude hodnocen X.

Jakmile si jedno téma zapíšete, změna tématu nebude možná! Jedinou výjimkou je přechod k vlastnímu tématu.
Ke každému tématu se může přihlásit maximálně jeden student. Pozor, k jednomu datovému souboru se může vázat více úkolů. Plňte jen ten, který si zapíšete!

Datové soubory naleznete ve Studijních materiálech.


Zadání vlastního tématu

Pokud si z nabízených témat žádné nevyberete, nebo prostě jen chcete zpracovávat data vlastní, můžete.
Tuto skutečnost však se mnou nejprve prodiskutujte a na základě společného návrhu vám téma dodatečně do Rozpisu témat dopíšu. 


Zpracování

Při analýze se řiďte zadáním, nebudete-li něčemu rozumět, neváhejte se na mě obrátit se svými dotazy. Bohužel u některých datových souborů nejsou metadata příliš informativní. V tomto případě si budete muset některé věci do/vymyslet. Zpracování dat proveďte pomocí SASu (hlavní část řešení; můžete si ale pomoci i jiným softwarem, pokud jsme se k některým věcem v SASu nedostali :-)) a o vašem řešení sepište krátkou zprávu.

V úvodu popište zkoumaný problém, co vlastně chcete analyzovat, jaké jsou vaše cíle.
Dále se zaměřte na popis vašich dat -- jaká data jste měli k dispozici, jaké proměnné, kvalita dat, opravování chyb, manipulace s chybějícími pozorováními,...
Poté přidejte relevantní výsledky exploratorní analýzy (popisné statistiky, obrázky, grafy).
Vypisujte jen ty výsledky, které jsou podstatné pro řešení vašeho úkolu!
 A konečně, popište metody vlastní analýzy a příslušné výsledky, ty nezapomeňte slovně okomentovat.
Nakonec přidejte závěrečné shrnutí, kde se budete snažit odpovědět na otázky ze zadání projektu, případně vypíchnout přednosti/ nedostatky vašeho řešení, jak by se dalo zlepšit, atd.

Výslednou zprávu uložte ve formátu pdf (nemusí být nutně vypracovaná v LaTeXu, s Wordem nemám problém).
Rozsah: maximálně 15 stran.

 

Odevzdání

Vypracované řešení vložte nejpozději 48 hodin před zkouškou do Odevzdárny v ISu. Na soubory odevzdané po termínu bude pohlíženo jako na neodevzdané.


Obhájení projektu (hodnocení)

U zkoušky mě seznámíte s vaším projektem, proto doporučuji, abyste si ho donesli s sebou ke zkoušce v tištěné podobě. Krátce shrnete co jste dělali, jak jste to dělali a co vám vyšlo. Podle toho, co mě bude zajímat, položím doplňující otázky k datům, zpracování, či řešení. Úspěšné obhájení projektu je nutnou podmínkou ke složení zkoušky. Za projekt můžete navíc získat až 4 body podle jeho kvality. Hodnocena bude správnost a korektnost používaných metod a výsledků, jejich interpretace, ale i prezentace a úroveň vašeho reportu.


Seznam otázek ke zkoušce (u zkoušky se samozřejmě můžu doptat i na cokoliv dalšího, co bylo na přednášce) :

Předchozí
Následující