M9DM2 Data mining II

Přírodovědecká fakulta
podzim 2022
Rozsah
0/2/0. 2 kr. (příf plus uk k 1 zk 2 plus 1 > 4). Ukončení: k.
Vyučující
RNDr. Radim Navrátil, Ph.D. (přednášející)
Mgr. Ondřej Pokora, Ph.D. (přednášející)
RNDr. Bc. Iveta Selingerová, Ph.D. (cvičící)
Garance
doc. RNDr. Martin Kolář, Ph.D.
Ústav matematiky a statistiky – Ústavy – Přírodovědecká fakulta
Dodavatelské pracoviště: Ústav matematiky a statistiky – Ústavy – Přírodovědecká fakulta
Rozvrh seminárních/paralelních skupin
M9DM2/01: Čt 16:00–17:50 MP1,01014, R. Navrátil, O. Pokora, I. Selingerová
Předpoklady
M8DM1 Data mining I
Absolvování předmětu M8DM1 Data mining I
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 6/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30
Mateřské obory/plány
Cíle předmětu
Předmět navazuje na kurz Data mining I a jeho cílem je prohloubení již získaných znalostí v této oblasti. Důraz je kladen zejména na praktické použití přednesených metod, interpretaci výsledků a jejich aplikaci.
Výstupy z učení
Na konci tohoto kurzu bude student schopen:
(1) popsat základní metody data miningu (exploratorní analýza, logistická regrese);
(2) popsat pokročilé metody (shluková analýza, diskriminační analýza, text mining);
(3) aplikovat tyto metody na konkrétní data;
(4) interpretovat výstupy těchto metod.
Osnova
  • Diskriminační analýza.
  • Úvod do Pythonu.
  • Zpracování a vizualizace geografických dat.
  • Analýza dat klinických studií.
  • Text mining.
  • Moderní vizualizační metody.
Literatura
  • HAN, Jiawei, Micheline KAMBER a Jian PEI. Data mining : concepts and techniques. 3rd ed. Boston: Elsevier, 2012, xxxv, 703. ISBN 9780123814791. info
  • Data mining and statistics for decision making. Edited by Stâephane Tuffery. Hoboken, NJ.: Wiley, 2011, xxiv, 689. ISBN 9780470979167. info
  • MCCUE, Colleen. Data mining and predictive analysis : intelligence gathering and crime analysis. Boston: Butterworth-Heinemann, 2007, xxxi, 332. ISBN 9780750677967. info
  • THOMAS, L. C., David B. EDELMAN a Jonathan N. CROOK. Credit scoring and its applications. Philadelphia, Pa.: Society for Industrial and Applied Mathematics, 2002, xiv, 248. ISBN 0898714834. URL info
Výukové metody
Semináře u počítačů: 2 hod. týdně.
Metody hodnocení
Kolokvium - k úspěšnému absolvování je třeba uspokojivě vypracovat domácí úkoly a na konci semestru prezentovat vlastní semestrální projekt.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2016, podzim 2018, podzim 2019, podzim 2020, podzim 2021, podzim 2023, podzim 2024.