M9DM2 Data mining II

Přírodovědecká fakulta
podzim 2018
Rozsah
2/2/0. 4 kr. (příf plus uk plus > 4). Ukončení: zk.
Vyučující
RNDr. Radim Navrátil, Ph.D. (přednášející)
Mgr. Ondřej Pokora, Ph.D. (přednášející)
Garance
doc. RNDr. Martin Kolář, Ph.D.
Ústav matematiky a statistiky – Ústavy – Přírodovědecká fakulta
Dodavatelské pracoviště: Ústav matematiky a statistiky – Ústavy – Přírodovědecká fakulta
Rozvrh
Po 17. 9. až Pá 14. 12. St 14:00–15:50 MP1,01014, St 14:00–15:50 M1,01017
  • Rozvrh seminárních/paralelních skupin:
M9DM2/01: Po 17. 9. až Pá 14. 12. St 16:00–17:50 MP1,01014, R. Navrátil, O. Pokora
Předpoklady
M8DM1 Data mining I
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 30 stud.
Momentální stav registrace a zápisu: zapsáno: 0/30, pouze zareg.: 0/30, pouze zareg. s předností (mateřské obory): 0/30
Mateřské obory/plány
Cíle předmětu
Předmět navazuje na kurz Data mining I a jeho cílem je prohloubení již získaných znalostí v této oblasti. Na konci tohoto kurzu bude student schopen: (1) popsat základní metody data miningu (exploratorní analýza, logistická regrese); (2) popsat pokročilé metody (shluková analýza, diskriminační analýza, neuronové sítě); (3) aplikovat tyto metody na konkrétní data; (4) interpretovat výstupy těchto metod.
Osnova
  • Příprava dat – pokročilé techniky.
  • SQL a práce s databázemi.
  • Credit scoring - základní pojmy.
  • Metodologie vývoje skóringových funkcí.
  • Neuronové sítě.
  • Diskriminační analýza.
  • Moderní metody data miningu.
Literatura
  • HAN, Jiawei, Micheline KAMBER a Jian PEI. Data mining : concepts and techniques. 3rd ed. Boston: Elsevier, 2012, xxxv, 703. ISBN 9780123814791. info
  • Data mining and statistics for decision making. Edited by Stâephane Tuffery. Hoboken, NJ.: Wiley, 2011, xxiv, 689. ISBN 9780470979167. info
  • MCCUE, Colleen. Data mining and predictive analysis : intelligence gathering and crime analysis. Boston: Butterworth-Heinemann, 2007, xxxi, 332. ISBN 9780750677967. info
  • THOMAS, L. C., David B. EDELMAN a Jonathan N. CROOK. Credit scoring and its applications. Philadelphia, Pa.: Society for Industrial and Applied Mathematics, 2002, xiv, 248. ISBN 0898714834. URL info
Výukové metody
Přednášky: 2 hod. týdně.
Cvičení u počítačů: 2 hod. týdně.
Metody hodnocení
Ústní zkouška - k úspěšnému zvládnutí je třeba získat alespoň 50 procent možných bodů a správně vypracovat semestrální projekt.
Další komentáře
Studijní materiály
Předmět je vyučován jednou za dva roky.
Předmět je zařazen také v obdobích podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2016, podzim 2019, podzim 2020, podzim 2021, podzim 2022, podzim 2023, podzim 2024.