PV056 Machine Learning and Data Mining

Fakulta informatiky
jaro 2025
Rozsah
2/0/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučováno kontaktně
Vyučující
doc. RNDr. Jan Sedmidubský, Ph.D. (přednášející)
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
RNDr. Ondřej Sotolář (pomocník)
Garance
doc. RNDr. Lubomír Popelínský, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Jan Sedmidubský, Ph.D.
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Předpoklady
Předpokládá se znalost základů strojového učení v rozsahu předmětu IB031 Úvod do strojového učení.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 37 mateřských oborů, zobrazit
Cíle předmětu
Na konci tohoto kurzu bude student schopen pracovat s metodami strojového učení a dobývání znalostí z dat. Bude schopen vytvářet nástroje pro analýzu dat, které těchto metod využívají.
Výstupy z učení
Student bude schopen
- předzpracovat data pro data mining;
- znát pokročilé metody strojového učení a data mining a umět je používat;
- navrhnout, implementovat a ověřit metodu strojového učení a data mining;
- napsat technickou zprávu z této oblasti.
Osnova
  • Přehled základních metod strojového učení
  • Pokročilé metody strojového učení. Kombinace učících algoritmů. AutoML, preference learning. Učení v multirelačních datech.
  • Teorie strojového učení. Bias-variance tradeoff. Modely učení.
  • Hledání častých vzorů a asociačních pravidel: algoritmus Apriori; časté vzory v multirelačních datech.
  • Detekce odlehlých bodů
  • Předzpracování dat: výběr atributů; konstrukce nových atributů; metody vzorkování.
  • Aktivní učení. Semi-supervised learning.
  • Analýza časových řad.
Literatura
    doporučená literatura
  • HAN, Jiawei a Micheline KAMBER. Data mining : concepts and techniques. 2nd ed. San Francisco, CA: Morgan Kaufmann, 2006, xxviii, 77. ISBN 1558609016. URL info
    neurčeno
  • FLACH, Peter A. Machine learning : the art and science of algorithms that make sense of data. New York: Cambridge University Press, 2012, xvii, 396. ISBN 1107422221. info
  • BERKA, Petr. Dobývání znalostí z databází. Vyd. 1. Praha: Academia, 2003, 366 s. ISBN 8020010629. info
  • Relational data mining. Edited by Sašo Džeroski - Nada Lavrač. Berlin: Springer, 2001, xix, 398. ISBN 3540422897. info
Výukové metody
Přednáška, projekt.
Metody hodnocení
Písemná a ústní zkouška. Nutnou podmínkou absolvování je obhajoba projektu.
Vyučovací jazyk
Angličtina
Informace učitele
http://www.fi.muni.cz/usr/popelinsky/lectures/kdd/
Další komentáře
Předmět je vyučován každoročně.
Výuka probíhá každý týden.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích jaro 2003, jaro 2004, jaro 2005, jaro 2006, jaro 2007, jaro 2008, jaro 2009, jaro 2010, jaro 2011, jaro 2012, jaro 2013, jaro 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2018, jaro 2019, jaro 2020, jaro 2021, jaro 2022, jaro 2023, jaro 2024.