PV056 Strojové učení a dobývání znalostí

Fakulta informatiky
jaro 2018
Rozsah
2/0/1. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
doc. RNDr. Lubomír Popelínský, Ph.D. (přednášející)
Mgr. Veronika Krejčířová (pomocník)
RNDr. Karel Vaculík, Ph.D. (pomocník)
Garance
prof. RNDr. Mojmír Křetínský, CSc.
Katedra teorie programování – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Lubomír Popelínský, Ph.D.
Dodavatelské pracoviště: Katedra teorie programování – Fakulta informatiky
Rozvrh
St 8:00–9:50 C525
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Na konci tohoto kurzu bude student schopen pracovat s metodami strojového učení a dobývání znalostí z dat. Bude schopen vytvářet nástroje pro analýzu dat, které těchto metod využívají.
Výstupy z učení
Student bude schopen
- předzpracovat data pro data mining;
- znát pokročilé metody strojového učení a data mining a umět je používat;
- napsat technickou zprávu z této oblasti;
- navrhnout, implementovat a ověřit metodu strojového učení a data mining.
Osnova
  • Přehled základních metod strojového učení
  • Pokročilé metody strojového učení. Kombinace učících algoritmů. metalearning, preference learning. Učení v multirelačních datech. Dolování v grafech a sekvencích.
  • Teorie strojového učení Bias-varinace tradeoff. Modely učení
  • Big data analytics
  • Hledání častých vzorů a asociačních pravidel: algoritmus Apriori; alternativy; časté vzory v multirelačních datech.
  • Detekce odlehlých bodů
  • Předzpracování dat: výběr atributů; konstrukce nových atributů; metody vzorkování; aktivní učení.
  • Vizualizace dat, visual analytics
  • Dobývání znalostí z vybraných typů dat: dolování v textu, dolování v temporálních a časově prostorových datech, dobývání znalostí z webu. Dolování ve výukových datech. Dobývání znalostí, biologické vědy a bioinformatika
Literatura
    doporučená literatura
  • HAN, Jiawei a Micheline KAMBER. Data mining : concepts and techniques. 2nd ed. San Francisco, CA: Morgan Kaufmann, 2006, xxviii, 77. ISBN 1558609016. URL info
  • BERKA, Petr. Dobývání znalostí z databází. Vyd. 1. Praha: Academia, 2003, 366 s. ISBN 8020010629. info
  • Relational data mining. Edited by Sašo Džeroski - Nada Lavrač. Berlin: Springer, 2001, xix, 398. ISBN 3540422897. info
Výukové metody
Přednáška, projekt.
Metody hodnocení
Písemná a ústní zkouška. Nutnou podmínkou absolvování je obhajoba projektu.
Informace učitele
http://www.fi.muni.cz/usr/popelinsky/lectures/kdd/
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích jaro 2003, jaro 2004, jaro 2005, jaro 2006, jaro 2007, jaro 2008, jaro 2009, jaro 2010, jaro 2011, jaro 2012, jaro 2013, jaro 2014, jaro 2015, jaro 2016, jaro 2017, jaro 2019, jaro 2020, jaro 2021, jaro 2022, jaro 2023, jaro 2024, jaro 2025.