Bi0034 Analýza a klasifikace dat

Přírodovědecká fakulta
podzim 2019
Rozsah
2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
RNDr. Eva Koriťáková, Ph.D. (přednášející)
prof. Ing. Jiří Holčík, CSc. (přednášející)
RNDr. Roman Vyškovský, Ph.D. (přednášející)
Garance
prof. Ing. Jiří Holčík, CSc.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: RNDr. Eva Koriťáková, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta
Rozvrh
St 8:00–10:50 D29/347-RCX2
Předpoklady
Je doporučeno předchozí absolvování předmětu Bi8600 Vícerozměrné metody nebo Bi8601 Pokročilé statistické metody.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Cílem předmětu je seznámit studenty s účelem, principy a jednotlivými metodami analýzy a klasifikace dat. V průběhu kurzu studenti získají nejen základní teoretické a metodologické znalosti principů rozpoznávání a klasifikace dat s důrazem na zpracování medicínských a biologických dat, ale osvojí si i aplikaci jednotlivých metod na reálná data a naučí se interpretovat dosažené výsledky.
Výstupy z učení
Po absolvování předmětu je student schopen:
- zvolit a aplikovat adekvátní metodu analýzy a klasifikace dat k dosažení požadovaných výsledků;
- redukovat a transformovat vícerozměrná data pomocí pokročilých metod ordinační analýzy;
- klasifikovat data pomocí různých metod diskriminační analýzy a jiných pokročilých metod;
- navrhnout různé modifikace popisovaných algoritmů vhodné pro zpracování dat specifických vlastností;
- interpretovat dosažené výsledky včetně vyhodnocení úspěšnosti klasifikace.
Osnova
  • 1. Úvod do analýzy a klasifikace dat.
  • 2. Klasifikace pomocí diskriminačních funkcí.
  • 3. Klasifikace podle minimální vzdálenosti – prohloubení znalostí o metrikách pro určení vzdálenosti a podobnosti.
  • 4. Klasifikace podle minimální vzdálenosti.
  • 5. Klasifikace pomocí hranic v obrazovém prostoru – Fisherova lineární diskriminační analýza (FLDA).
  • 6. Klasifikace pomocí hranic v obrazovém prostoru – Metoda podpůrných vektorů (SVM).
  • 7. Sekvenční klasifikace.
  • 8. Hodnocení klasifikátorů – křížová validace, srovnání úspěšnosti klasifikace s náhodnou klasifikací, srovnání úspěšnosti klasifikace dvou a více klasifikátorů.
  • 9. Extrakce proměnných – prohloubení znalostí o analýze hlavních komponent (PCA).
  • 10. Pokročilejší metody extrakce proměnných – metody varietního učení, metoda nezávislých komponent (ICA).
  • 11. Selekce proměnných.
  • 12. Praktické ukázky analýzy a klasifikace dat.
Literatura
  • Mitchel,T.M.: Machine Learning. McGraw Hill 1997
  • Dunham,M.H.: Data Mining: Introductory and Advanced Topics. Prentice Hall 2002
  • Holčík,J.: Analýza a klasifikace signálů. [Učební texty vysokých škol] Brno, Nakladatelství VUT v Brně 1992.
Výukové metody
Přednášky podporované Power Pointovými prezentacemi. Důraz je kladen na pochopení základních principů popisovaných metod a algoritmů. Během přednášek jsou studenti průběžně interaktivně oslovováni s cílem kontrolovat míru jejich pochopení přednášené látky.
Metody hodnocení
ústní zkouška
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2007 - akreditace, podzim 2010 - akreditace, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2011 - akreditace, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2020, podzim 2021.