E0034 Analýza a klasifikace dat

Přírodovědecká fakulta
podzim 2022
Rozsah
2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
RNDr. Eva Koriťáková, Ph.D. (přednášející)
prof. Ing. Jiří Holčík, CSc. (přednášející)
RNDr. Roman Vyškovský, Ph.D. (přednášející)
Mgr. Tereza Jurková (cvičící)
Garance
prof. Ing. Jiří Holčík, CSc.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: RNDr. Eva Koriťáková, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta
Rozvrh
St 8:00–10:50 F01B1/709
Předpoklady
Je doporučeno předchozí absolvování předmětu Bi8600 Vícerozměrné metody nebo Bi8601 Pokročilé statistické metody.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Cílem předmětu je seznámit studenty s účelem, principy a jednotlivými metodami analýzy a klasifikace dat. V průběhu kurzu studenti získají nejen základní teoretické a metodologické znalosti principů rozpoznávání a klasifikace dat s důrazem na zpracování medicínských a biologických dat, ale osvojí si i aplikaci jednotlivých metod na reálná data a naučí se interpretovat dosažené výsledky.
Výstupy z učení
Po absolvování předmětu je student schopen:
- zvolit a aplikovat adekvátní metodu analýzy a klasifikace dat k dosažení požadovaných výsledků;
- redukovat a transformovat vícerozměrná data pomocí pokročilých metod ordinační analýzy;
- klasifikovat data pomocí různých metod diskriminační analýzy a jiných pokročilých metod;
- navrhnout různé modifikace popisovaných algoritmů vhodné pro zpracování dat specifických vlastností;
- interpretovat dosažené výsledky včetně vyhodnocení úspěšnosti klasifikace.
Osnova
  • 1. Úvod do analýzy a klasifikace dat.
  • 2. Klasifikace pomocí diskriminačních funkcí.
  • 3. Klasifikace podle minimální vzdálenosti – prohloubení znalostí o metrikách pro určení vzdálenosti a podobnosti.
  • 4. Klasifikace podle minimální vzdálenosti.
  • 5. Klasifikace pomocí hranic v obrazovém prostoru – Fisherova lineární diskriminační analýza (FLDA).
  • 6. Klasifikace pomocí hranic v obrazovém prostoru – Metoda podpůrných vektorů (SVM).
  • 7. Sekvenční klasifikace.
  • 8. Hodnocení klasifikátorů – křížová validace, srovnání úspěšnosti klasifikace s náhodnou klasifikací, srovnání úspěšnosti klasifikace dvou a více klasifikátorů.
  • 9. Extrakce proměnných – prohloubení znalostí o analýze hlavních komponent (PCA).
  • 10. Pokročilejší metody extrakce proměnných – metody varietního učení, metoda nezávislých komponent (ICA).
  • 11. Selekce proměnných.
  • 12. Praktické ukázky analýzy a klasifikace dat.
Literatura
  • Mitchel,T.M.: Machine Learning. McGraw Hill 1997
  • Dunham,M.H.: Data Mining: Introductory and Advanced Topics. Prentice Hall 2002
  • Holčík,J.: Analýza a klasifikace signálů. [Učební texty vysokých škol] Brno, Nakladatelství VUT v Brně 1992.
Výukové metody
Přednášky distanční formou a prezenční cvičení. Důraz je kladen na pochopení základních principů popisovaných metod a algoritmů.
Metody hodnocení
ústní zkouška
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Nachází se v prerekvizitách jiných předmětů
Předmět je zařazen také v obdobích podzim 2023, podzim 2024.