Bi0034 Analýza a klasifikace dat

Přírodovědecká fakulta
podzim 2016
Rozsah
2/1/0. 3 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: z.
Vyučující
RNDr. Eva Koriťáková, Ph.D. (přednášející)
prof. Ing. Jiří Holčík, CSc. (přednášející)
Garance
prof. RNDr. Ladislav Dušek, Ph.D.
RECETOX – Přírodovědecká fakulta
Kontaktní osoba: RNDr. Eva Koriťáková, Ph.D.
Dodavatelské pracoviště: RECETOX – Přírodovědecká fakulta
Rozvrh
Po 19. 9. až Ne 18. 12. St 8:00–10:50 D29/347-RCX2
Předpoklady
Je doporučeno předchozí absolvování předmětu Bi8600 Vícerozměrné metody.
Omezení zápisu do předmětu
Předmět je otevřen studentům libovolného oboru.
Cíle předmětu
Po absolvování předmětu student: - má základní teoretické a metodologické znalosti principů rozpoznávání a klasifikace dat s důrazem na zpracování medicínských a biologických dat; - je schopen zvolit a aplikovat adekvátní metodu analýzy a klasifikace dat k dosažení požadovaných výsledků; - dokáže redukovat a transformovat vícerozměrná data pomocí pokročilých metod ordinační analýzy; - je schopen klasifikovat data pomocí různých metod diskriminační analýzy a jiných pokročilých metod;- umí navrhnout různé modifikace popisovaných algoritmů vhodné pro zpracování dat specifických vlastností; - dokáže interpretovat dosažené výsledky včetně vyhodnocení úspěšnosti klasifikace.
Osnova
  • 1. Vícerozměrná analýza dat a její cíle. 2. Ordinační analýza – faktorová analýza (FA). 3. Ordinační analýza – vztah ordinačních prostorů: kanonická korespondenční analýza (CCA), redundanční analýza (RDA). 4. Ordinační analýza – vztah ordinačních prostorů: analýza hlavních koordinát (co-coordinateanalysis). 5. Pokročilejší metody extrakce proměnných – metoda nezávislých komponent (ICA) a další pokročilé metody. 6. Metriky pro určení vzdálenosti a podobnosti. 7. Klasifikace – úvod, diskriminační analýza pomocí diskriminačních funkcí a minimální vzdálenosti. 8. Klasifikace – diskriminační analýza pomocí hranic: Fisherova diskriminační analýza. 9. Klasifikace – diskriminační analýza pomocí hranic: lineární metoda podpůrných vektorů (SVM). 10. Klasifikace – nelineární SVM, sekvenční klasifikace. 11. Hodnocení klasifikátorů – křížová validace, srovnání úspěšnosti klasifikace s náhodnou klasifikací, srovnání úspěšnosti klasifikace dvou a více klasifikátorů. 12. Závěrečné shrnutí metod analýzy a klasifikace dat.
Literatura
  • Dunham,M.H.: Data Mining: Introductory and Advanced Topics. Prentice Hall 2002
  • Holčík,J.: Analýza a klasifikace signálů. [Učební texty vysokých škol] Brno, Nakladatelství VUT v Brně 1992.
  • Mitchel,T.M.: Machine Learning. McGraw Hill 1997
Výukové metody
Přednášky podporované Power Pointovými prezentacemi. Důraz je kladen na pochopení základních principů popisovaných metod a algoritmů. Během přednášek jsou studenti průběžně interaktivně oslovováni s cílem kontrolovat míru jejich pochopení přednášené látky.
Metody hodnocení
ústní zkouška
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2007 - akreditace, podzim 2010 - akreditace, podzim 2007, podzim 2008, podzim 2009, podzim 2010, podzim 2011, podzim 2011 - akreditace, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2017, podzim 2018, podzim 2019, podzim 2020, podzim 2021.