Shluková analýza Klasifikace vícerozměrných dat * vektory dat * různé formy dat * míra podobnosti * mechanismus shlukování Intervalová data * normalizace * z-score (odečteme průměr a podělíme směrodatnou odchylkou) * transformace na <0..1> * Minkovskeho vzdálenost (eukleidovská, hammingova) Nominální a Ordinální data * Nominální metrika * * * * Ordinální data převedema na <0..1> a zpracováváme jako intervalová Metody * Distanční matice * Dělící * Hierarchické * Hustotní Distanční matice * zkonstruujeme matici * přehazujeme řádky (a sloupce) * male honoty k diagonale K-means Clustering - K-means demo Aglomerace * postupně shlukujeme objekty na základě vzdálenosti * na konci je jeden shluk Hierarchical clustering 1 Hierarchical clustering 1 2 Hierarchical clustering 1 2 3 Hierarchical clustering 1 2 3 4 Hierarchical clustering 1 2 3 4 5 Hierarchical clustering 1 2 3 4 6 9 5 7 8 Hustotní * radius * minimální počet objektů * jádro * dosažitelnost * šum