Shluková a PCA analýza Je dobré (většinou nutné) před vlastní analýzou data standardizovat Původní data Standardizovaná data Shluková analýza •Hierarchické shlukování: 1.Metoda nejbližšího souseda (nebezpečí řetězového efektu) 2.Metoda nejvzdálenějšího souseda (spojení dvou nejbližších shluků měřeno na nejvzdálenějších členech tohoto shluku) 3.Metoda průměrné vzdálenosti 4.Wardova metoda •Nehierarchické: Např. metoda zárodečných bodů •Míru vhodnosti vybrané metody prozradí korelační koeficient CC (čím blíže 1, tím lepší model) •Otázka optimálního počtu shluků (neexistuje jednoznačný návod, musíme sami určit na základě výsledků) Zdroj: http://midas.uamt.feec.vutbr.cz/POV/LPOV_Exercise06/content_cz.php Převod z dat na vzdálenosti Zdroj: Meloun a kol. Statistická analýza vícerozměrných dat v příkladech PCA Analýza Cílem je nahradit velké množství původních znaků několika hlavními komponentami, které vystihují většinu rozptylu.