ANALÝZA A KLASIFIKACE DAT prof. Ing. Jiří Holčík, CSc. VIII. ANALÝZA HLAVNÍCH KOMPONENT ZAČÍNÁME ANALÝZA HLAVNÍCH KOMPONENT PRINCIPAL COMPONENT ANALYSIS (PCA) ROZKLAD PODLE VLASTNÍCH ČÍSEL SINGULAR VALUE DECOMPOSITION (SVD) Karhunenova-Loevova transformace ZAČÍNÁME þ extrakce příznaků - hledání zobrazení (optimálního) Z, které transformuje původní m rozměrný prostor (obraz) na prostor (obraz) n rozměrný (m  n); þ nalezení vhodné transformace – potřeba optimalizačního kritéria: è obrazy v novém prostoru budou aproximovat původní obrazy ve smyslu minimální střední kvadratické odchylky; è obrazy v novém prostoru budou minimalizovat odhad pravděpodobnosti chyby ZAČÍNÁME þ aby byla úloha řešitelná, hledáme zobrazení v oboru lineárních zobrazení ZAČÍNÁME þ aby byla úloha řešitelná, hledáme zobrazení v oboru lineárních zobrazení Jak poznáme lineární zobrazení? ZAČÍNÁME þ aby byla úloha řešitelná, hledáme zobrazení v oboru lineárních zobrazení Jak poznáme lineární zobrazení? TEORIE þ předpokládejme, že je dáno K obrazů a nechť existuje m příznakových veličin, které tyto obrazy charakterizují. Tedy k-tý obraz je vyjádřen m rozměrným sloupcovým vektorem y[k] Î Y ^m, k=1,…,K. þ aproximujme nyní kterýkoliv obraz y[k] lineární kombinací n ortonormálních vektorů e[i] (m  n) (J) TEORIE þ koeficienty c[ki] lze považovat za velikost i-té souřadnice vektoru y[k] vyjádřeného v novém systému souřadnic s bází e[i], i=1,2,…,n, tj. platí þ použijeme-li jako kritérium minimální střední kvadratické odchylky, pak je TEORIE þ pak pomocí dříve uvedených vztahů pro x[k] a c[ki] dostaneme þ střední kvadratická odchylka pro všechny obrazy y[k], k=1,…,K je (je tedy závislá na volbě bázového systému e[i]) TEORIE þ diskrétní konečný rozvoj podle vztahu (J) s bázovým systémem e[i], optimálním podle kritéria minimální střední kvadratické chyby nazýváme diskrétní Karhunenův – Loevův rozvoj; þ aby střední kvadratická odchylka podle výše uvedeného vztahu byla minimální, musí být odečítaná hodnota na pravé straně rovnice maximální. TEORIE þ musíme tedy maximalizovat výraz je autokorelační matice řádu m. Protože je symetrická a semidefinitní, jsou její vlastní čísla λ[i], i=1,…,m, reálná a nezáporná a vlastní vektory v[i], jsou buď ortonormální, nebo je můžeme ortonormalizovat (v případě násobných vlastních čísel). TEORIE þ uspořádáme-li vlastní čísla sestupně podle velikosti, tj. λ[1 ]³ λ[2 ]³ …  λ[m ]³ 0 a podle toho očíslujeme i odpovídající charakteristické vektory, lze dokázat, výe uvedený výraz dosahuje maxima, jestliže platí e[i] = v[i], i=1,…,n a pro velikost maxima je TEORIE þ pro minimální střední kvadratickou odchylku tedy platí teorie þ v některých případech je vhodnější vektory y[k] před aproximací centrovat se střední hodnotou a místo s obrazem y[k] počítáme s jeho centrovanou verzí . Postup výpočtu se nemění, ale místo autokorelační matice používáme disperzní matici ve tvaru Geometrická interpretace vlastnosti þ při daném počtu n členů rozvoje poskytuje ze všech možných aproximací nejmenší střední kvadratickou odchylku; þ při použití disperzní matice jsou transformované souřadnice nekorelované; pokud se výskyt obrazů řídí normálním rozložením zajišťuje nekorelovanost i jejich nezávislost; þ vliv každého členu uspořádaného rozvoje se zmenšuje s jeho pořadím; þ změna požadavků na velikost střední kvadratické odchylky nevyžaduje přepočítávat celý rozvoj, nýbrž jen změnit počet jeho členů. Rozdělení do tříd Jak se změní podmínky, když obrazy y budou platit, které budou vymezeny jako části spojitého obrazového prostoru Y ^m? þ Výskyt obrazů v jednotlivých klasifikačních třídách bude popsán podmíněnými hustotami pravděpodobnosti p(y|ω[r]), r=1,2,…,R a apriorní pravděpodobnost klasifikačních tříd bude P(ω[r]). V tom případě autokorelační matice bude Rozdělení do tříd þ disperzní matice kde nebo vztahem Rozdělení do tříd kde střední hodnota μ je vážený průměr středních hodnot všech tříd, tj.