ANALÝZA A KLASIFIKACE BIOMEDICÍNSKÝCH DAT

                                   prof. Ing. Jiří Holčík, CSc.

                                               VIII.
                                    ANALÝZA HLAVNÍCH KOMPONENT

                                             ZAČÍNÁME


                                    ANALÝZA HLAVNÍCH KOMPONENT

                                PRINCIPAL COMPONENT ANALYSIS (PCA)

                                 Karhunenova-Loevova transformace

                                             ZAČÍNÁME

þ extrakce příznaků -  hledání zobrazení (optimálního) Z, které transformuje původní m rozměrný
prostor (obraz) na prostor (obraz) n rozměrný (m  n);

þ nalezení vhodné transformace – potřeba optimalizačního kritéria:

è obrazy v novém prostoru budou aproximovat původní obrazy ve smyslu minimální střední kvadratické
odchylky;

è obrazy v novém prostoru budou minimalizovat  odhad pravděpodobnosti chyby

                                             ZAČÍNÁME

þ aby byla úloha řešitelná, hledáme zobrazení v oboru lineárních zobrazení


                                             ZAČÍNÁME

þ aby byla úloha řešitelná, hledáme zobrazení v oboru lineárních zobrazení


                                  Jak poznáme lineární zobrazení?

                                             ZAČÍNÁME

þ aby byla úloha řešitelná, hledáme zobrazení v oboru lineárních zobrazení


                                  Jak poznáme lineární zobrazení?


                                              TEORIE

þ předpokládejme, že je dáno K obrazů a nechť existuje m příznakových veličin, které tyto obrazy
charakterizují. Tedy k-tý obraz je vyjádřen m rozměrným sloupcovým vektorem y[k] Î Y ^m, k=1,…,K.

þ aproximujme nyní kterýkoliv obraz y[k] lineární kombinací n ortonormálních vektorů e[i] (m  n)

                                                                                                (J)


                                              TEORIE

þ koeficienty c[ki] lze považovat za velikost i-té souřadnice vektoru y[k] vyjádřeného v novém
systému souřadnic s bází e[i], i=1,2,…,n, tj. platí


þ použijeme-li jako kritérium minimální střední kvadratické odchylky, pak je


                                              TEORIE

þ pak pomocí dříve uvedených vztahů pro x[k] a c[ki] dostaneme


þ střední kvadratická odchylka pro všechny obrazy y[k], k=1,…,K je


   (je tedy závislá na volbě bázového systému e[i])


                                              TEORIE

þ diskrétní konečný rozvoj podle vztahu (J) s bázovým systémem e[i], optimálním podle kritéria
minimální střední kvadratické chyby nazýváme diskrétní Karhunenův – Loevův rozvoj;

þ aby střední kvadratická odchylka podle výše uvedeného vztahu byla minimální, musí být odečítaná
hodnota na pravé straně rovnice maximální.

                                              TEORIE

þ musíme tedy maximalizovat výraz


   je autokorelační matice řádu m. Protože je symetrická a semidefinitní, jsou její vlastní čísla
λ[i], i=1,…,m, reálná a nezáporná a vlastní vektory v[i], jsou buď ortonormální, nebo je můžeme
ortonormalizovat (v případě násobných vlastních čísel).

                                              TEORIE

þ uspořádáme-li vlastní čísla sestupně podle velikosti, tj.

                                    λ[1 ]³ λ[2 ]³ …  λ[m ]³ 0

   a podle toho očíslujeme i odpovídající charakteristické vektory, lze dokázat, výe uvedený výraz
dosahuje maxima, jestliže platí

                                       e[i] = v[i], i=1,…,n

   a pro velikost maxima je


                                              TEORIE

þ pro minimální střední kvadratickou tedy platí

                                              teorie

þ v některých případech je vhodnější vektory y[k] před aproximací centrovat se střední hodnotou


   a místo s obrazem y[k] počítáme s jeho centrovanou verzí                 .

   Postup výpočtu se nemění, ale místo autokorelační matice používáme disperzní matici ve tvaru


                                     Geometrická interpretace

                                            vlastnosti

þ  při daném počtu n členů rozvoje poskytuje ze všech možných aproximací nejmenší střední
kvadratickou odchylku;

þ  při použití disperzní matice jsou transformované souřadnice nekorelované; pokud se výskyt obrazů
řídí normálním rozložením zajišťuje nekorelovanost i jejich nezávislost;

þ  vliv každého členu uspořádaného rozvoje se zmenšuje s jeho pořadím;

þ  změna požadavků na velikost střední kvadratické odchylky nevyžaduje přepočítávat celý rozvoj,
nýbrž jen změnit počet jeho členů.

                                         Rozdělení do tříd

     Jak se změní podmínky, když obrazy y budou platit, které budou vymezeny jako části spojitého
                                     obrazového prostoru Y ^m?

þ Výskyt obrazů v jednotlivých klasifikačních třídách bude popsán podmíněnými hustotami
pravděpodobnosti p(y|ω[r]), r=1,2,…,R a apriorní pravděpodobnost klasifikačních tříd bude P(ω[r]).

   V tom případě autokorelační matice bude

                                         Rozdělení do tříd

þ disperzní matice


   kde


   nebo vztahem

                                         Rozdělení do tříd

   kde střední hodnota μ je vážený průměr středních hodnot všech tříd, tj.