Tvorba tematických map Klasifikace je vedle analogové interpretace snímků základním krokem tematického mapování s využitím obrazových materiálů DPZ Kvantitativní charakteristiky jsou transformovány na kvalitativní Účel klasifikace  automatické zatřídění pixelů obrazu do různých tříd na základě jeho hodnoty DN = vytvoření tematické mapy  základem je spektrální chování pixelu v jednotlivých pásmech, což závisí na spektrální odrazivosti a vlastnostech vyzařování  v tomto smyslu „spektrální vzor“ není vůbec geometrického charakteru, termín „vzor“ nebo „charakteristika“ odkazuje spíše na chování pixelu v jednotlivých pásmech • Proces, při kterém je jednotlivým obrazovým prvkům přiřazován určitý informační význam. • Cílem je nahradit hodnoty radiometrických charakteristik původního obrazu, které vyjadřují spektrální vlastnosti objektů a jevů na něm zobrazených, hodnotami vyjadřujícími tzv. informační třídy (např. land cover) • Typ a obsah nové informace (např. tematické mapy) závisí na zaměření celého projektu. Hledané informační třídy jsou definovány na počátku procesu klasifikace ve formě tzv. klasifikačního schématu = legendy výsledné mapy. • Klasifikace není procesem jednosměrným, je procesem iteračním, neexistuje obecný návod na nejlepší řešení • Přístup k řešení a jeho postup závisí na: 1. datech, která je nutno analyzovat 2. možnostech techniky, která je k dispozici 3. uvažovaných aplikacích klasifikací Klasifikace obrazu - základní pojmy Geometrické základy klasifikace Jev je charakterizován dvěma znaky – T, S Nejpoužívanějším kritériem podobnosti je VZDÁLENOST. Obecně – čím blíže se nacházejí body v mrozměrném prostoru, tím jsou si podobnější. Euklidovská vzdálenost ve 2D 2 22 2 11 )()( jijiij xxxxd  Euklidovská vzdálenost ve 3D 2 33 2 22 2 11 )()()( jijijiij xxxxxxd  Vzdálenost v m- rozměrném prostoru Pomocí vlastností Euklidovského metrického prostoru lze tento typ vzdálenosti bodů definovat obecně pro m-rozměrný prostor:   m k kjkiij xxd 1 2 )( Euklidovská vzdálenost předpokládá ortogonalitu os definovaného prostoru – to znamená vzájemnou nezávislost použitých znaků. •Klasifikace je založena na použití určitých rozhodovacích pravidel (tzv. klasifikátorů), podle nichž lze všechny prvky obrazu zařadit do určité třídy. • Klasifikátory mohou být obecně založeny na nejrůznějších vlastnostech objektů a jevů v obraze. Podmínkou je, že jevy či objekty v obraze se v hodnotách porovnávaných vlastností vzájemně dostatečně odlišují. •Klasifikátory tzv. prostorového chování - zahrnují rozpoznávací příznaky jako texturu, vzájemnou vzdálenost (proximitu), velikost, tvar, opakovatelnost či kontext. Tyto klasifikátory se snaží simulovat proces vizuální klasifikace. • Klasifikátory časového chování využívají časových změn objektů jako prostředku k jejich třídění (např. u zemědělských plodin se některé jejich spektrální a prostorové parametry mění typicky s časem (monotemporální x multitemporální snímky – ozimá pšenice). • Nejčastěji se využívá klasifikátorů založených na spektrálním chování. Klasifikátor – rozhodovací pravidlo  Výše uvedené klasifikátory lze podobně jako techniky předzpracování a zvýrazňování kombinovat  Použité techniky závisí nejenom na charakteru vstupních dat, ale i na:  geografické oblasti  době pořízení  účelu klasifikace  dalším použití výsledků apod. Klasifikátory spektrálního chování • Nejvíce používané a propracované k automatické klasifikaci • K zařazení všech prvků obrazu do určité třídy používají multispektrálních dat a znalosti spektrálního chování objektů • Vychází z předpokladu, že různé objekty vykazují odlišné spektrální chování na základě svých odrazových nebo vyzařovacích vlastností. • Za nejjednodušší způsob automatické klasifikace založený na znalosti odrazových a vyzařujících vlastností využívající pouze jednoho pásma multispektrálního obrazu lze považovat např. techniky prahování • V důsledku mnoha vnějších i vnitřních vlivů jsou spektrální vlastnosti různých objektů v určitém intervalu spektra podobné, proto je nutné použít pro charakterizování objektů a jevů více charakteristik - více pásem, která potom definují osy tzv. multispektrálního prostoru. Spektrální příznaky a příznakový prostor Pokud naměřená či vypočtená charakteristika každého objektu v určitém pásmu (intervalu spektra) bude zároveň představovat charakteristiku, podle které bude možné objekt rozpoznat - tzv. příznak - potom lze každé pásmo označit jako jeden rozměr tzv. příznakového prostoru. Obrazový prostor (Image space) Spektrální prostor (Spectral space) Příznakový prostor (Feature space) 1 2 3 Klasifikace založená na teorii spektrálního chování je obecně procesem hledání všech spektrálních tříd, které tvoří třídu informační. A – vodní plochy, B – vegetace, C – holá půda Klasifikátory založené na spektrálních vlastnostech se označují také jako bodové („per-pixel“) klasifikátory, K zařazení obrazových prvků do jednotlivých tříd nepoužívají vlastností a příznaků okolních pixelů, ale pouze pixelu klasifikovaného. Vzhledem k charakteru běžně dostupných obrazových dat vychází celý koncept automatické klasifikace založené na spektrálním chování povrchů z určitých zjednodušení: • citlivost snímacího zařízení je konstantní pro všechna pásma multispektrálního obrazu • každý obrazový prvek odpovídá přesně definované ploše na zemském povrchu • každý obrazový prvek představuje homogenní povrch ve smyslu jeho spektrálního chování • naměřená data v každém pásmu mají normální rozdělení • každý obrazový prvek může náležet pouze k jedné klasifikované třídě Bodové klasifikátory Základní druhy klasifikace • klasifikace řízená, neřízená, hybridní • klasifikace per pixel a per-object • klasifikátory parametrické a neparametrické • klasifikátory „tvrdé“ a „měkké“ (fuzzy) • sub-pixelové klasifikace • klasifikace založené na strojovém učení (rozhodovací stromy a neuronové sítě) • expertní systémy (knowledge-based, rule-based classification) Řízená klasifikace obrazu – obecný postup 1. definování tzv. trénovacích ploch 2. výpočet statistických charakteristik (tzv. spektrálních příznaků) pro trénovací plochy charakterizující jednotlivé třídy, jejich editace a výběr vhodných pásem pro vlastní klasifikaci 3. volba vhodného rozhodovacího pravidla (tzv. klasifikátoru) pro zařazení všech prvků obrazu do jednotlivých tříd 4. zatřídění všech obrazových prvků do vymezených tříd 5. úprava, hodnocení a prezentace výsledků klasifikace Schéma řízené klasifikace 1. Vytvoření trénovacích ploch - vzorů A – voda B – les C – zastavěná plocha A B C TM1 TM4 TM5 Trénovací (učící) etapa • Trénovací etapa musí být kompletní (všechny třídy) a reprezentativní (více trénovacích ploch s různými fyzikálními vlastnostmi pro jednu třídu). • Měla by zahrnovat též podpůrná data (např. terénní výzkum, další zdroje). • Trénovány jsou spektrální třídy. • Důležitá homogennost – pozor na smíšenou spektrální informaci (mixed element) • Možnost určení trénovací plochy manuálně nebo pomocí seed (zárodečného) pixelu Definování vhodných trénovacích ploch závisí na těchto faktorech: • Dostatečný počet pixelů v každé trénovací ploše: pro výpočet reprezentativních statistických charakteristik je potřeba, aby trénovací plochy pro každou třídu byly tvořeny minimálně 100 pixely (mohou být třeba 3x40). • Vhodná velikost trénovacích ploch: Značně velké trénovací plochy budou zvyšovat míru nehomogenity pro danou třídu, naopak malé trénovací plochy bude obtížné lokalizovat jak v obraze, tak i při verifikaci v terénu. • Vhodná poloha trénovacích ploch: Pro účely testování výsledků klasifikace by měly být trénovací plochy umísťovány tak, aby bylo možné je přesně vymezit v terénu. Definování vhodných trénovacích ploch závisí na těchto faktorech: • Umístění trénovacích ploch: trénovací plochy by neměly zabírat okrajové pixely daného povrchu, který mají reprezentovat, protože ty většinou obsahují smíšenou spektrální informaci. • Rozmístění trénovacích ploch pro danou třídu: v důsledku vnějších (např. osvětlení scény), ale i vnitřních vlivů (např. různý vodní obsah), mohou být stejné povrchy reprezentovány poněkud odlišnými hodnotami radiometrických charakteristik. • Míra homogenity trénovacích ploch z hlediska jejich spektrálního chování: bez ohledu na následně použité rozhodovací pravidlo k zařazení pixelů do tříd, míry variability pixelů v trénovací ploše jako rozptyl či směrodatná odchylka jsou základním ukazatelem jejich vhodnosti. Nutnou podmínkou použití řady klasifikátorů je také normalita rozdělení pixelů v trénovacích plochách. 2. Výpočet statistických charakteristik jednotlivých tříd Pixely trénovacích ploch tvoří vzorek (masku), pro který jsou vypočteny statistické charakteristiky každé třídy. Statistické charakteristiky jednotlivých kategorií popisují tzv. spektrální příznaky. Spektrální příznaky (signatury) jsou nejčastějí charakterizovány měrami úrovně a měrami variability: • průměrovým vektorem • rozptylem (směrodatnou odchylkou ) • kovarianční maticí Uvedené statistiky dovolují posoudit vhodnost trénovacích ploch pro jednotlivé třídy a zda se trénované třídy ve zvoleném multispektrálním prostoru dostatečně od sebe odlišují svým spektrálním chováním. Průměr a rozptyl (variance) hodnot pixelů pro jedno pásmo Rozptyl (variance) dvou pásem = kovariance korelace kovariance Kovarianční matice Průměrový vektor Kovarianční matice • Matice je čtvercová, symetrická • Je základem pro definování měr podobnosti, pro transformace (PCA) i pro definování většiny parametrických klasifikátorů Histogramy znázorňující rozdělení hodnot v jednotlivých pásmech TM-2, TM-4 a TM-5 pro trénovací plochy jedné vybrané třídy Hodnocení trénovacích ploch Spektrogram pro vybrané třídy A, B, C a jednotlivá klasifikovaná pásma TM-2, TM-4 a TM-5 multispektrálního obrazu Hodnocení vzájemné separace tříd pomocí korelačního pole dvou pásem a elipsy charakterizující trénovací množinu každé třídy • Hodnocení míry odlišnosti (separability) mezi jakýmikoliv dvěma třídami může být vyjádřena také ve kvantitativní formě. • Statistickou charakteristikou, která vyjadřuje míru separace může být tzv. divergence - vážená vzdálenost mezi průměrovými vektory uvažovaných tříd Hodnocení kvality trénovací etapy porovnávané třídy (signatury) kovarianční matice třídy i průměrový vektor třídy i „trace“ funkce – suma prvků na hlavní diagonále funkce transpozice Matice divergencí třída voda les pole ttp les 2,000 pole 2,000 2,000 ttp 2,000 1,993 1,879 holá půda 2,000 1,990 2,000 1,999 Průměrná Separabilita: 1.879 Minimální Separabilita: 1.999 Maximální Separabilita: 2.000 • Divergence nabývá hodnot v intervalu 0 až 2. • Hodnota 0 znamená dokonalou shodu mezi charakteristikami spektrálních příznaků porovnávaných tříd - tedy nejméně vhodný výsledek. • Hodnota 2 znamená ideální výsledek - tedy dostatečné odlišení zkoumané dvojice tříd. • Za dobrou míru separability tříd jsou považovány hodnoty divergence v intervalu 1,9 až 2,0. Výběr vhodných pásem pro klasifikaci • Jako objektivního kritéria k výběru nejvhodnějších pásem, která budou následně vstupovat do klasifikace lze využít také hodnot divergencí. • Statistický popis spektrálních příznaků je možno v prvním kroku vygenerovat pro větší počet původních i transformovaných pásem zpracovávaného obrazu. • Z hodnot divergencí jsou určena pásma nejvhodnější (většinou 3 či 4 pásma) a pro takto označená vhodná pásma jsou poté znovu vypočteny statistické charakteristiky spektrálních příznaků jednotlivých natrénovaných tříd. 3. Použití vhodného rozhodovacího pravidla Výsledkem předchozích dvou etap je statistický popis hledaných tříd, vytvořený na základě trénovacích ploch. V klasifikační etapě jsou prostřednictvím vhodného rozhodovacího pravidla - klasifikátoru postupně zařazovány jednotlivé prvky obrazu do jedné z tříd. Předpoklad: obrazové prvky určité třídy se budou shlukovat do určité části vícerozměrného příznakového prostoru – nutno nalézt pravidlo, ke kterému shluku pixel patří Nejužívanější per-pixel (bodové) klasifikátory • Klasifikátor minimální vzdálenosti středů shluků • Klasifikátor pravoúhelníků • Klasifikátor „K“ nejbližších sousedů • Klasifikátor maximální pravděpodobnosti Klasifikátor minimální vzdálenosti středů shluků jednoduchý, lze nastavit mez pro nezařazený pixel, není citlivý na rozptyl, nevhodný pro spektrální třídy blízko u sebe s velkým rozptylem Klasifikátor pravoúhelníků rozptyl je ohraničen tzv. parallelepipeds (hyperkvádry, pravoúhelníky), dochází k překrytu – úprava hranic Modifikované klasifikátory pravoúhelníků pokud pixel spadne do více příznakových prostorů, nutné další modifikace či rozhodovací pravidla – úprava tvaru, četnost v třídě, odřezání odlehlých pixelů pro snížení rozptylu aj. Klasifikátor nejbližšího souseda Klasifikátor „K“ nejbližších sousedů • Modifikace klasifikátoru minimální vzdálenosti. • Hodnotí příslušnost pixelu k určité třídě také na základě početního zastoupení pixelů určité třídy v okolí • Algoritmus vyhledá ke klasifikovanému pixelu určitý předem stanovený počet (K) nejbližších pixelů v analyzovaném příznakovém prostoru bez ohledu na trénovací množiny. • Pixel je potom zařazen do třídy, která v množině K sousedů převažuje. • Parametr K nabývá hodnot 1-10, při vyšším počtu obsahuje výsledek velký podíl šumu. • V algoritmu je možné také omezit počet hodnocených sousedů určitou mezní vzdáleností. Klasifikátor maximální pravděpodobnosti Příklad pro 1D • Parametrický klasifikátor (hodnotí rozptyl, korelaci a kovarianci) • Z pixelů v trénovacích plochách počítá míry úrovně (průměrový vektor) i proměnlivosti (matice kovariance) • Ty definují frekvenční funkci normálního rozdělení • Každé hodnotě přísluší určitá pravděpodobnost výskytu v každé třídě (C,B frekvenční funkce 2 tříd, prvek má hodnotu 30, padne pravděpodobněji do C) Klasifikátor maximální pravděpodobnosti – 2D pdf – funkce hustoty pravděpodobnosti Klasifikátor maximální pravděpodobnosti Klasifikátor maximální pravděpodobnosti – 2D Klasifikátor maximální pravděpodobnosti - nepřekrývající se třídy v příznakovém prostoru Klasifikátor maximální pravděpodobnosti - překrývající se třídy Bayesův klasifikátor • Je rozšířením klasifikátoru maximální pravděpodobnosti, který modifikuje použitím tzv. a priori pravděpodobnosti. • Pravděpodobnosti příslušnosti pixelu k určité třídě je vážena jeho pravděpodobností výskytu. Ta může být např. přímo úměrná předpokládanému plošnému zastoupení třídy v obraze. • P1 - Zjišťujeme pravděpodobnost, že daný pixel náleží k určité třídě, nabývá-li tento pixel například hodnoty 45. • P2 - Z trénovacích dat lze určit pravděpodobnost, s jakou bude mít pixel hodnotu 45, za předpokladu, že se jedná o danou třídu. • Podle tzv. bayesova zákona lze hledanou pravděpodobnost (P1) vypočíst za předpokladu, že dopředu (a priori) stanovíme pravděpodobnost (P2). P(F|45) – pravděpodobnost výskytu třídy les za předpokladu výskytu pixelu s hodnotu 45 P(C|45) – pravděpodobnost výskytu třídy pole za předpokladu výskytu pixelu s hodnotu 45 Podmíněné pravděpodobnosti Potřebujeme zjistit: Pravděpodobnost výskytu jedné ze dvou tříd: P(F) = 0,5 P(C) = 0,5 Z trénovacích dat lze zjistit: P(45|F) – pravděpodobnost výskytu hodnoty 45 za předpokladu výskytu třídy les P(45|C) – pravděpodobnost výskytu hodnoty 45 za předpokladu výskytu třídy pole Podmíněné pravděpodobnosti Příklad: P(45|F) = 0,75 P(45|C) = 0,25 Hledáme P(F|45) a P(C|45) abychom je porovnali a zjistili max P Thomas Bayes (1702-1761) definoval vztah mezi neznámými P(F|45), P(C|45) a známými P(45|F), P(45|C), P (F) a P (C) Bayesův zákon C)|P(45P(C)F)|P(45P(F) F)|P(45P(F) 45)|(  FP ...)b|P(a)P(b)b|P(a)P(b )b|P(a)P(b )a|( 212111 11 11  bP P(F|45) = 0,75 P(C|45) = 0,25 Obecné vyjádření Bayesova zákona Po dosazení dostaneme: Přednosti a nedostatky Bayesova klasifikátoru • Jeho použití je efektivní v případě, že dochází k překryvům tříd v příznakovém prostoru. • Nabízí vhodný nástroj pro zahrnutí jiných než obrazových dat do klasifikace. • Nabízí prostředek k hodnocení „ceny“ za nesprávně klasifikované pixely. • Umožňuje kombinovat různé klasifikátory. • Slabou stránkou je výběr vhodných trénovacích ploch a určení a priori pravděpodobností. 4. Zařazení každého obrazového prvku ve výsledném obraze do jedné ze tříd základních druhů povrchů A A A B B A 0 A A B B B 0 0 A A A B B 0 0 A A A B B B 0 A A A A B B B A C C C C B B 0 C C C C B B A – voda B – les C – zastavěná plocha 0 - nezařazeno 5. Sestavení výsledné mapy základních druhů povrchů