Prostorové uspořádání ploch Využití prostorové statistiky k popisu měr úrovně a variability geografických jevů spojených s plochami (polygony) má v řadě geografických disciplín dlouhou tradici (demografie, krajinná ekologie apod.). Studium prostorových vztahů může být zaměřeno na následující typy úloh: 1) porovnání prostorového uspořádání studovaného jevu s uspořádáním teoretickým (shlukovým, pravidelným či náhodným) 2) typologie prostorového uspořádání jevů (bez územní souvislosti) 3) regionalizace - seskupování jednotek (polygonů) do vyšších územně souvisejících celků 4) interpolace a vyhlazování areálových dat Míry prostorového uspořádání ploch Prostorová autokorelace­ hodnoty atributů ploch spolu korelují v závislosti na jejich vzájemné poloze. To je v důsledku podobných přirozených (přírodních) podmínek (např. produkce zemědělských podniků) či v důsledku přirozené spojitosti jevů. U prostorově autokorelovaných dat nejsou hodnoty atributů v prostoru náhodné, ale prostorově závislé. Tato vazba (autokorelace) může být pozitivní (shlukové uspořádání - sousední objekty mají podobné hodnoty) či negativní (u pravidelného uspořádání). V případě náhodného uspořádání ­ slabá či žádná prostorová autokorelace. Také v případě prostorové autokorelace lze měřit její sílu. Obr. 4.1 Příklad pozitivní prostorové autokorelace (shlukové uspořádání - vlevo) a negativní prostorové autokorelace (disperzní uspořádání ­ vpravo) Prostorová autokorelace je významným ukazatelem k hodnocení dynamiky a časových změn v prostorovém uspořádání objektů a pro predikce. Další význam prostorové autokorelace spočívá ve skutečnosti, že řada statistických ukazatelů (např. regresní modely) požaduje splnění předpokladu náhodnosti výběru objektů a jejich vzájemné nezávislosti. Míry prostorové autokorelace tak mohou potvrdit či vyvrátit splnění uvedených předpokladů. Matice prostorových vah (Spatial weights matrices) Prostorová autokorelace měří stupeň podobnosti atributů mezi danou plochou a plochami sousedními. Nejprve proto musí být vztahy sousedství jistým způsobem kvantifikovány. Máme plochu s n prostorovými jednotkami. Potom můžeme definovat n x n párů sousedství ­ maticí typu n x n. Každá prostorová jednotka je prezentována jedním řádkem a sloupcem. Každá hodnota v matici prezentuje prostorový vztah mezi jednotkami prezentovanými daným řádkem a sloupcem v matici. Buňky matice mohu nabývat různých hodnot v závislosti na způsobu definování sousedství (např. binární matice s 0 a 1 podle toho, zda jednotky spolu přímo sousedí či nikoliv, nebo ­ buňky nesou vzdálenost mezi centroidy obou jednotek. Protože hodnoty v buňkách představují váhy při výpočtu prostorové autokorelace, potom se sestavené matice označují jako matice prostorových vah). Způsoby definování sousedství Označují se podle pohybu šachových figur (Rook's case ­ věž, Queen's case ­ Dáma) ­ viz. obr. 4.2 Bezprostřední sousedé (se společnou hranicí, i jedním bodem v případě Queens case) jsou sousedé prvního řádu. Analogicky lze definovat sousedy vyšších řádů. Obr.4.2 Způsoby definování sousedství Vedle sousedství je další běžně užívanou mírou prostorové relace objektů jejich vzdálenost. Intenzita vztahu dvou vzdálených jednotek bude obecně menší než intenzita vztahu jednotek blízkých. Tato vzdálenost může být arbitrárně určena (na základě zkušenosti či povahy studovaného problému: např. k danému domu jsou sousedé definováni jako domy do vzdálenosti 1 km, výsledek potom ze vyjádřit v binární podobě). Binární matice konektivity (BCM ­ binary connectivity matrix) Analogicky jako v případě linií ­ binární, čtvercová symetrická matice C s prvky cij, 1 ­ sousedí, 0 - ne) Binární matice sousedství Vlastnosti BCM: ˇ Prvky na hlavní diagonále mají hodnoty 0 ˇ Matice je symetrická ­ redundance uložené informace ˇ Suma v řádku nese informaci o počtu sousedů dané jednotky ˇ Pro větší počet prostorových jednotek obsahuje velké množství nul a je tedy paměťově náročná Vhodnější způsob zaznamenání vztahů sousedství je uchovávání ID či názvu sousedů pro každou plochu, tedy např.: Polygon Soused1 Soused2 ... Brno-město Brno-venkov Blansko Blansko Brno-venkov Vyškov Brno-město ...... ..... .... Stochastická matice či matice se standardizovanými řádkovými vahami (RSWM) Zaznamenání sousedství v binární podobě není v řadě případů výhodné ­ váhy jsou stejné bez ohledu na počet sousedů. Vhodnějším způsobem je nahrazení jedniček vahou wij , vypočtenou jako poměr mezi hodnotu cij a sumou v řádku ­ tj. počtem sousedů. Tedy má-li jednotka 4 sousedy, bude její váha rovna 0,25 ­ tak dostaneme z matice C matici W, označovanou jako matici se standardizovanými řádkovými vahami. Stejně jako matice C má i W na hlavní diagonále nuly, není vak již symetrická. Matice se standardizovanými řádkovými vahami Vzdálenosti centroidů Vztahy prostorové závislosti lze charakterizovat také vzdáleností jednotek (viz. první zákon geografie ­ Tobler, 1970: Všechny objekty spolu souvisí, ale blízké objekty spolu souvisejí více). Tedy vzdálenost je vhodnou váhou pro definování prostorových vztahů. Existuje několik způsobů definování vzdálenosti dvou polygonů, např. vzdálenost centroidů. Existuje několik způsobů určení centroidu pro daný polygon. V závislosti na tvaru polygonu nemusí jeho centroid ležet uvnitř něho. Jsou-li jako váhy použity vzdálenosti (zde vzdálenosti centroidů), matice se označuje D s prvky dij . Váhy jsou potom definovány jako převrácená hodnota vzdálenosti: ij ij d w 1 = V řadě případů síla vztahu mezi dvěma jednotkami klesá rychleji než se zvětšuje jejich vzdálenost, proto se váhy definují jako. 2 1 ij ij d w = Nejbližší vzdálenosti Na místo vzdáleností centroidů jsou použity vzdálenosti dvou nejbližších částí dvou polygonů. Takto definované váhy jsou výhodné pro charakterizování prostorových kontaktů či difuze. U takto sestavené matice buňky s nulami mimo hlavní diagonálu (sousedé) odpovídají buňkám s jedničkami v binární matici sousedství. Matice vzdáleností mezi nejbližšími částmi polygonů Míry prostorové autokorelace Výše uvedené matice slouží k definování měr prostorové autokorelace (SA). Míry SA mohou být vztaženy k poli bodů (viz. výše) či ploch. V případě ploch lze zpracovávat data nominální (JCS - joint count statistics ­ Statistika charakteru sousedství), intervalová i poměrová (Moranův index I, Gearyho poměr C, G-statistika) Uvedené míry lze označit jako globální míry prostorové autokorelace (asociace). Tedy jedna hodnota je vypočtena pro celou studovanou oblast. Avšak také prostorová autokorelace se může měnit v rámci studované oblasti ­ k deskripci prostorové heterogenity prostorové autokorelace lze využít lokálních měr ­ Local Indicator of Saptial Association (LISA) a lokálmí verze G-statistiky (local G-statistics). Ke grafickým prostředkům hodnotícím prostorovou autolorelaci patří Moranův scatterplot diagram. Základní notace používaná v následujícím popisu indexů prostorové autokorelace wij ­ obecně buňka matice vah W pro řádek i a sloupec j. (nejen matice stochastické ­ viz. výše) Sumace vah daného řádku i přes všechny sloupce (řádková suma): = j iji ww. Sumace vah daného sloupce j přes všechny řádky (sloupcová suma): = i ijj ww. Sumace všech buněk matice vah: = i j ijwW Pro testování významnosti indexů prostorové autokorelace lze váhy v jednotlivých výrazech sumarizovat do následujících výrazů: += i j jiij wwSUM 2 1 )( 2 1 a 2 2 += i j j jiij wwSUM SUM1 ­ suma přes váhy. Jsou-li váhy binární a matice symetrická, potom 4)( 2 =+ jiij ww SUM1 je tedy čtyřnásobek celkového počtu spojů (společných hranic) v celé studované ploše. Hodnota SUM2 je založena na sumování vah každé plošné jednotky v obou směrech (wij i wji). Výsledná hodnota je potom získána jejich součtem, umocněním a sumací pro všechny jednotky studované oblasti. Statistika charakteru sousedství - Joint count statistics (JCS) Touto metodou lze zjistit, zda uspořádání ploch, které mohou nabývat binárních hodnot vykazuje prvky náhodnosti. Tedy zda existuje pozitivní (clustered pattern) či negativní (random pattern) prostorová autokorelace. Obr. 4.3 Statistika četnosti spojů (JCS) Podstata metody ­ jednoduchý příklad: Máme mapu se dvěma kategoriemi landuse: U ­ zástavba, R ­ volná krajina. Potom mohou existovat čtyři typy sousedských vztahů: UU, RR, UR, RU. V případě čistě náhodného uspořádání se bude každá kombinace vyskytovat v 25% případů. Dvojice ploch s odlišným atributem se budou vyskytovat v 50 % případů. Pokud UR + RU < 50%, potom výskyt dvojic ploch se stejným atributem UU a RR bude vyšší než 50% - což je případ pozitivní prostorové autokorelace. V případě 50 na 50 ­ uspořádání je náhodné a pokud UR + RU > 50%, pak se jedná o negativní SA, kdy dominují hranice nepodobných ploch. Mapu (obr. 1) s pěti plochami můžeme prezentovat také grafem s vrcholy a spoji, zaznamenávajícími druh povrchu a také bezprostřední sousedství jednotlivých ploch s plochami jinými, jak je patrné z obr. 4.4 Obr. 4.4 Grafická prezentace druhů spojů Sestavíme matici sousedství pro jednotlivé plochy. V této matici nula značí, že obě plochy spolu bezprostředně nesousedí, 1 naopak. Zároveň je barvou buňky v matici naznačeno, o jaký typ spoje se jedná (obr 4.5). Obr. 4.5 Binární matice sousedství pro nominální data Pořadí řádků a sloupců v uvedené matici je určeno abecedním pořadím identifikátorů ploch. Nic nebrání sestavit matici v jiném pořadí řádků a sloupců ­ například podle typu povrchu ­ viz. obr. 4.6). Obr. 4.6 Binární matice sousedství uspořádaná podle hodnot atributů Obě matice jsou symetrické, ve druhém případě navíc je možné jednoduše popsat prostorovou autokorelaci pomocí čtyř sub-matic. Z matice lze zjistit, že 14 buněk obsahuje jedničku, která značí výskyt hrany (14 párů sousedství). Dále platí, že jednotlivé typy sousedství se na mapě vyskytují s těmito četnostmi: UU=2 UR=5 RU=5 RR=2 Z toho plyne, že RU + UR > 14/2 , tedy naše mapa vykazuje negativní autokorelaci, nepodobné plochy (s odlišným typem povrchu) se shlukují. Uvedený koncept lze dále rozšířit využitím počtu pravděpodobnosti a statistických testů. Ty nám umožní testovat statistickou významnost prostorového uspořádání ploch v mapě. V dalším výkladu jsou používány dvě hodnoty atributů B ­ black, černá, W ­ white, bílá. Tedy bude-li prostorové uspořádání indikovat uspořádání do shluků, potom můžeme předpokládat více hranic typu BB či WW než BW nebo WB ­ tedy pozitivní prostorovou autokorelaci. JCS tedy nejprve určuje počet jednotlivých druhů spojů s cílem testovat četnost jejich výskytu. Pro plochu s malým počtem polygonů lze počty jednotlivých spojů zjistit manuálně, pro velký počet ploch je nutné využití metod matematické statistiky. Obecné kroky výpočtu jsou následující: Nechť xi=1 jestliže polygon i je černý a xi=0 jestliže polygon i je bílý. Potom pro BB spoje bude: = i j jiijBB xxwO )( 2 1 Pro WW spoje bude platit: [ ] --= i j jiijWW xxwO )1)(1( 2 1 Pro BW nebo WB spoje bude platit: [ ] -= 2 )( 2 1 jiijBW xxwO Uvedené vzorce představují výrazy pro pozorované (O ­ observed) počty spojů popisující dané uspořádání. Vysoké hodnoty OBB či OWW či obou indikují pozitivní prostorovou autokorelaci (slukování). Pozorované počty spojů však musíme porovnat s náhodným uspořádáním a musíme testovat, zda eventuelní zvýšené počty OBB či OWW nejsou výsledkem pouhé náhody, zda jsou či nejsou statisticky významné. Budeme tedy pracovat s počtem pravděpodobnosti. Způsob určení pravděpodobnosti výskytu B a W polygonů však může významně ovlivnit výsledek analýzy. Hodnoty atributů mohou byt jednotlivým polygonům přiřazeny na základě předpokladu normality či náhodnosti (viz. prostorová analýza bodů) Předpoklad normality: (NORMALITY - FREE - SAMPLING) ­ pravděpodobnost, že se jedná o polygon B či W je založena na teorii či na trendu hodnot atributů odvozeném z větší oblasti. Pravděpodobnost, že polygon má B či W není ovlivněna celkovým počtem B či W polygonů v oblasti. Předpoklad náhodnosti: (RANDOMIZATION ­ NONFREE ­ SAMPLING) ­ pravděpodobnost, že polygon bude mít B či W je omezena či závisí na celkovém počtu B či W polygonů. Příklad: Plocha obsahující sedm polygonů: Předpoklad náhodnosti ­ může existovat různá konfigurace 4 ,,černých" a 3 ,,bílých" ploch. Předpoklad normality - může existovat různá konfigurace jakéhokoliv (0 až 7) počtu ,,černých" a ,,bílých" ploch. U metody JCS bychom neměli pracovat s předpokladem normality v případě, že informace získané z teorie, zkušenosti či z trendové funkce z širšího okolí jsou nespolehlivé. Náhodné vzorkování totiž vyžaduje méně rigorózní podmínky použití. Normální vzorkování V obou výše komentovaných případech je nutné vedle pozorovaných (O) počtů jednotlivých typů spojů či hranic (joint) zjistit počty očekávané (E) a také jejich směrodatné odchylky. Očekávané počty odrážejí efekt náhodnosti či nevýznamné prostorové autokorelace jakéhokoliv typu (pozitivní či negativní). Tedy zjistí se diference mezi pozorovanými a očekávanými četnostmi spojů. Tyto diference jsou následně standardizovány hodnotami příslušných směrodatných odchylek a získáme tak standardizovaná skóre. Z hodnot těchto skóre můžeme rozhodnout, zda je ve studované oblasti významná pozitivní či negativní prostorová autokorelace v uspořádání polygonů podle hodnot atributu. Jinými slovy, je nutné provést tři typy porovnání. Dále je prezentován případ pouze pro testování negativní prostorové autokorelace. Pro případ normálního vzorkování jsou vztahy pro očekávané četnosti jednotlivých druhů spojů (joint) (EBB, EWW, EBW) následující: 2 2 1 WpEBB = 2 2 1 WqEww = WpqEWB = p ­ pravděpodobnost, že plocha bude B (černá) q ­ pravděpodobnost, že plocha bude W (bílá) Pravděpodobnosti p, q musí dávat 100% nebo (p + q = 1). Pokud není k dispozici jiná informace, potom nnp B= , jsou však i jiné způsoby určení p. Pokud je použitá prostorová matice vah binární, lze výrazy pro očekávané počty typů spojů zjednodušit: 2 JpEBB = 2 JqEWW = JpqEBW 2= kde J značí celkový počet spojů ve studované oblasti. K testování statistické významnosti zjištěného prostorového uspořádání lze využít Z-testu. K němu je zapotřebí zjistit směrodatné odchylky očekávaných počtů spojů. Směrodatné odchylky se vypočtou v závislosti na použité váhové matici následovně: Pro stochastickou matici vah: [ ]pSqSqpBB 21 2 4 1 += [ ]qSpSpqww 21 2 4 1 += [ ]{ }pqpqSpqSBW 414 4 1 21 -+= Pro binární matici vah: ( )KJpKpJpBB +-+= 432 ( )KJqKqJqWW +-+= 432 ( )KJqppqKpqJBW +-+= 22 42 kde je směrodatná odchylka počtu příslušných spojů S1, S2, J, p, q byly definovány výše ( ) = -= n i ii LLK 1 1 Hodnota n v tomto výrazu značí celkový počet polygonů a Li je počet spojů mezi polygonem i a jeho sousedy. Obecný postup testování (na příkladu negativní prostorové autokorelace (BW spoje) při použití binární matice): Pro výpočet očekávaných potřebujeme znát hodnoty pravděpodobností p, q. Rozhodneme se pro určité pravidlo definující sousedství (rook, queen). Dále určíme J (počet spojů) ­ zjistíme sumováním všech členů binární matice vah a dělíme dvěma. Odhad správných hodnot p a q ­ ze zkušenosti, z teorie (např. mortalita v určitém regionu ­ použijeme údaje o mortalitě celého státu. Potom určíme hodnotu výrazu L(L-1) pro každý polygon a provedeme sumaci pro celou oblast. Potom určíme hodnoty EBW a BW. Máme-li k dispozici pozorované počty spojů (OBW), potom můžeme vyjádřit hodnotu z-skóre: BW BWBW EO Z - = Podle pravděpodobnosti rozdělení hodnot Z-skóre platí, že jakákoliv hodnota Z ležící mimo interval (- 1,96; -1,96) má pravděpodobnost výskytu menší něž 5 případů ze 100 (=0,05). Obr. 4. 7 Příklady prostorového uspořádání černých a bílých polygonů v rámci studované oblasti (a, b, c) a počty sousedů jednotlivých ploch (d) PŘÍKLAD: Na obrázku 4.7 je oblast obsahující 7 polygonů. Naším cílem je metodou JCS určit, zda v této oblasti existuje statisticky významná negativní prostorová autokorelace ve výskytu ,,černých" (B) a ,,bílých" (W) ploch. Jako vah využijeme prvků binární matice. Podle výše uvedených vzorců musíme vyčíslit hodnoty OBW, EBW, BW, 1) Spočteme celkový počet všech spojů ve studované oblasti, tedy hodnota J=11. 2) Určíme způsob definice sousedství ­ v tomto případě za sousedy považujeme pouze polygony, které spolu sousedí hranou (rook's case). 3) Určíme hodnoty pravděpodobností p, q výskytu ,,černé" či ,,bílé" plochy. V tomto případě předpokládáme, že p=0,3 a q=0,7. 4) Z obr. d určíme pomocí následující tabulky hodnotu ( ) -1LL Oblast L L-1 L(L-1) A 3 2 6 B 2 1 2 C 3 2 6 D 5 4 20 E 3 2 6 F 3 2 6 G 3 2 6 22 52 5) Vyčíslíme hodnoty , EBW, BW: 62,47,0*3,0*11*22 === JpqEBW BW =2,1 6) Pro jednotlivé varianty na obrázku a, b, c jsou hodnoty pozorovaných počtů spojů (OBW) OBW = 4, 6 resp 8 7) Pro konfigurace ,,černých" a ,,bílých" poch uvedené na obrázku vyjádříme hodnotu z-skóre: a) 29,0 1,2 62,44 -= - =Z b) 65,0 1,2 62,46 = - =Z c) 61,1 1,2 62,44 = - =Z 8) Interpretace: Žádná z hodnot Z-skóre nepřesahuje prahovou hodnotu 1,96 a tedy uvedená uspořádání nevykazují statisticky významnou negativní prostorovou autokorelaci na hladině významnosti =0,05. Náhodné vzorkování V tomto případě závisí pravděpodobnost, zda je polygon bílý nebo černý, na celkovém počtu černých polygonů a počtu bílých polygonů ve studovaném území. Obrázek 4.7. uvádí tři typy prostorového uspořádání sedmi polygonů ve studované oblasti. Protože ve všech třech případech jsou počty B a W polygonů stejné (jsou jen jinak uspořádané) hodnoty pravděpodobnosti budou: p=3/7 a q=4/7. Dále se vypočtou hodnoty očekávaných počtů spojů a jejich směrodatné odchylky. Výpočetní vzorce jsou jiné než v případě normálního vzorkování (viz. Lee, Wong, 2000, str. 154 ­ 155). Postup výpočtu je však analogický výše uvedenému příkladu. Obr. 4.8 Příklad výstupu z metody JSC v programu ArcView