Modelovaní prostorového uspořádání bodů Deskripce bodů pomocí měr úrovně a variability je jen prvním krokem analýzy. V případě prostorové analýzy nás v druhém kroku zajímají body s ohledem na jejich prostorové rozmístění (strukturu -pattern). Rozmístění boduje výsledkem určitých procesů a podmínek - např. lokace měst je výsledkem působení faktorů jako je reliéf, přírodní zdroje, komunikace, obdobně výskyt rostlinných druhů, atd. Cílem studia prostorového rozmístění je zjistit, jak daleko má konkrétní rozmístění objektů k rozmístění teoretickému, (např. teorie centrálních míst - teoretický vzorec - šestiúhelníky). To nám umožňuje jednak porovnávat rozmístění objektů pro různé prostorové jednotky (kategorie landuse, půdní typy, okresy, státy, atd.), jednak studovat dynamiku změn v rámci jedné jednotky (studium dynamiky). Statisticky prokázaný výskyt určitého prostorového uspořádání (shlukového či pravidelného vzorku) může být základem pro zjišťování příčin, které vedly k pozorovanému uspořádání Statistická deskripce prostorových vzorů bodových prvků * *j* * * _ obs r exp Hodnotu robs zjistíme tak, že určíme vzdálenost mezi daným bodem a všemi jeho sousedy. Dále najdeme nejkratší vzdálenost - tedy nejbližšího souseda. Tento proces se opakuje pro všechny body. Ze všech nejkratších vzdáleností se vypočte průměr. Pro teoretické - náhodné - rozložení se průměrná vzdálenost nejbližšího souseda vypočte podle vzorce: 1 ľexv~Žfi/A Cím je hodnota R < 1, tím více se prostorové rozložení bodů blíží rozložení shlukovému (robs< rexp). Cím je hodnota R > 1, tím více se prostorové rozložení bodů blíží rozložení pravidelnému (robs > rexp). 11 R = 0 R =0.51 = 0 Ol zcela shlukové = 1 náhodné = 2,149 zcela pravidelné R=1.0 R=1.48 PRAVIDELNÉ R=1.90 Obr. 2.8 Škála hodnot R statistiky Je-li R=0, vzdálenosti jsou 0, všechny body mají stejnou polohu. Jinou z možností, jak porovnat rozdíl mezi pozorovanou a očekávanou vzdáleností nejbližšího souseda je porovnat tuto diferenci s tzv. směrodatnou chybou (Standard Error - SEr) Směrodatná chyba popisuje pravděpodobnost, že jakýkoliv rozdíl dvou hodnot je výsledkem náhodných vlivů. Je-li tedy zjištěná diference malá ve srovnání s SE, potom rozdíl není statisticky významný a naopak. Použití směrodatné chyby SE vychází z vlastností normálního rozdělení, pro které platí následující: Je-li mezi pozorovanými populacemi rozdíl ajeho velikost náleží do intervalu (-lSEr; +lSEr), potom existuje 68 % šance, že tento rozdíl je náhodný - tedy nevýznamný: Pravděpodobnost (<68%) = (-lSEn +lSEr) Za statisticky významný považujeme rozdíl, který můžeme obdržet v 5 případech ze sta - tedy s pravděpodobností 5 %, a=0,05. Vyjádřeno v násobcích směrodatné chyby - rozdíl mezi dvěma populacemi povařujeme za statisticky významný, jestliže je menší než -l,96SEr a nebo větší než +l,96SEr: Pravděpodobnost (<95%) = (-l,96SEn +l,96SEr) Výpočet směrodatné chyby pro pozorované vzdálenosti bodů: ez7 0,26136 SE, w* Pomocí směrodatné chyby lze vypočítat standardizovanou hodnotu (Z-score): T — T obs exp SE, Je-li tedy ZR< -1,96 či ZR> 1,96 potom vypočtený rozdíl mezi pozorovaným a náhodným uspořádáním je statisticky významný - tedy není náhodný a naopak. Nelze spoléhat na vizuální srovnání prostorového rozložení ani na vypočtenou hodnotu R. Ta by měla být doplněna hodnotou ZR pro ověření statistické významnosti pozorovaného rozdílu. 12 Metoda analýzy nejbližšího souseda může být rozšířena na analýzu nejbližších sousedů druhého, třetího a vyšších řádů. Například u obr. 2.6 dokumentujícího nevýhody kvadrantové analýzy by až analýza nejbližšího souseda druhého řádu odhalila, že se obě uspořádání výrazně liší. Na obrázku vlevo je R-statistika druhého řádu velká, na obrázku vpravo naopak malá. Použití analýzy nejbližšího souseda rozdílných řádů může odhalit heterogenity v uspořádání bodů na rozdílných prostorových úrovních. Problémy spojené s metodou analýzy nejbližšího souseda: výsledky jsou vysoce citlivé k měřítku (lokální vs. regionální) a vymezení zpracovávané oblasti. V závislosti na studovaném jevu by měla být věnována pozornost také vymezení studované plochy (administrativní či přirozené hranice). 13 Prostorová autokorelace (SPATIAL AUTOCORRELATION) Jak analýza kvadrátů tak analýza vzdálenosti nejbližšího souseda pracují pouze s polohou bodů. Nerozlišují body podle hodnot jejich atributů. Oba parametry (polohu i atributy) hodnotí prostorová autokorelace -je tedy metodou vhodnější. Východiska prostorové autokorelace: Většina jevů se v prostoru mění spojitě. Blízké body budou mít i podobné hodnoty studovaného jevu a naopak. (First law of geography - Tobler, 1970) Koeficient prostorové autokorelace - uvažuje polohu bodů (vzájemnou vzdálenost) a hodnotí rozdílnost hodnot atributů bodů v prostoru. Mezi nejpoužívanější koeficienty prostorové autokorelace náleží Gearyho poměr C (Geary's Ratio) a Moranův index I (Moran's I). Lze jich využít pro intervalová a poměrová data. Dále používaná notace: Cij - podobnost atributu v bodě i a j Wjj - vzdálenost bodu i aj. wu = 0 pro všechny body Xj - hodnota studovaného atributu v bodě i n - počet bodů ve vyšetřovaném vzorku Obě míry prostorové autokorelace kombinují v jednom výrazu míry podobnosti atributů i míry podobnosti polohy - tento výraz je potom východiskem pro definování dalších vztahů: Koeficient prostorové autokorelace SAC (spatial autocorrelation coefficient) je úměrný vážené míře podobnosti atributů bodů - obecně: SAC II 2=1 ;=i y y n n YZwy 2=1 ;=i V případě Gearyho poměru se podobnost hodnot atributu mezi dvěma body vypočte podle následujícího vztahu: C2,=(X2-X,)2 Gearyho poměr C se tedy vyjádří jako: n n n n lis-^ ixx-c*,.-*,)2 c 2=1 ;=i _ 2=1 ;=i 2ll-y^2 2£2>yV 2=1 ;=i 2=1 ;=1 kde g2 je rozptyl hodnot atributu x s průměrem x o2=^------------ (ii-1) V případě hodnoty Moranova indexu I se podobnost hodnot atributu v bodech i aj vyjádří následovně: cij = (*i - x) ■ (xj - x) 14 Moranův index I je potom určen: ZZ C -WA. y y SSW9'(Xi-X)-(X;-X) í=l ;=1 !ZZ í=i j=\ M>u TZ í=l ;=1 w,.. kde s2 je v tomto případě výběrový rozptyl: s2=^------------ n Ve výše uvedených vzorcích lze všechny neznámé přímo určit z hodnot atributů bodů. Jedinou doposud nedefinovanou neznámou zůstává míra podobnosti (blízkosti) polohy bodů i a 7, tedy hodnota wtí. Ta se běžně uvažuje jako inverzní hodnota vzdálenosti těchto bodů. Tedy podle výše uvedených předpokladů dáváme malou váhu hodně vzdáleným bodům a velkou váhu hodně vzdáleným bodům, tedy: Rozdíly mezi oběma indexy jsou dány způsobem výpočtu rozdílů mezi hodnotami atributu. Obor hodnot, kterých mohu oba indexy nabývat se tedy také liší, jak uvádí následující tabulka: Prostorové uspořádání Gearyho poměr C Moranův index I Shlukové uspořádání, sousední body vykazují podobné hodnoty 0E(I) Náhodné uspořádání, body nevykazují znaky podobnosti C~l I = E(I) Pravidelné uspořádání, sousední body vykazují rozdílné charakteristiky 1,+W,)2 i=\ í » y Vŕ=l Očekávané hodnoty Moranova indexu I a hodnoty rozptylu se pro náhodné uspořádání vypočtou obdobně: EN(I) = ER(I) = ^±-n-\ VAR W2(n2-l) L Ny n VAR n[(n2 -3n + 3^ - nS2 + W2 ] k[(n2 - n)S, - nS2 + 3W2 ] v y (n-\)(n-2)(n-3)W2 (n - \)(n - 2)(n - 3)W2 L R J Máme-li vypočteny očekávané hodnoty indexů a jejich rozptyly, můžeme vyjádnt standardizované hodnoty (Z-skore) I-E(I) VAR(I) nebo 16 C-EjC) VAR(C) Pro hodnoty Z pak mohou být použity stejné kritické hodnoty, tedy na hladině významnosti a=0,05: -1,96