GEOSTATISTIKA - vymezení pojmu • V užším slova smyslu - skupina interpolačních algoritmů založených na metodě krigingu. • V širším slova smyslu - statistická analýza prostorově lokalizovaných dat. Pomocí „klasických" statistických metod lze vhodně analyzovat především atributová data -jejich kvantitativní či kvalitativní vlastnosti. Velmi omezeně však jimi lze charakterizovat prostorové vlastnosti objektů a jevů. Prostorové vlastnosti jako např. spojitost jevů, prostorovou autokorelaci, prostorové uspořádání (strukturu) lze charakterizovat právě pomocí geostatistických metod. r 1 : J" \ I ^ Ľ A n (.-.MIH 1X17,1 L"ií"i| Avnrw 1..... hxlqo Ni .Lib Lil ij ])i-vLiriiiiL 30u00 ,11011 MnJLiL |[H].:STh . LH |Y[.i-|rii|,- T:tv\ 7.) H ■■II IVrnriHÜ.' IJ.^.L-L -. - Prezentace prostorového rozšíření spojitého jevu metodami popisné statistiky 4 * k i i 1 í i i i i í i i—n Prezentace prostorového rozšíření spojitého jevu metodami geostatistiky (tzv. semivariogram) GEOSTATISTIKA - vymezení pojmu • Statistický popis prostorově lokalizovaných dat (geografických objektů) • Statistický popis prostorového uspořádáni objektů (bodů, linií, ploch) • Koncept prostorové autokorelace • Strukturní analýzu a popis prostorové autokorelace strukturními funkcemi • Konstrukci spojitých polí metodami krigingu • Objektivní metody klasifikace jevů Statistický popis bodů Body představují nejčastější způsob prezentace geografických jevů. Body jsou zpravidla umísťovány v těžišti objektů. To, jaké geografické objekty lze popsat pomocí bodů (tedy stupeň abstrakce) závisí na měřítku, ale také na druhu analýzy Napr. pro modelování optimálního spojení v síti sídel je vhodné je prezentovat centroidem, který tvoří uzel sítě). Výpočet popisné statistiky často předchází použití geostatistických metod. Umožňuje totiž ověřit některé vlastnosti studovaných souborů, které jsou pro aplikaci metod geostatistiky nezbytné. Jedná se o ověření takových vlastností jako je normalita rozdělení, stacionarita, linearita vztahu dvou veličin apod. Charakteristiky polohy Charakteristiky polohy slouží k určovaní geografického středu či mediánu. Průměrný střed (mean centre) Průměrný střed leží na průměru souřadnic X a Y. Má stejné nevýhody jako aritmetický průměr - je to především citlivost na extrémní hodnoty. Například v případě shlukového uspořádání bodů průměrný střed dobře nereprezentuje množinu bodů. (•t,c,}'«)= 'z^ry Kde Xp y; jsou souřadnice bodu i a nje počet bodů. Vážený průměrný střed (weighted mean centre) Používá se v případě výskytu více událostí/objektů na stejném místě. Pak má každý bod váhu přímo úměrnou počtu událostí/objektů na tomto místě. Např. při výpočtu prostorového průměru několika měst bude průměrný střed dávat realističtější představu o centrální tendenci jestliže ho budeme vážit počtem obyvatel jednotlivých měst (nebo -koncentrací znečišťující látky v jednotlivých místech či frekvencí výskytu určitého jevu ). (XWmc,yWmc): A kde iv( jsou váhy jednotlivých bodů. Mediánový střed (Median Center) 1. najdeme medián na ose X a Y a vedeme z nich linie kolmé na směr osy. Takto definovaný „medián ze souřadnic" ale nemusí odpovídat mediánu souboru bodů, protože distribuce nemusí být mezi kvadranty vyrovnaná. 2. (UK) - Mediánový střed je střed, kterým se studovaná plocha dělí do čtyř kvadrantů, z nichž každý obsahuje stejný počet bodů. 3. (US) - Mediánový střed jako střed vyžadující minimální (nejkratší) cestu. Tj. celková vzdálenost z mediánového středu do každého z bodů je minimální. Jinak řečeno - cesta z jakéhokoliv jiného místa do všech bodů oblasti bude delší než cesta z mediánového středu. Tuto podmínku lze vyjádřit vztahem: ,------------------------ kde xtSL yt jsou souřadnice jednotlivých bodů a u, v jsou souřadnice mediánového středu. Analogickým způsobem lze definovat tzv. vážený mediánový střed: _______________ Váhy ft pro jednotlivé body mohou být negativní či pozitivní podle toho, zda daný bod přitahuje či naopak odpuzuje polohu mediánového středu Charakteristiky rozptylu Směrodatná vzdálenost [standard distance) SD-- Vážená směrodatná vzdálenost (weighted standard distance) 'ZlJ.ix, - xmc? + 'ElJiy, - ymc)2 H.J. Směrodatná vzdálenost je nejčastěji používána ve formě kružnice kolem průměrného středu (Standard distance circle), jejíž poloměr je právě hodnota směrodatné vzdálenosti. Různé směrodatné vzdálenosti pro různý typ jevů lze zakreslovat do stejného území. Tyto kružnice nám dávají představu o rozptylu hodnot kolem střední hodnoty pro jednotlivé typy jevů. Mohou být použity i pro studium dynamiky jevů (různé kružnice pro jeden jev v různých časových horizontech). Poloha váženého průměrného středu a kružnice směrodatné vzdálenosti pro pět měst ve státě Ohio. Jako váhy byl použit počet obyvatelstva MASS MOVEMENTS OF LAND USE SURFACES LONDON, ONTARIO 1850-1960 land for 1850-1875 ind Land Use Surfaces Residential ( " ) Mean locations of land use surfaces Public - Institutional (t>) .--. Direction of Commercial ( c ) Peak value Industrial (i ) intersection: 1960 Směrodatná vzdálenost největších měst vážená počtem jejich obyvatel SD = 8,849 SD = 3,277 Absolutní standardní vzdálenost lze vážit plochou porovnávaných států: 0,027 0,238 2 Modelování prostorového uspořádání bodů Rozmístění bodů v prostoru je výsledkem určitých procesů či vhodných podmínek (lokace měst je výsledkem působení faktorů jako reliéf, přírodní zdroje, komunikace, atd.) Cílem studia prostorového rozmístění bodů je zjistit: • jak daleko má konkrétní rozmístění objektů k rozmístění teoretickému • jak se liší rozmístění bodů ve dvou různých oblastech • jak se mění rozmístění bodů v rámci jedné oblasti v čase. Statisticky prokázaný výskyt určitého prostorového uspořádání může být základem pro zjišťování příčin, které vedly k pozorovanému uspořádání. Základní typy prostorového uspořádání bodů ****** -»i *******! ****** J ****** H□□□□□□□ .*..*. ^nnnnnn ■ * *^* ** * * • Shlukové (Clustered) • Pravidelné (Regular) • Náhodné(Random) Základní metody statistického popisu prostorového uspořádání bodů • Analýza kvadrátů - testujeme, zda rozmístění bodů v ploše je náhodné či nikoliv. • Metoda nejbližšího souseda - porovnává průměrnou vzdálenost mezi nejbližšími sousedy pole bodů k teoretickému rozmístění. • Prostorová autokorelace - měří jak podobné či nepodobné jsou hodnoty atributů sousedních bodů. Problémy spojené s popisem prostorového uspořádání bodů • měřítko • rozsah studované oblasti • kartografická projekce Měřítko -je nutné vhodně zvolit tak, aby studovaný jev mohl být prezentován body v prostoru. Rozsah studované oblasti V závislosti na zvolené oblasti (často vymezené administrativními hranicemi) se mění jak vzdálenosti mezi jednotlivými body, tak také charakteristiky jejich prostorového uspořádání. .,.-, 1 T - .Gféveland . Akrori*- : ' -Columbus •Ciftcinoati" C í? vv ri \ f Kartografická projekce Projekce se volí podle účelu (viz. analýza kvadrátů). Projekcí se mění tvar, vzdálenosti, vzájemná poloha objektů. Čím větší studovaná oblast, tím větší bude role zvolené projekce. 3 Analýza kvé • Je založena n Je porovnáván či má blíže k us • Studovaná pl< je zjištěn počet idrátů (QUADRAT AN a hodnocení změn husto 3, zda rozmístění bodů v p »pořádání shlukovému či p 3cha je rozdělena pravidelr bodů v každé buňce. AL tyt rošt avi 10 u YSIS) jodů v prostoru, oru je náhodné, dělnému. sítí na buňky a ] ■ ■ " -' - ľ ILfc ř .-.: ''' - ^: ■■. :. ■ * ■ 'i ■ ■ • ■ Analýza kvadrátů • Je analyzováno rozdělení četností buněk s určitým počtem bodů. • Toto rozdělení je porovnáváno s náhodným rozdělením četností. • Extrémně shlukové uspořádání-většina bodů v jedné či několika málo buňkách. • Extrémně pravidelné -ve všech buňkách přibližně stejně • Buňky se označují jako kvadráty a nemusí jít o čtverce, ale např. i o kruhy či šestiúhelníky - je to dáno empirií. • V rámci jedné analýzy však tvar a velikost buněk musí být konstantní. Optimální velikost kvadrátů (QS) QS = — n A - plocha studované oblasti n - počet analyzovaných bodů. Velikost strany vhodného kvadrátu ^jlA/n Získané rozložení četností bodů v kvadrátech (empirické) je porovnáváno s náhodným rozložením (teoretickým). Vhodným testem je např. K-S test. Testování výsledků analýzy kvadrátů oblasti a Počet měst v každém čtverci Zjištěné Pravidelné Shlukové rozdělení rozdělení rozdělení 0 36 0 79 1 17 26 0 2 10 26 0 3 3 26 0 4 2 2 0 5 2 0 0 6 0 0 7 0 0 8 0 0 9 0 0 10 0 0 11 0 0 12 0 0 13 0 0 14 0 0 28 0 0 164 0 0 1 Zjišt ěné rozdělení četnosti 164 měst v kvadrátech ve studované rozdělení četností teoretická Praktický postup testování výsledků analýzy kvadrátů 1. (HO) - neexistuje statistiky významný rozdíl Qe-li rozdíl malý, může být výsledkem náhody, čím je větší, s tím větší pravděpodobností náhodný není, ale je statistiky významný). 2. Zvolíme hladinu významnosti a = 0,05 3. Vypočteme kumulované četnosti 4. Vypočteme testovací kritérium: D = max\Ol -E\ „ 1,36 „ , ., \m1 + m1 5. Vypočteme kritickou hodnotu: JJa = ~r= ua-^sb,\--------- Vm V "Vm2 6. Je-li vypočtená hodnota D větší než kritická hodnota Da, potom rozdíl mezi oběma uspořádáními je statisticky významný. Testování výsledků analýzy kvadrátů K-S testem Testovací kritérium: Kritická hodnota pro a = 0,05: 0,45 = 0,2115 Počet měst v každém čtverci Zjištěné rozdělení četnosti če lativní Pravidelné rozdělení Relativní Kumi četnosti čel lativní ice' ľc"' 0 36 0 450 0 450 0 0 000 0 00 0 45 1 17 0 213 0 663 26 0 325 0 33 0 34 2 10 0 125 0 788 26 0 325 | 0 65 0 14 3 3 0 038 0 825 26 0 325 0 98 0 15 4 2 0 025 0 850 2 0 025 | 1 00 0 15 5 2 0 025 0 875 0 0 000 | 1 00 0 13 6 0 013 0 888 0 0 000 1 00 0 11 7 0 013 0 900 0 0 000 | 1 00 0 10 8 0 013 0 913 0 0 000 | 1 00 0 09 9 o 013 0 925 0 0 000 1 00 ° 08 10 ° 013 | 0 938 0 0 000 1 00 ° 06 11 0 013 | 0 950 0 0 000 1 00 0 05 12 o 013 0 963 0 0 000 1 00 ° 04 13 o 013 0 975 0 0 000 1 00 ° 03 14 0 013 0 988 0 0 000 1 00 0 01 28 0 013 1 000 0 0 000 1 00 0 00 164 0 0 000 1 000 0 0 000 1 00 | 0 00 Zamítáme nulovou hypotézu - rozdělení měst se statisticky významně liší od rozdělení pravidelného 4 Testování výsledků analýzy kvadrátů Poissonovo rozdělení (Poisson random process) je určeno průměrnou frekvenci výskytu (X) v jednotlivých jednotkách (kvadrátech): m m - počet kvadrátů; n - počet bodů v prostoru Hodnoty průměru a rozptylu Poissonova rozdělení se rovnají hodnotě (X). Bude-li distribuce bodů v prostoru generována náhodným procesem, potom toto rozdělení má stejný průměr a rozptyl a jejich poměr se bude blížit jedné. Postup testování 1. Vypočteme hodnoty průměru a rozptylu pro četnosti bodů v kvadrátech. 2. Hodnoty dáme do poměru, hodnotu porovnáme s 1. 3. Rozdíl lze standardizovat (vyjádřit v násobcích směrodatné odchylky). 4. Vyjde-li hodnota větší než 1,96, potom je rozdíl statisticky významný na hladině a= 0,05. Test založený na poměru průměru a rozptylu je silnější než K-S test Lze ho však použít pouze v případě, že předpokládáme Poissonovo rozdělení studované množiny bodů. Testování výsledků analýzy kvadrátů vůči rozložení generovanému Poissonovým náhodným procesem (pro X= 2,05) Počet měst v každém čtverci jištěné rozdělen Relativní četnosti Kumulativní četnosti Pravděpodobnosti Poissonova rozd. Kumulativní četnosti Absolutní diference 0 36 0,450 0,450 0,1287 0,13 0,32 1 17 0,213 0,663 0,2639 0,39 0,27 2 10 0,125 0,788 0,2705 0,66 0,12 0,02 0,09 0,11 0,11 0,10 0,09 0,07 0,06 0,05 0,04 0,02 0,01 0,00 0,00 3 3 0,038 0,825 0,1848 0,85 4 2 0,025 0,850 0,0947 0,94 5 2 0,025 0,875 0,0388 0,98 6 0,013 0,888 0,0133 0,99 7 0,013 0,900 0,0039 1,00 8 0,013 0,913 0,001 1,00 9 0,013 0,925 0,0002 1,00 10 0,013 0,938 0 1,00 11 0,013 0,950 0 1,00 12 0,013 0,963 0 1,00 13 0,013 0,975 0 1,00 14 0,013 0,988 0 1,00 28 0,013 1,000 0 1,00 164 0 0,000 1,000 0 1,00 Testovací kritérium: Kritická hodnota pro a = 0,05: Rozdíl mezi oběma uspořádáními je stati D = 0,3213 Da= 0,152 ticky významný D Omezení analýzy kvadrátů: • 4 t * •• * • * * * Analýza kvadré stu neřeší otázku rozložení bodů uvnitř kvadrátů. Pra sto rov« uspořádáni n+JHdnatáJsreh si dři okr tí u Jindřichův Hradec Pravl04lna láWuhalmvova iťpouKTjoro Kvadrátovou analýzu í»sHi]h«lniVň¥Í tií 10 ntjliJriíltjfccG Délka strany buňky (šestiúhelník) = 11433,4 m Lambda (průměrný počet bodů v šestiúhelníku) =1, Rozptyl = 1,( Poměr (rozptyl/průměr) = 1,84932 Testovací kritérium K-S testu = 0,182121 Kritická hodnota K-S testu (na hladině významnosti 0,05) = 0,294 Analýza nejbližšího souseda (NEAREST NEIGHBOUR ANALYSIS) Metoda analýzy kvadrátů je založena na konceptu hustoty (počet bodů v ploše) Metoda analýzy nejbližšího souseda je naopak založena na konceptu vzdálenosti (spacing - plocha připadající na bod). Metoda analýzy nejbližšího souseda je založena na porovnání pozorované průměrné vzdálenosti mezi nejbližšími sousedy a této průměrné vzdálenosti u známého (teoretického) prostorového uspořádání (pravidelného či náhodného). Pravidelné uspořádání bodů Nejpravidelnější uspořádání - studovaná oblast je rozdělena sítí pravidelných šestiúhelníků a body v této oblasti tvoří jejich středy. Body lze pospojovat do sítě pravidelných trojúhelníků. R statistika (R - randomness) Určí se jako poměr mezi pozorovanou a očekávanou průměrnou vzdáleností nejbližších sousedů v určité oblasti: o _ obs Hodnotu robs zjistíme tak, že určíme vzdálenost mezi daným bodem a všemi jeho sousedy. Dále najdeme nejkratší vzdálenost - tedy nejbližšího souseda. Tento proces se opakuje pro všechny body. Ze všech nejkratších vzdáleností se vypočte průměr. Hodnotu r zjistíme ze vztahu: kde A je plocha a n počet bodů v ploše. Interpretace hodnot R statistiky Čím je hodnota R < 1, tím více se prostorové rozloženi bodů blíži rozloženi shlukovému (rob< reJ. Čím je hodnota R > 1, tím více se prostorové rozloženi bodů blíži rozloženi pravidelnému (robs > reJ. R-1AB PRAVIDELNÉ ■ R = 0 zcela shlukové uspořádáni R = 1 náhodné uspořádáni R = 2,149 zcela pravidelné uspořádáni K hodnoceni rozdílu mezi pozorovanou a očekávanou vzdálenosti nejbližšího souseda lze využit tzv. směrodatné chyby (Standard Error -SE) SE, 0,26136 Směrodatná chyba popisuje pravděpodobnost, že jakýkoliv rozdíl dvou hodnot je výsledkem náhodných vlivů. Je-li zjištěná diference malá ve srovnáni s SE, potom rozdíl není statisticky významný a naopak. Za statisticky významný považujeme rozdíl, který můžeme obdržet v pěti případech ze sta - tedy s pravděpodobnosti 5 %, a=0,05. Vyjádřeno v násobcích směrodatné chyby - rozdíl mezi dvěma populacemi považujeme za statisticky významný, jestliže je menši než -1,96SEr a nebo větši než +1,96SE;. Pravděpodobnost (<95%) = (-1.96SE; +1.96SE) Standardizace hodnot rozdílů Pomoci směrodatné chyby lze vypočítat standardizovanou hodnotu (Z-score): z, = - Je-li tedyZR < -1,96 či ZR > 1,96 potom vypočtený rozdíl mezi pozorovaným a náhodným uspořádáním je statisticky významný - tedy není náhodný a naopak. Problémy spojené s metodou analýzy nejbližšího souseda: • Nelze spoléhat na vizuální srovnáni prostorového rozloženi ani na vypočtenou hodnotu R. Ta by měla být doplněna hodnotou ZR pro ověřeni statistické významnosti pozorovaného rozdílu. • Metoda analýzy nejbližšího souseda může být rozšířena na analýzu nejbližších sousedů druhého, třetího a vyšších řádů. • Výsledky jsou vysoce citlivé k měřítku (lokální vs. regionální) • V závislosti na studovaném jevu musí být věnována pozornost vymezeni studované plochy (administrativní či přirozené hranice). 6 Modelování prostorového uspořádání bodů s využitím prostorové autokorelace (SPATIAL AUTOCORRELATION) Koncept prostorové autokorelace Jak analýza kvadrátů tak analýza vzdálenosti nejbližšího souseda pracují pouze s polohou bodů. Nerozlišují body podle hodnot jejich atributů. Oba parametry (polohu i atributy) hodnotí prostorová autokorelace (SA) - je tedy metodou vhodnější. Východiska prostorové autokorelace: Většina jevů se v prostoru mění spojitě. Blízké body budou mít i podobné hodnoty studovaného jevu a naopak. (First law of geography -Tobler, 1970) Koeficienty prostorové autokorelace Míry prostorové autokorelace kombinují v jednom výrazu míry podobnosti atributů i míry podobnosti polohy. Mezi nejpoužívanější koeficienty prostorové autokorelace náleží: • Gearyho poměr C (Geary's Ratio) • Moranův index I (Moran's I) Lze jich využít pro intervalová a poměrová data. Moranův index I - příklad Průměrný příjem Moran's I: 0,66 Náhodná proměnná Moran's I: 0,012 Míry prostorové autokorelace C-W- j=\ '] '] c- - podobnost atributu v bodě iaj wf - vzdálenost bodu / a/ w„ = 0 pro všechny body x,- hodnota studovaného atributu v bodě / n - počet bodů ve vyšetřovaném vzorku Koeficienty prostorové autokorelace Koeficient prostorové autokorelace - SAC (spatial autocorrelation coefficient) je úměrný vážené míře podobnosti atributů bodů -obecně: SAC> 7 Gearyho poměr C: íěru si )dle ní cij=(xi-xjY V případě Gearyho poměru se podobnost hodnot atributu mezi dvěma body vypočte podle následujícího vztahu: n2 kde o2 je rozptyl hodnot atributu x s průměrem x (»-!) Moranův index I V případě Moranova indexu se podobnost hodnot atributu v bodech /a; vyjádři následovně: ^ = ^ _ ^. (^ _ ^ /= „Urf----------= JiJrf------------------------------ *2ZZ-9 *2ZZ 1=1 J=l 1=1 j=\ kde s2 je v tomto případě výběrový rozptyl: Ti*,-*)2 Definování míry podobnosti polohy bodů Podobnost polohy bodů iaj, -hodnota viif se urči jako inverzní hodnota vzdálenosti těchto bodů. Tedy podle výše uvedených předpokladů dáváme malou váhu hodně vzdáleným bodům a velkou váhu bodům blízkým tedy: Modifikovat lze také váhy vzdálenosti bodů výrazem: w = 1/. kde koeficient b může nabývat různých hodnot v závislosti na povaze studovaného problému (vzdálenost měřená dosažitelnosti autem a letadlem je jiná). Hodnota b je často rovna 2. Obor hodnot koeficientů prostorové autokorelace Rozdíly mezi oběma indexy jsou dány způsobem výpočtu rozdílů mezi hodnotami atributu. Obor hodnot, kterých mohu oba indexy nabývat se tedy také liší, jak uvádí následující tabulka: Prostorové uspořádáni Gearyho poměr C Moranův index I Shlukové uspořádáni, sousední body vykazuji podobné hodnoty 0E(I) Náhodné uspořádání, body nevykazuji znaky podobnosti C-1 I E(l) Pravidelné uspořádání, sousední body vykazují rozdílné charakteristiky 1