Modelování prostorového uspořádání bodů (pattern detectors) Uspořádání bodů v prostoru Rozmístění bodů v prostoru je výsledkem určitých procesů či vhodných podmínek (lokace měst je výsledkem působení faktorů jako reliéf, přírodní zdroje, komunikace, atd.) Cílem studia prostorového rozmístění bodů je zjistit: • jak daleko má konkrétní rozmístění objektů k rozmístění teoretickému • jak se liší rozmístění bodů ve dvou různých oblastech • jak se mění rozmístění bodů v rámci jedné oblasti v čase. Statisticky prokázaný výskyt určitého prostorového uspořádání může být základem pro zjišťování příčin, které vedly k pozorovanému uspořádání. Základní typy prostorového uspořádání bodů * *£ LJJUUUULJ :;:;:;ffiffifflE ~OĽDľE[ľ i * t DDDDDDĽ .. JhnnnlTlr ' Shlukové (Clustered) • Pravidelné (Regular) • Náhodné(Random) Klasifikace prostorového uspořádání bodů 0 1 °» 0 • °. 0 • 0 1 0 • 1 ■ • 1 • • 1 1 • 1 • 1 0 • 0 1 0 0 • 0 • 0 • 0 • 1 • ° 1 0 • 0 • « • 0 i p • 0 • 1 0 • Body - Skóre 0-> 1 1 ->0 2-> 1 3->4 4->9 5-> 16 6->25 7->36 1 = 8 Klasifikace prostorového uspořádání bodů K16 I =(17;45) I>45 Pravidelné (Regular) Náhodné(Random) Shlukové (Clustered) Základní metody statistického popisu prostorového uspořádání bodů • Analýza kvadrátů -testujeme, zda rozmístění bodů v ploše je náhodné či nikoliv. • Metoda nejbližšího souseda - porovnává průměrnou vzdálenost mezi nejbližšími sousedy pole bodů k teoretickému rozmístění. • Prostorová autokorelace - měří jak podobné či nepodobné jsou hodnoty atributů sousedních bodů. 1 Problémy spojené s popisem prostorového uspořádání bodů • měřítko • rozsah studované oblasti • kartografická projekce Měřítko -je nutné vhodně zvolit tak, aby studovaný jev mohl být prezentován body v prostoru. Analýza kvadrátů • Je analyzováno rozdělení četností buněk s určitým počtem bodů. • Toto rozdělení je porovnáváno s náhodným rozdělením četností. • Extrémně shlukové uspořádání - většina bodů v jedné či několika málo buňkách. • Extrémně pravidelné - ve všech buňkách přibližně stejně • Buňky se označují jako kvadráty a nemusí jít o čtverce, ale např. i o kruhy či šestiúhelníky-je to dáno empirií. • V rámci jedné analýzy však tvar a velikost buněk musí být konstantní. Rozsah studované oblasti V závislosti na zvolené oblasti (často vymezené | administrativními hranicemi) se mění jak vzdálenosti mezi jednotlivými body, tak také charakteristiky jejich | prostorového uspořádání. - - - i --. . «Gtéveland 1 AÍrori"- D.i.lun •(.'úluinim.s 1 * Cincinnati" 1 Analýza kvž • Je založena n Je porovnáván či má blíže k uí • Studovaná pl je zjištěn počet idrátů (C a hodnoc o, zda roz spořádání Dcha je ro; bodů v ka 5UADRAT ANAL ení změn hustoty l nístění bodů v prosí shlukovému či pravi :dělena pravidelnou ždé buňce. YSIS) >odů v prostoru, oru je náhodné, dělnému. sítí na buňky a i YÍ c™„í,..»p í aj »catsup 1 TE tnt í jLxJ —. i . J / 'li. .> Analýza kvadrátů Modifikace metody - Při analýze lze buňky stejné velikosti také rozmístit náhodně po studované ploše. 2 Optimální velikost kvadrátů (QS) QS = — n A - plocha studované oblasti n - počet analyzovaných bodů. Velikost strany vhodného kvadrátu ■JWr Testování výsledků analýzy kvadrátů Získané rozložení četností bodů v kvadrátech (empirické) je porovnáváno s náhodným rozložením (teoretickým). Vhodným testem je např. K-S test nebo X2 test Testem můžeme kvantifikovat rozdíl empirického a teoretického (shlukové, pravidelné, náhodné) rozdělení bodů v ploše. Počet měst v každém čtverci Zjištěné Pravidelné rozdělení rozdělení Shlukové rozdělení 0 36 0 79 1 17 26 0 2 10 26 0 3 3 26 0 4 2 2 0 5 2 0 0 6 0 0 7 0 0 8 0 0 9 0 0 10 0 0 11 0 0 12 0 0 13 0 0 14 0 0 28 0 0 164 0 0 1 Zjišt šné rozdělení četnosti 164 městv kvadrátech v rozdělení četností teoretická e studované oblasti a Praktický postup testování výsledků analýzy kvadrátů 1. (HO) - neexistuje statistiky významný rozdíl (je-li rozdíl malý, může být výsledkem náhody, čím je větší, s tím větší pravděpodobností náhodný není, ale je statistiky významný). 2. Zvolíme hladinu významnosti a = 0,05 3. Vypočteme kumulované četnosti 4. Vypočteme testovací kritérium: D = max\Ol -E\ 5. Vypočteme kritickou hodnotu: Da 1,36 D =1,36 m1 + m1 6. Je-li vypočtená hodnota D větší než kritická hodnota Da potom rozdíl mezi oběma uspořádáními je statisticky významný. Testování výsledků analýzy kvadrátů K-S testem Počet měst v každém čtverci Zjištěné rozdělení Relativní Kumulativní Pravidelné rozdělení Relativní četnosti Kumulativní Absolutní diference 0 36 0 450 0 450 0 0 000 0 00 0 45 1 17 0 213 0 663 26 0 325 0 33 0 34 2 10 0 125 0 788 26 0 325 0 65 0 14 3 3 0 038 0 825 26 0 325 0 98 0 15 4 2 0 025 0 850 2 0 025 00 0 15 5 2 0 025 0 875 0 0 000 00 0 13 6 1 0 013 0 888 0 0 000 00 0 11 7 1 0 013 0 900 0 0 000 00 0 10 8 1 0 013 0 913 0 0 000 00 0 09 9 1 0 013 0 925 0 0 000 00 0 0ÍS 10 1 0 013 0 938 0 0 000 00 0 06 11 1 0 013 0 950 0 0 000 00 0 05 12 1 0 013 0 963 0 0 000 00 0 04 13 1 0 013 0 975 0 0 000 00 0 03 14 1 0 013 0 988 0 0 000 00 0 01 28 1 0 013 1 000 0 0 000 00 0 00 164 0 0 000 | 1 000 0 0 000 00 0 00 Testovací kritérium: D = 0,45 Kritická hodnota pro a =0,05: Da= 0,2115 Zamítáme nulovou hypotézu - rozdělení měst se statisticky významně liší od rozdělení pravidelného Testování pozorovaného rozložení bodů s rozložením náhodně generovaným (podle určitého teoretického rozdělení). Poissonovo rozdělení (Poisson random process) je určeno průměrnou frekvencí výskytu (X) v jednotlivých jednotkách (kvadrátech): x = n/ m - počet kvadrátů; n - počet bodů v prostoru Je-li x počet bodů v kvadrátu, potom pravdepodobnostvýskytu x bodů v kvadrátu podle Poissonova rozdělení je definována vztahem: P(X): e Z x\ Z uvedeného vztahu můžeme pro různá x vypočítat pravděpodobnost rozložení bodů, které budou mít Poissonovo (náhodné) rozdělení 3 Hodnoty průměru a rozptylu Poissonova rozdělení se rovnají hodnotě (X). Bude-li distribuce bodů v prostoru generována náhodným procesem, potom toto rozdělení má stejný průměr a rozptyl a jejich poměr se bude blížit jedné. Postup testování: 1. Vypočteme hodnoty průměru a rozptylu pro četnosti bodů v kvadrátech. 2. Hodnoty dáme do poměru, hodnotu porovnáme s 1. 3. Rozdíl lze standardizovat (vyjádřit v násobcích směrodatné odchylky). 4. Vyjde-li hodnota větší než 1,96, potom je rozdíl statisticky významný na hladině a= 0,05. Test založený na poměru průměru a rozptyluje silnější než K-Stest Lze ho však použít pouze v případě, že předpokládáme Poissonovo rozdělení studované množiny bodů. Testování výsledků analýzy kvadrátů vůči rozložení generovanému Po náhodným procesem (pro X = 2,05) sso novým Počet mést v Zjištěné Relativní Kumulativní každém čtverci rozdělen četnosti četnosti Pravdepodobnosti Poissonova rozd. Kumulativní četnosti Absolutní diference 0 I 36 | 0,450 | 0,450 0,1287 0,13 0,32 1 17 0,213 I 0,663 0,2639 0,39 0,27 2 10 0,125 0,788 0,2705 0,66 0,12 3 3 0,038 0,825 0,1848 0,85 0,02 4 2 0,025 0,850 0,0947 0,94 0,09 5 2 0,025 0,875 0,0388 0,98 0,11 6 0,013 0,888 0,0133 0,99 0,11 7 0,013 0,900 0,013 0,913 0,0039 0,001 1,00 1,00 0,10 0,09 8 9 0,013 0,925 0,0002 1,00 0,07 10 0,013 0,938 0 1,00 0,06 11 0,013 0,950 0 1,00 0,05 12 0,013 0,963 0 1,00 0,04 13 0,013 0,975 0 1,00 0,02 14 0,013 0,988 0 1,00 0,01 28 0,013 1,000 0 1,00 0,00 164 0 0,000 1,000 0 1,00 0,00 Testovací kritérium: D = 0,3213 Kritická hodnota pro a= 0,05: Da= 0,1520 Rozdíl mezi oběma uspořádáními je statisticky významný. Omezení analýzy kvadrátů: * • •• t • • *• * Analýza kvádr« atů neřeší otázku rozložení bodů u •nitř kvadrátů. Analýza nejbližšího souseda (NEARES T NEIGHBOUR ANAL YSIS) Metoda analýzy kvadrátů je založena na konceptu hustoty (počet bodů v ploše) Metoda analýzy nejbližšího souseda je naopak založena na konceptu vzdálenosti (spacing - plocha připadající na bod). Metoda analýzy nejbližšího souseda je založena na porovnání pozorované průměrné vzdálenosti mezi nejbližšími sousedy a této průměrné vzdálenosti u známého (teoretického) prostorového uspořádání (pravidelného či náhodného). Pravidelné uspořádání bodů Nejpravidelnější uspořádání- studovaná oblast je rozdělena sítí pravidelných šestiúhelníků a body v této oblasti tvoří jejich středy. Body lze pospojovat do sítě pravidelných trojúhelníků. Testovací kritérium Za výše uvedené konfigurace bude vzdálenost mezi body rovna: kde A je plocha a n počet bodů v ploše. K testování, zda má určité rozložení bodů v ploše jistý vzorek lze využít R statistiku (R - randomness). R statistika Určí se jako poměr mezi pozorovanou a očekávanou průměrnou vzdáleností nejbližších sousedů v určité oblasti: Hodnotu robs zjistíme tak, že určíme vzdálenost mezi daným bodem a všemi jeho sousedy. Dále najdeme nejkratší vzdálenost - tedy nejbližšího souseda. Tento proces se opakuje pro všechny body. Ze všech nejkratších vzdáleností se vypočte průměr. Hodnotu r zjistíme ze vztahu: Interpretace hodnot R statistiky Čím je hodnota R < 1, tím více se prostorové rozloženi bodů blíži rozloženi shlukovému (r0lJ< rexf). Čím je hodnota R > 1, tím více se prostorové rozloženi bodů blíži rozloženi pravidelnému (r0ĎS> reJ. R=1.48 PRAVIDELNÉ R = 0 zcela shlukové uspořádáni R = 1 náhodné uspořádáni R = 2,149 zcela pravidelné uspořádáni K hodnoceni rozdílu mezi pozorovanou a očekávanou vzdálenosti nejbližšího souseda lze využit tzv. směrodatné chyby (Standard Error -SE) 0,26136 SE=- Směrodatná chyba popisuje pravděpodobnost, že jakýkoliv rozdíl dvou hodnot je výsledkem náhodných vlivů. Je-li zjištěná diference malá ve srovnáni s SE, potom rozdíl není statisticky významný a naopak. Za statisticky významný považujeme rozdíl, který můžeme obdržet v pěti případech ze sta - tedy s pravděpodobnosti 5 %, a=0,05. Vyjádřeno v násobcích směrodatné chyby - rozdíl mezi dvěma populacemi považujeme za statisticky významný, jestliže je menši než -1,96SEr a nebo větši než +1.96SE;. Pravděpodobnost (<95%) = (-1.96SE; +1.96SEJ Standardizace hodnot rozdílů Pomoci směrodatné chyby lze vypočítat standardizovanou hodnotu (Z-score): ^p — SE, Je-li tedyZR < -1,96 či ZR > 1,96 potom vypočtený rozdíl mezi pozorovaným a náhodným uspořádáním je statisticky významný -tedy není náhodný a naopak. Problémy spojené s metodou analýzy nejbližšího souseda: • Nelze spoléhat na vizuální srovnáni prostorového rozloženi ani na vypočtenou hodnotu R. Ta by měla být doplněna hodnotou ZR pro ověřeni statistické významnosti pozorovaného rozdílu. • Metoda analýzy nejbližšího souseda může být rozšířena na analýzu nejbližších sousedů druhého, třetího a vyšších řádů. • Výsledky jsou vysoce citlivé k měřítku (lokální vs. regionální) • V závislosti na studovaném jevu musí být věnována pozornost vymezeni studované plochy (administrativní či přirozené hranice). Metoda nejbližšího souseda - problém definice hranic studované oblasti (boundary effect) 5 Metoda nejbližšího souseda - problém definice hranic studované oblasti (boundary effect) •""""~"^ \ 3 3/ \ 2 J 6 R =2.167 ^ R =1.323 Pomocí SE převedeme R na Z= standardizovanou hodnotu (Z skoré) 7 00/0 ^ coo ^ tendence k pravidelnému CT e rozloženi bodu „ „„ ^ _, . ._ ^ HO zamítáme. Prokázali 2,99 ~~► Z > 1.96 -► .... , .. , jsme pravidelne rozmístěni bodů Boundary effect? Co když nemáme jinou informaci než tu ze studované oblasti? Simulace • HO - rozmístění bodů je náhodné • V prostoru 7x6 simulujeme náhodné rozmístění 6-ti bodů • Pro každý náhodný pokus vypočteme R0 • Zopakujeme to 10 000 krát, dostaneme průměrné R =1.62 >RQ>Re(R=1,323) Proč? • 10 000 hodnot Ro seřadíme od největší po nejmenší • Najdeme 9 500 největší hodnotu R0 = 2,29 (tedy jen v pěti procentech případu bychom dostali hodnotu R0 větší než 2,29) • R0pro našich původních 6 bodů bylo jen 2.176- tedy takovouto hodnotu bychom dostali časteji než jen v 5% případů • Proto Ho přijímáme. • Simulací jsme zjistili, že rozdělení bodů ve studovaném prostoru se od rozdělení náhodného významně neliší • Princip simulace metodou Monte Carlo 6