GIS4SG I – Základní stavební kameny prostorové analýzy a prezentace dat podzim 2020 Petr Kubíček a Pavel Pospíšil kubicek@geogr.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Prerekvizity – na co navazujeme? • Z0262 Geoinformatika – základní technologické znalosti a dovednosti. • Z2062 Geografická kartografie – základní znalosti o tvorbě a podstatě map. • Tvorba tematických map • Kartografické modelování... Osnova Základní teoretické okruhy + cvičení v ArcGIS. Struktura 2/1 – hodina bude zahrnovat přednášku a diskuzi 1-2 článků vztahujících se k tématu. 1. Úvod do geoinformační problematiky v sociální geografii 2. Vizualizace časoprostorových dat. 4. Alokační úlohy; 5. Geomarketing; 6. Analýzy kriminality; 7. Aplikace geoinformačních analýz v epidemiologii. Literatura - knihy • WORTLEY, R.,MAZEROLLE , L.G. (2008): Environmental criminology and crime analysis. • OKABE, A. (2006): GIS-based studies in the humanities and social sciences. • PARKER, R. N., ASENCIO, E.K. (2008): GIS and spatial analysis for the social sciences : coding, mapping and modeling. • Vybrané doporučené články - viz přednášky. Organizace a ukončení • Zkouška – ústní zkouška. • Cvičení tvoří nedílnou část známky z předmětu. • Cvičení – viz podmínky Mgr. Pavel Pospíšil • Projektová práce v týmu v rámci cvičení, závěrečný poster, využití „peer review“. GIS4SG Jaká je budoucnost GIS? https://youtu.be/lY2_3th-Axk MAKING SENSE OF THE DATA Typa a klasifikace dat (upraveno podle Miklín, Dušek, Krtička, Kaláb ; 2018) Typ dat • Nominální data (typ krajinneho krytu – les,travní porost, orna půda aj.) můžeme pojmenovat, ale není možno je porovnávat a provádět s nimi matematické operace. • Ordinální data (příkladem může byt vzdělaní – základní, střední, vysokoškolské) mají pořadí (můžeme je seřadit – co je větší, kvalitnější apod.), avšak nemůžeme s nimi provádět matematické operace. • Intervalová data • Poměrová data Klasifikace dat – možnosti a jejich uplatnění v GIS • Manuální klasifikace dat • Rovnoměrné intervaly • Metoda kvantilů • Metoda přirozených zlomů (Jenks natural breaks) • Metoda směrodatné odchylky (Standard Deviation) • Geometrické intervaly (Geometrical intervals) Manuální klasifikace dat Manuální klasifikaci dat je vhodné použít, když je třeba: • vizualizovat data podle předem definovaných kritérii, např. aby byla srovnatelná s předchozími daty nebo odpovídají dohodnutým standardům (sklon); • upravit hranice na zaokrouhlené hodnoty – běžný krok v kartografii, kdy obecné hranice třid dané následujícími metodami posouváme na nejbližší „rozumné“ hodnoty; • třídit data na určitou část hodnot, které jsou nad a pod prahovou hodnotou, např. vztažené k celostátnímu průměru; • izolovat určitou část hodnot a tím pádem je ve výsledku zvýraznit nebo potlačit. Rovnoměrné intervaly • Zadavá se počet intervalů a data jsou automaticky rozdělena do intervalů o stejnem rozsahu. • Nerovnoměrná distribuce dat = různý počet prvků v jednotlivých třidách (možná i 0), • V hraničních třídách se vyskytují většinou málo četné extrémní hodnoty, je toto rozděleni vhodné pravě pro jejich zvýrazněni. • Pokud bychom chtěli sledovat proměny, respektive rozmístěni daného jevu v různém časovém období, je nutné data relativizovat (procenta). • Vhodné pro laiky a mapování souvislých jevů. • Není vhodné, pokud je rozděleni dat zešikmené, data ve shlucích nebo existují v datech příliš odlehle hodnoty. Metoda kvantilů (Quantile) • Metoda rozděluje data do tříd stejným počtem prvků ve třidach. Znamena to tedy, že třidy nejsou stejně široké, ale obsahuji stejny počet prvků. • Metoda je vhodná pro zvýraznění změn u střednich hodnot v datovem souboru. • Metodu je vhodné použít v případě, kdy jsou data linearně distribuovana s přiměřeným počtem prvků s podobnymi hodnotami nebo pokud se vyskytuji extrémní hodnoty. • Metoda je nevhodná v případech velkého množství prvků s podobnými hodnotami, neboť se může stát, že dvě sousedící třídy budou obsahovat velmi podobna data, a u zešikmených dat, kdy se přibližně stejné hodnoty budou jevit jako rozdílné. • Výhoda teto klasifikace se projevuje i v grafické časti mapy. Např. u kartogramu má každá barva stupnice stejné zastoupeni počtu územních jednotek v mapě – mapa je pak graficky vyvážená. • Mapované areály by měly být přibližně stejně velké. Metoda přirozených zlomů Jenks natural breaks • Metoda hledá přirozené změny a seskupeni v datech a vytváří třídy na základě těchto přirozených skupin. Hranice tříd jsou definovány v místech s relativně velkými rozdíly v datech • Jedna se o univerzální klasifikační metodu, vhodnou pro většinu dat a začátečníky bez hlubší znalosti klasifikačních metod. • Klasifikace je zde vázaná na konkrétní data, není proto vhodná pro porovnávaní vice map sestavených z různých datových souborů (např. sledování vývoje daného jevu za určitá období). Metoda směrodatné odchylky (Standard Deviation) • Metoda vytváří třídy jako podíly směrodatné odchylky nad a pod průměrem dat, neboli ukazuje, jak moc se data odchyluji od průměru. • Uživatel má možnost specifikovat velikost tříd (rovnoměrné intervaly) výběrem časti (podílu) směrodatné odchylky (1, ½). • Metodu je vhodné použit v případech, kdy je třeba reflektovat, jak daleko se hodnoty odchyluji od průměru (např. regiony s podprůměrnou a nadprůměrnou nezaměstnanosti). Normální rozdělení. • Není vhodná v případě velkého počtu extrémních hodnot. Geometrické intervaly Geometrical intervals • Metoda Geometrical intervals byla specialně vyvinuta firmou Esri pro spojitá data (hodnoty se mění plynule, typickým příkladem může byt teplota) a je alternativou k metodam přirozených zlomů nebo kvantilů. • Hlavnim přinosem teto metody je, že pracuje velmi dobře s daty, ktera nejsou normálně rozdělena, respektive jsou velmi zešikmena. • Metoda definuje nejužší třídu a šířky ostatních třid odvozuje pomoci proměnlivého násobného faktoru. Klasifikační schémata shrnutí Rovnoměrné intervaly Metoda směrodatné odchylky Metoda přirozených zlomů Metoda kvantilů Modelování, model • Modelování = prostředek poznávacího procesu • Model = zjednodušené zobrazení skutečnosti, části objektivní reality či jevu. • Model zobrazuje pouze vybrané znaky předlohy, které nás zajímají v konkrétním případě zkoumání, od ostatních vlastností se upouští. • Účel modelu – rozhoduje o zobrazovaných vlastnostech • Různé typy modelů – mapa, databáze, datový model, GIS model. Datové modely v GIS (?) OPAKOVÁNÍ: • Základní typy datových modelů • Geometrická primitiva • Topologie - principy a projevy v jednotlivých datových modelech. • Výhody a nevýhody Základní operace • Geometrické, dotazovací a vzdáleností operace = prostorové analýzy. • Základní stavební komponenty většiny GIS SW (ArcGIS, MapInfo, QGIS…). • Definovány prostřednictvím de facto/de jure standardů. • OGC, W3C, ISO. • Příklady GIS4SG GEOMETRICKÉ A RELAČNÍ OPERACE Geometrické operace Operace pro vektorové prvky či skupiny buněk v rastrovém datovém modelu – řada prostorových vlastností – délka, plocha. Představíme základní geometrické atributy, které lze využít. Jsou dvojího druhu: - Vnitřní – součást atributové tabulky pro všechny geometrické prvky. - Vnější – je nutné vypočítat a doplnit pro všechny prvky (součást SW nebo výpočetní vzorec). - Pokud je třeba provádět s geometrickými vlastnostmi nějaké další operace (seřadit podle plochy, plocha x obvod), je vhodné si explicitně vytvořit vlastní pole. Délka a plocha - vektor • Eukleidovský prostor (jaké jsou předpoklady?) • Lichoběžníkové pravidlo: • Pro 4 vrcholy A,B,C,D: • Obecně: Délka a plocha - rastr • Dáno velikostí buňky a počtem řádků a sloupců. • Plocha = počet buněk; vymezení celistvé plochy (otvory, homogenity, celistvost hranic) • Vzdálenost – dle typu povoleného pohybu – Manhattan, diagonální pohyb. Jak jsou reprezentovány atributové složky plochy? Středy a centroidy • Odlišné podle SW, odlišné pro geometrii (bod, linie, plocha a jejich skupiny). • Průměrný střed (M1), těžiště (gravitační střed) – centroid (M2), střed MBR (M3). • MBR střed – rychlý, ale citlivý k odlehlým vrcholům (B(14,3). Linie – bod stejně vzdálený oběma hraničním bodům (počátku a konci) Potenciální problémy • Komplexní tvar polygonů – centroidy mohou ležet mimo polygon. • ArcGIS – Feature to points (INSIDE option on). Prostorové úlohy – teorie a ukázky • Co je uvnitř? • Jak je blízko? • Jaká je hustota/intenzita jevu? • Jak se jev mění v čase? Co je uvnitř? Ruční výběr Prostorový dotaz (predikát) Topologické překrytí (overaly) Prostorové predikáty – ve zkratce  Hranice – vnitřky – vnějšky – bod, linie, plocha. • Equal vrací TRUE pokud jsou hranice a vnitřky geometrických objektů shodné. • Disjoint vrací TRUE pokud se hranice a vnitřky geometrických objektů neprotínají. • Intersectvrací TRUE pokud mají geometrické objekty nenulový průnik. • Touch vrací TRUE pokud se hranice geometrických objektů protínají ale vnitřky ne. • Cross vrací TRUE pokud povrch protíná vnitřek geometrického objektu v křivce. • Within vrací TRUE pokud se vnitřek objektu neprotíná s vnějškem jiného. • Contains vrací TRUE pokud geometrický objekt obsahuje jiný objekt. • Overlap vrací TRUE pokud mají vnitřky geometrických objektů nenulový průnik. Analytické a modelovací metody – OGC simple feature specs GIS4SG GIS4SG GIS4SG Prostorové predikáty - příklad Prostorové predikáty - příklad Contains v ArcGIS • CONTAINS: Selects features in the input feature layer that contain a feature in the selecting features layer. The selecting features can be inside as well as on the boundary of the input feature layer. • COMPLETELY_CONTAINS: Selects features in the input feature layer that contain a feature in the selecting features layer, as long as the feature in the selecting features layer does not intersect the boundary of the input feature layer. • CONTAINS_CLEMENTINI: The results are identical to CONTAINS with the exception that if the feature in the selecting features layer is entirely on the boundary of the input feature layer, with no part of the contained feature properly inside the feature in the input feature layer, the input feature will not be selected. Prostorové dotazy (spatial join) • Která místa leží v JMK?? • ŘSD a projektování výstavby rychlostních komunikací – CleverMaps. Topologické překrytí (overlay) • Při těchto operacích dochází k řešení vztahů bod, linie nebo polygon v polygonu (výjimkou je sjednocení, které mohu provádět pouze mezi dvěma polygonovými vrstvami). • Z procesu topologického překrytí vznikají nové objekty (vrstvy), kterým jsou přiřazeny také atributy. Tím se topologická překrytí liší od prostorových dotazů, kde žádné nové vrstvy nevznikají. Topologické překrytí - postupy • Pro kombinaci vstupních objektů se opět používají pravidla Booleovské logiky. • GIS obvykle nabízejí: – INTERSECT (AND - průnik), – UNION (OR - sjednocení), – IDENTITY (přiřazení na základě prostorového umístění – zachovává všechny vstupní objekty). GIS4SG Intersect – jak spojit povodí a administrativní jednotky? Do kterých ORP v JmK spadají dílčí části povodí Moravy? GIS4SG Union – jak spojit povodí a administrativní jednotky? Do kterých ORP v JmK spadají dílčí části povodí Moravy a které dílčí části leží mimo JmK? GIS4SG Clip – jak oříznout povodí pomocí administrativníc h hranic? Které dílčí části povodí Moravy leží v JmK? GIS4SG Jak blízko?Eukleidovská vzdálenosti (vzdušnou čarou) Vzdálenost po síti Nákladové povrchy Analýza vzdáleností • Tvorba obálek (buffer) • Výsledkem je obálka v definované vzdálenosti od vybraného geometrického prvku Obálka (buffer) - parametry Výpočet vzdálenosti 1)Bod – bod 2) Bod - linie Vzdálenost objektů v okolí (near distance) • Určení vzdáleností od vstupního prvku k ostatním prvkům v určeném rozsahu. Výsledky zaznamenány do tabulky. Analýzy sousedství (Proximity analysis) – • Každá polygon obsahuje jeden bod vstupního souboru. Každé místo polygonu je blíže k tomuto bodu, než k jakémukoliv dalšímu bodu vstupního souboru. • Thiesenovy polygony, Voronoi cell (Voroného tesalace) – konstrukce?? Principy triangulace • Uvnitř kružnice k opsané libovolnému trojúhelníku neleží žádný jiný bod množiny P. Příklad tvorby trojúhleníků α + γ is bigger than 180° Nekorektní triangulace Korektní triangulace Dělení plochy - tesalace Voroného polygony Analýzy nad vektorovou sítí • Analýzy sítí jsou významnou oblastí aplikace GIS. • V podstatě se jedná opět o hledání nejkratší vzdálenosti, ale s tím rozdílem, že sítě jsou vektorovou reprezentací. • Síť tvoří (orientovaný) ohodnocený graf, skládající se z uzlů (průsečíků) a hran (linií). Tvorba sítě Postup tvorby sítě: – Je třeba získat liniovou vrstvu, nad kterou budou analýzy prováděny (ulice, rozvody, kanalizace). – Tato data musí být topologicky čistá (hlavně musí splňovat konektivitu a znalost směru) – nutná a v zásadě postačující podmínka pro analýzy sítí. – Následně lze síti přiřadit pravidla, která určují, jak je možné se pohybovat mezi jednotlivými uzly. Pravidla uzlová a hranová: • Uzlová pravidla definují směr pohybu uzlem. – Například, pokud budu mít uliční síť, na některých křižovatkách není povoleno odbočení doleva či doprava. • Hranová pravidla definují směr a rychlost pohybu po hraně. – Ulice mohou být jednosměrné, uzavřené, s nadefinovanou maximální a průměrnou rychlostí. Faktory ovlivňující vzdálenost • Vlastnosti reálného světa ovlivňující reálnou vzdálenost: – objekty (antropogenní prvky, krajinný pokryv) nacházející se na povrchu, – průběh terénu, s ním související převýšení, – převládající směr větru, • následně se modelují jako faktory ... • Faktory modelující vlastnosti reálného světa: – frikční povrch, – faktor terénu (reliéfu), – vertikální faktor, – horizontální faktor, • se skládají do výsledného povrchu nákladů (nákladového vzdálenostního povrchu). Intenzita (hustota) výskytu jevuTyp dat Body Linie Plochy Intenzita (hustota) výskytu jevuMapovaná hodnota Intenzita prostorového výskytu jevu Intenzita atributu prostorového jevu Mapové vyjádření intenzity jevu Vyjádření v prostorové jednotce: • Metoda teček • Metoda kartogramu Vyjádření v povrchu intenzity jevu Princip výpočtu intenzity jevu (hotspot) • Vytvoření gridu, definování okolí buňky, výběr mapované hodnoty (výskyt x atribut), užití váhy/funkce Proměnné pro výpočet intenzity jevu Velikost buňky Užití funkce/váhy Velikost okolí Hustota a metody jádrového vyhlazení – kernel density • Ve které části města dochází k nejvíce krádežím aut?? • metoda výpočtu hustoty povrchu lze představit tak, že kolem každého bodu se vytvoří kruhové okolí podobné plynule zakřivenému povrchu. Ten má nejvyšší hodnotu 1 v místě bodu a klesá pomocí matematicky definované funkce směrem k okraji, kde nabývá hodnoty 0. Hodnota hustoty pro každou buňku je poté vypočtena posčítáním hodnot všech jádrových povrchů, které překrývají střed dané buňky. Mapování změny Intenzita změny Rychlost změny Mapování změny - přístupy Časová série Časový vývoj Míra změny Použitá literatura • MITCHEL, A. (1999): The ESRI Guide to GIS Analysis. Volume 1: Geographic patterns and relationships. ESRI Press, 177 s. • DE SMITH, M., GOODCHILD, M., LONGLEY, P. (2018): Geospatial analysis: A Comprehensive Guide to Principles Techniques and Software Tools. Online: https://spatialanalysisonline.com/ • MIKLÍN, J., DUŠEK, R., KRTIČKA, L., KALÁB, O. (2018). Tvorba map. Ostrava: Ostravská univerzita. ISBN 978-80-7599-017-4, 302 s.