GIS4SG Základní stavební kameny prostorové analýzy jaro 2023 Lukáš Herman, Petr Kubíček & Radim Lískovec kubicek@geogr.muni.cz, herman.lu@mail.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Výuka • 2+1 – 2 h – přednáška – Lukáš Herman – 1 h – cvičení – Radim Lískovec • Termíny: – Přednáška • ÚT 14:00 - 15:50 v Z5 – Cvičení • ÚT 16:00 – 16:50 v Z7 – První cvičení proběhne 21.2. – výjimečně začátek v 15:00 v Z5! Bude tedy dvouhodinové. Od 28.2. již podle rozpisu výše… Prerekvizity – na co navazujeme? • Z0262 Geoinformatika – základní technologické znalosti a dovednosti. • Z2062 Geografická kartografie – základní znalosti o tvorbě a podstatě map. • Z8118 Tvorba tematických map - ? • ... Osnova Základní teoretické okruhy + praktická cvičení Struktura 2/1 – přednášky budou využívat také aktivní výukové metody(?) 1. Úvod do geoinformační problematiky v sociální geografii 2. Vizualizace časoprostorových dat. 4. Alokační úlohy; 5. Geomarketing; 6. Analýzy kriminality; 7. Multikriteriální analýza a ověřování její validity. Literatura - knihy • WORTLEY, R.,MAZEROLLE , L.G. (2008): Environmental criminology and crime analysis. • OKABE, A. (2006): GIS-based studies in the humanities and social sciences. • PARKER, R. N., ASENCIO, E.K. (2008): GIS and spatial analysis for the social sciences : coding, mapping and modeling. • Vybrané doporučené články - viz přednášky. Online zdroj: http://www.spatialanalysisonline.com Organizace a ukončení • Zkouška – ústní zkouška. • Cvičení tvoří nedílnou část známky z předmětu. • Cvičení – viz podmínky Radim Lískovec – projektová práce v týmu v rámci cvičení, – využití „peer review“ (průběžná zpětná vazba), – aktuální a zajímavé data ☺ – volba SW bude na Vás: • ArcGIS, ArcGIS Pro • QGIS, GeoDa • R • … GIS4SG Jaká je budoucnost GIS? https://youtu.be/lY2_3th-Axk MAKING SENSE OF THE DATA Modelování, model • Modelování = prostředek poznávacího procesu • Model = zjednodušené zobrazení skutečnosti, části objektivní reality či jevu. • Model zobrazuje pouze vybrané znaky předlohy, které nás zajímají v konkrétním případě zkoumání, od ostatních vlastností se upouští. • Účel modelu – rozhoduje o zobrazovaných vlastnostech • Různé typy modelů – mapa, databáze, datový model, GIS model. Datové modely v GIS (?) OPAKOVÁNÍ: • Základní typy datových modelů • Geometrická primitiva • Topologie - principy a projevy v jednotlivých datových modelech. • Výhody a nevýhody Role GIS v modelování • Nástroj pro zpracování, zobrazení a integraci různých zdrojů dat – mapy, DMT, GPS, tabulky.. • Datové modelování – vektor, rastr, hybrid. Výhody použití pro specifické jevy (vektor pro dobře ohraničené jevy s jasným tvarem). • Možnost převodu formátu vektor – rastr (RAVE, VERA), oba datové typy mohou vstupovat do modelů. Lze s úspěchem využít oba a převádět je mezi sebou. • Možnost propojení GIS na statistické programy (Matlab). • Typy propojení - volné (loose coupling - import - export), pevné (tight coupling – společný interface, SAGA GIS), vložené (embeded) systémy (Geostatistical analyst ArcGIS statistické funkce v GIS a naopak). Datové modely a základní metody • Jak převést okolní realitu do počítače? • Jaký model použít? • Jak uložit data do počítače? Zdroj: http://www.spatialanalysisonline.com Základní operace • Geometrické, dotazovací a vzdáleností operace = prostorové analýzy. • Základní stavební komponenty většiny GIS SW (ArcGIS, MapInfo, QGIS…). • Definovány prostřednictvím de facto/de jure standardů. • OGC compliant. Analytické a modelovací metody – OGC simple feature specs • Prostorové predikáty GIS4SG GIS4SG GEOMETRICKÉ A RELAČNÍ OPERACE Geometrické operace Operace pro vektorové prvky či skupiny buněk v rastrovém datovém modelu – řada prostorových vlastností – délka, ploch. Představíme základní geometrické atributy, které lze využít. Jsou dvojího druhu: - Vnitřní – součást atributové tabulky pro všechny geometrické prvky. - Vnější – je nutné vypočítat a doplnit pro všechny prvky (součást SW nebo výpočetní vzorec). - Pokud je třeba provádět s geometrickými vlastnostmi nějaké další operace (seřadit podle plochy, plocha x obvod), je vhodné si explicitně vytvořit vlastní pole. Délka a plocha - vektor • Eukleidovský prostor (jaké jsou předpoklady?) • Lichoběžníkové pravidlo: • Pro 4 vrcholy A,B,C,D: • Obecně: Délka a plocha - rastr • Dáno velikostí buňky a počtem řádků a sloupců. • Plocha = počet buněk; vymezení celistvé plochy (otvory, homogenity, celistvost hranic) • Vzdálenost – dle typu povoleného pohybu – Manhattan, diagonální pohyb. Jak jsou reprezentovány atributové složky plochy? Středy a centroidy • Odlišné podle SW, odlišné pro geometrii (bod, linie, plocha a jejich skupiny). • Průměrný střed (M1), těžiště (gravitační střed) – centroid (M2), střed MBR (M3). • MBR střed – rychlý, ale citlivý k odlehlým vrcholům (B(14,3). Linie – bod stejně vzdálený oběma hraničním bodům (počátku a konci) Potenciální problémy • Komplexní tvar polygonů – centroidy mohou ležet mimo polygon. • ArcGIS – Feature to points (INSIDE option on). Prostorové dotazy (spatial join) • Která místa leží v JMK?? • ŘSD a projektování výstavby rychlostních komunikací – CleverMaps. Bod (linie, polygon) v polygonu • Leží daná geometrie uvnitř polygonu (adresa v městské části)?? • Primární řešení - použití MBR. • Standardní řešení – protažení linie vzhůru nebo kolmo doprava – pokud je počet protnutí hranice polygonu lichý = bodl leží uvnitř polygonu. • Speciální případy – hranice, vertex, vertikální segment Interpolace polygonu • Jak přiřadit atributy nově vzniklému polygonu? • Obslužná zóna nemocnice vs. Demografie. • Uniformí vs. proměnlivé rozložení prostoru – jak řešit? Dělení plochy - tesalace Voroného polygony Tesalace v rastru a na síti Hustota a metody jádrového vyhlazení – kernel density • Ve které části města dochází k nejvíce krádežím aut?? • metoda výpočtu hustoty povrchu lze představit tak, že kolem každého bodu se vytvoří kruhové okolí podobné plynule zakřivenému povrchu. Ten má nejvyšší hodnotu 1 v místě bodu a klesá pomocí matematicky definované funkce směrem k okraji, kde nabývá hodnoty 0. Hodnota hustoty pro každou buňku je poté vypočtena posčítáním hodnot všech jádrových povrchů, které překrývají střed dané buňky. Anamorfované mapy (Cartograms) • Změněná geometrie prostoru • Doorling. MAPresso, MapViewer a GeoDa. GIS4SG UŽITÍ MAPY – MAP USE A EXPLORACE DAT Map use • Změna kartografického paradigmatu – jak mohou mapy lépe sloužit uživatelům? Užití mapy. • Důraz na kartografickou vizualizaci • Di Biase (1990) – vizualizace jako nástroj výzkumu. Křivka vizualizace zobrazuje sekvenci výzkumných kroků a odlišnou rolí vizualizace. • Na straně explorace hraje mapa a další typy vizualizace roli nástroje pro zdůvodnění (napomáhají vizuálnímu myšlení). GIS4SG Mapa a vizualizace v geografickém výzkumu The role of maps and other graphics as tools in a geographic research sequence (after DiBiase, 1990) „Prostor" užití mapy • MacEachren(1994) – konceptuální pohled. • Vizualizace (ve smyslu vizuálního myšlení) je doplněk komunikace (ve smyslu přenosu informace). • Možnost souvislého měření podél tří os: – Private – public – Revealing unknown – presenting known – High human-map interaction – low interaction • Kartografická vizualizace = užití mapy v části krychle pro soukromé využití, odhalující nové a s vysokou mírou interakce. GIS4SG The (cartography) map use cube (MacEachren, 1994) GIS4SG Kraak a Ormeling (1996) širší pojetí v prostředí GIS Širší interpretace termínu „vizualizace“: • explore pro neznámá a často „surová“ nezpracovaná data; • analyse (manipulate) – pro známá data; • present (communicate) znalosti a informace. Odpovídající změny umístění uvnitř MacEachrenovy krychle. GIS4SG Kraak a Ormeling (1996) širší pojetí v prostředí GIS GIS4SG Kartografická explorace – nová agenda (Kraak a MacEachren 1997) Definování základních 4 cílů : •Explorace •Analýza •Syntéza •Prezentace Každý cíl vyžaduje přitom specifické vizualizační přístupy či strategie a je charakterizován svým umístěním v rámci konceptuálního prostoru užití mapy. Explorace • Pozice – private - high interaction – revealing of unknown. • Otázky : – Jaká je podstata datové sady? – Které z vybraných datových sad mají podobné prostorové vzory? – Co když…? • Nástroje umožňující uživateli : – Zkoumat prostorová data vizuálně – animace, – Identifikovat vztahy mezi proměnnými – propojená okna, „brushing“ – Pohlížet na data s více pohledů – jak prostorových , tak konceptuálních. • Dynamické mapovací metody. Vzhled ovlivnitelný uživatelem. Kartografická explorace • Je účinná a funkční v prvotní fázi výzkumného procesu. • Datové sady jsou prohlíženy a zkoumány při měnících se kartografických podmínkách. • Cílem je rozpoznat prostorové vzory (patterns) a trendy, které jsou přítomny a případně ohodnotit jejich platnost. • Snaží se podpořit vznik nových myšlenek a nápadů, hlavním cílem není prezentování závěrů. • Poskytuje dynamické zobrazení – linking and bruhsing. • Podporuje experimentování s různými kombinacemi dat a grafických symbolů. Linked Micromaps • Umožní pohled na více proměnných v jednom okamžiku a srovnání atributů napříč vymezenými jednotkami v prostorou a čase. • Podporuje 6 typů vizualizace: – Sloupcové grafy; – box plots; – Tabulky dat; – Bodové symboly; – Bodové symboly se šipkou (trendem); – Bodové symboly s intervalem spolehlivosti. • http://gis.cancer.gov/tools/micromaps/ GIS4SG GIS4SG Geoviz Toolkit • Frank Hardisty et al, Pen State university. • Systematická analýza prostorových, časových a atributových pohledů na data. • Dynamicky propojený a multivariační pohled na datové sady. • Vývojové prostředí pro doplňování nástrojů. • Možnost vstupu vlastních dat *.shp • Omezené vysvětlení funkcionality. GIS4SG GeoViz Toolkit http://www.geovista.psu.edu/geoviztoolkit/ GeoDa• GeoDa - Dr. Luc Anselin • Určen pro ESDA na vektorových datech. • Grafické rozhraní pro popisnou geografickou analýzu, ale také prostorovou autokorelaci a prostorovou regresní analýzu. • Stále ve vývoji – původně postaveno na MapObjects. • Nyní https://spatial.uchicago.edu/geoda GIS4SG GIS4SG Příklady exploračních kartografických nástrojů (funkcí a metod) Kartografická explorace • Je účinná a funkční v prvotní fázi výzkumného procesu. • Datové sady jsou prohlíženy a zkoumány při měnících se kartografických podmínkách. • Cílem je rozpoznat prostorové vzory (patterns) a trendy, které jsou přítomny a případně ohodnotit jejich platnost. • Snaží se podpořit vznik nových myšlenek a nápadů, hlavním cílem není prezentování závěrů. • Poskytuje dynamické zobrazení. • Podporuje experimentování s různými kombinacemi dat a grafických symbolů. Základy explorační analýzy dat • Základní forma explorační datové analýzy zahrnuje výpočet základních statistických ukazatelů jednotlivých datových atributů. • Grafické znázornění/vizualizace výsledků využívá především formu: – Histogram – Pie charts, – box plots – parallel coordinate plot • Neposkytují explicitně prostorový pohled na dat, avšak lze je propojit s mapovým výstupem/vizualizací a vytvořit nový nástroj pro vstupní exploraci. • Brushing and linking Linking a brushing Parallel coordinate plot (PCP) Rovnoběžné souřadnice • Zaměřen na exploraci vícerozměrných datových sad. • Každá proměnná má vlastní osu s [min, max] vertikálním rozsahem a spojitou linii vyjadřující průběh změn proměnných v jednotlivých prostorových jednotkách. • Lze vybrat jednotlivé „podpisy“ jednotek podle volby uživatele a zvýraznit jejich hodnoty a případně umístění v mapě. Star plot Paprskový graf/hvězdicový či pavučinový graf • Každá proměnná je vynesena na jednu osu, • Počet os je roven počtu proměnných, délka osy je proporčně upravena podle rozsahu proměnných, případně přizpůsobena dle pravidel normalizace. • Každá mapovaná oblast má individuální tvar grafu a lze je použít ve formě kartodiagramu. Box plot Krabicový graf/diagram • Představuje jeden ze základních grafů – jak je konstruován? • Horní a spodní hranice „krabice/box“ – 25 a 75 percentil vzorku. Vzdálenost mezi nimi inter-quartile range (IQR) • Linie uvnitř boxu - medián vzorku, jeho umístnění indikuje zešikmení (skewness) souboru. • Vodorovné čárky (whiskers) zobrazují rozsah zbytku souboru za předpokladu, že nejsou přítomny odlehlé hodnoty (outliers). • Odlehlá hodnota? • Outlier více než 1.5 krát IQR od hranic krabice, možno definovat i jinak. • Symboly mimo rozsah souboru (obvykle jinak barevné tečky či kruhy) indikují odlehlé hodnoty. • Zdroje odlehlých hodnot? Úkol na příště • Podívejte se na video a zkuste zodpovědět dotazy https://www.youtube.com/watch?v=vj4aEc oyDGY – Co to je geokódování? – Vstupy (data) metoda používá? – Existují varianty? – Srovnejte prezentaci se situací (daty) v Česku…