Geoinformatika II – GIS jako zpracování dat jaro 2024 Petr Kubíček kubicek@geogr.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Geoinformatika Co je geoinformatika? • Věda o zpracování geografické informace – Geografická informace je soubor poznatků o nějakém jevu (události, předmětu, procesu…) jehož součástí je vymezení tohoto jevu vůči (zemskému) povrchu. • Technologický základ geoinformačních věd – Kartografie, dálkový průzkum Země (DPZ, RS), geodézie (sruveying). Geoinformatika Proč GIS? Rozdílné: •Zdroje •Umístění •Měřítko •Zobrazení •Legenda Půdy Geologie Geoinformatika Co je to GIS? • Co je to informační systém? • Informační systém je soubor hardware a software na získávání, uchovávání, spojování a vyhodnocování informací. • Informační systém se skládá ze zařízení na zpracování dat, systému ukládání dat (báze) a vyhodnocovacích programů. • Co je geografický?? ☺ Geoinformatika Co je to GIS? • Geografický informační systém • Je informační systém pracující oproti klasickým informačním systémům navíc i s prostorovou složkou dat. • Také lze říci, že je výkonným nástrojem geověd, tedy že metody těchto věd umožňuje efektivně implementovat v počítačovém prostředí. • Předmět výzkumu geoinformatiky. Geoinformatika Definice GIS(?) • Pro GIS neexistuje jednotná definice, proto si jich uvedeme několik (mezinárodní): • GIS je soubor prostředků pro sběr, ukládání, vyhledávání, transformaci, analyzování a zobrazování prostorových údajů z reálného světa z hlediska: 1. jejich polohy vzhledem k souřadnicovému systému; 2. jejich popisných – atributových vlastností; 3. jejich topologie. (Burrough, 1986) • GIS je organizovaný soubor počítačového hardwaru, softwaru a geografických údajů navržený na efektivní získávání, ukládání, upravování, správu, analyzování a zobrazování všech forem geografických informací. (ESRI) Geoinformatika Definice GIS Národní: • GIS je kolekce počítačového technického vybavení, programového vybavení geografických údajů a personálu, určená k účinnému sběru, ukládání, údržbě, manipulaci, analýze a zobrazování všech forem geograficky vztažené informace (Neumann, 1996). • Geoinformatika je vědecká a technická disciplína, jejímž předmětem jsou prostorové údaje a která se soustřeďuje na jejich sběr, ukládání, manipulaci s nimi a jejich zprostředkování (Neumann, 1996). • Další Rapant (2006)… Geoinformatika Členění GIS Podle různých kritérií: • Strukturální komponenty GIS • Funkční komponenty GIS • Koncepční přístupy k GIS Geoinformatika Členění GIS - struktura Strukturální komponenty GIS • Hardware • Software • Data • Lidé • Metody Geoinformatika Členění GIS – funkční Funkční komponenty GIS • Vstup dat. • Zpracování a uchování dat. • Vykonávání analýz a syntéz z využitím prostorových vztahů - jádro GIS, tedy to co nejvíce odlišuje GIS a jiné IS. • Prezentace výsledků (výstupy grafické mapy, negrafické - zprávy, souhrnné tabulky, statistická vyhodnocení, …). • Interakce s uživatelem (desktop GIS, Web GIS). Geoinformatika GIS životní cyklus dat Geoinformatika GIS a okolní svět Vztah GIS a ostatních oborů lidské činnosti Geoinformatika Je GIS přínosný? • Proč vůbec používat GIS? – 80 % dat lze prostorově lokalizovat. • Příklady využití GIS: – mapové portály, služby, – obchod, – ochrana proti pohromám – krizové řízení, – správa inženýrských sítí (distribuční společnosti), – životní prostředí, – veřejná správa (ministerstva, kraje, města), – školství. HISTORIE GIS – JAK TO VŠECHNO ZAČALO? Historie GIS • V 50. letech 20. století začaly pokusy s automatizovaným mapováním za využití výpočetní techniky. • V roce 1963 zavedl pojem GIS Kanaďan R. F. Tomlinson a označil tak nové technologie pracující s daty a podávajícími informaci o terénu pomocí výpočetní techniky. ??Jak dostat mapu do počítače?? Historie GIS • Pionýrské období (konec 60. let až 1975) hlavně průkopnické práce, univerzity - důraz na digitální kartografii. • 1975- začátek 80. let - ujednocení pokusů s institucemi na lokální úrovni - první LIS. • 1982 - konec 80. let - komercionalizace problematiky – běžně dostupné softwarové systémy pro GIS (ESRI, Intergraph, …), první systémy založené na CAD (systémy před tím měly minimální grafické možnosti). Autocarto, EuroCarto (1987 Brno). • 1986 – P. Burrough - učebnice GIS; Konečný a Rais – GIS v ČR (1985). Historie GIS • NCGIA – National Centre for Geographic Information and Analysis;GI science (USA). Změna pojetí GIS jako nástroje (research with GIS) na přijetí GIS jako výzkumného směru (research about GIS – spatial information theory). • 90. léta - počátky standardizace, uživatelské GIS, Desktop GIS, otevřené systémy (Open GIS), Internet. • Výuka GIS v Č(SS)R – Brno, Ostrava, Olomouc… • AGILE; Conference on Spatial Information Theory (COSIT). • Současnost - vzdálený přístup přes Internet/Intranet/Cloud, webové služby, sociální sítě, geoparticipace (VGI), 3D GIS, strojové učení. • Mobilní GIS, Imerzivní GIS, GeoAI... Komplexní GIS schéma TEORETICKÉ POJETÍ GIS Geoinformatika Proces modelování • modelování – je proces abstrakce, při kterém jsou podstatné elementy reálného světa zdůrazněny a nepodstatné eliminovány (s ohledem na cíl, který má toto modelování splnit): – úmyslně – zobrazují se jen ty elementy, které jsou předmětem zkoumání, ostatní se potlačují; – neúmyslně – v dané fázi poznání jsou nedostupné či nepoznatelné. • Principem modelování je snaha o poznání vlastností studované části reality. Geoinformatika Modelování geografických objektů • V geoinformatice se nezaobíráme reálnými objekty, ale z důvodu zjednodušené reprezentace - modelem reality. • Modelování - abstrahování týkající se všech součástí geografické informace: – geometrické, – topologické, – tematické, – dynamické. Geoinformatika Složky geografických dat • Neprostorová složka (tzv. atributy) - tematická – Čísla – kvantitativní hodnoty – Řetězce znaků – kvalitativní hodnoty – Datum – časové určení – Komplementární atributy – linky, videa, dokumenty … • Časový aspekt odráží změnu jevu v čase (od jednoho záznamu ke druhému) • Prostorová složka (tzv. Geometrie) – tvar – poloha – topologie Všechny měřitelné nebo popsatelné vlastnosti reálných entit spadají do jednoho z aspektů: prostoru (KDE), tématu (CO) nebo času (KDY). Geoinformatika Neprostorová složka - atributy Popisující geografické objekty a jejich vlastnosti Typy atributových dat • poměr - např. procenta • interval - např. celá čísla z intervalu (0,10), desetinná čísla z intervalu (0.5-14.0) • pořadí (ordinální) - řadová číslovka • výčet (nominální) - např. pro typ silnice to může být (dálnice, rychlostní silnice, silnice 1.třídy, silnice 2.třídy, ostatní silnice) Příklad: • Objekt = lesní porost • Atribut = dřevinná skladba, průměrná výška porostu, věková struktura, apod. • Vyjádření kvality(nejistoty) atributu - Atributy jsou neprostorové (nereprezentují informaci o lokalizaci či o prostorových vztazích), mají vytvořenou vazbu na prostorové prvky atributové hodnoty, reprezentující kvalitu geografického objektu, nelze vždy měřit nebo udávat v jednotném měřítku. • Př. Borovicový porost není nikdy 100% složen pouze z borovice. Při analýzách to nevadí, ale je nutno s touto skutečností počítat (míry kvality). Geoinformatika Časová složka • Čas – dynamický popis – dynamika charakterizuje časovou variabilitu geografických objektů. – tyto změny se mohou týkat geometrie, topologie i tematického popisu. • Modelování dynamických prostorových procesů v rozměrném prostoru vyžaduje složité modely a metody. V praxi se ale používá zjednodušení: • 1. Analýza časové série na jednom měřícím bodě - časová změna. • 2. Prostorová změna atributové hodnoty mezi dvěma body v tom samém čase - prostorová změna. Geoinformatika Prostorová složka - tvar • Dvě chápání prostoru a jejich vyjádření v GIS – Prvek –> jeho vymezení -> hranice -> objekty • Kartografický model reality – Bod, Linie, Plocha • Uspořádaný soubor souřadnic - VEKTOR. – Prostor -> jeho rozdělení -> jaký jev je přítomen v dílu • Vzorkování • Různé druhy členění podle charakteru buněk – Pravidelnost, komplexita • Matice hodnot – u pravidelného a jednoduchého členění - RASTR. Geoinformatika Datové modelování – vektorová reprezentace Bod – nemá délku, hloubku ani šířku - bezrozměrný (0D) prvek – je jednotlivý pár souřadnic X, Y, reprezentující geografický prvek – je příliš malý na to, aby byl zobrazen jako linie či plocha. Geoinformatika Typy geometrických objektů - linie Linie – má délku, ale nemá šířku ani hloubku - jednorozměrný (1D) geografický prvek; – je sled orientovaných úseček (hran) definovaných souřadnicemi vrcholů (vertex) mezi dvěma uzly (nodes); – tvar reprezentovaného geografického prvku je příliš úzký na to, aby mohl být zobrazen jako plocha. Geoinformatika Typy geometrických objektů - plocha • Polygon (plocha) – mají délku a šířku, ale nemají hloubku - dvojrozměrný (2D) geografický prvek; – je uzavřený obrazec, jehož hranicí je uzavřená linie. – První a poslední vrchol jsou stejné. Geoinformatika Sítě • systém linií s topologickou strukturou; • je řada vzájemně propojených linií, podél níž probíhá tok informací. Povrchy • je to souvislá entita, pro kterou v každém bodě existuje nějaká hodnota (2,5 D) x,y,z. Objemy • mají všechny rozměry (délku, šířku, hloubku) - trojrozměrné (3D) geografické prvky. Geoinformatika Špagetový datový model • Nejjednodušší – CAD, CAM. • Objekt na mapě se reprezentuje jedním logickým záznamem v souboru a je definovaný jako řetězec x,y souřadnic. •Nevýhody - ačkoli jsou všechny objekty v prostoru definovány, struktura neposkytuje informace o vztazích mezi objekty. •Společná linie je pro každý polygon ukládána dvakrát. •Pro většinu prostorových analýz je tento model nevhodný, protože veškeré potřebné prostorové vztahy musí být spočítány před každou analýzou. Geoinformatika Topologický datový model • V tomto modelu každá linie začíná a končí v bodě nazývaném uzel - node. • Dvě linie se mohou protínat opět jenom v uzlu. Každá část linie je uložena s odkazem na uzly a ty jsou uloženy jako soubor souřadnic x,y. Ve struktuře jsou ještě uloženy identifikátory označující pravý a levý polygon vzhledem k linii. Tímto způsobem jsou zachovány základní prostorové vztahy • Použitelné pro analýzy. Navíc tato topologická informace umožňuje body, linie a polygony uložit v neredundantní podobě (bez opakovaného zápisu). Geoinformatika Geoinformatika Vektorová reprezentace - topologie • Topologie je matematický způsob, jak explicitně vyjádřit prostorové vztahy mezi jednotlivými geometrickými objekty. • Proč vůbec topologie? Má jisté výhody, například: – Umožní ukládat data efektivněji. – Mnoho analýz v GIS využívá pouze topologické a nikoli geometrické vztahy. • Důvod pro využívání topologie (ESRI 1995): • "Topology is useful in GIS because many spatial modeling operations don't require coordinates, only topological information. For example, to find an optimal path between two points requires a list of the arcs that connect to each other and the cost to traverse each arc in each direction. Coordinates are only needed for drawing the path after it is calculated." Geoinformatika Tři základní topologické koncepty • Konektivita – dvě linie se na sebe napojují v uzlech. • Definice plochy – linie, které uzavírají nějakou plochu, definují polygon. • Sousednost - linie mají směr a nesou informaci o objektech nalevo a napravo od nich. Geoinformatika Konektivita Definice plochy Sousednost Zdroj:Cambell a Shin, 2012 Geoinformatika ArcGIS Shapefile ESRI formát pro netopologický zápis GIS vektorového formátu. • Jeden soubor obvykle reprezentuje jeden typ mapového prvku, např. silnice, jezera, obce • Shapefile specifikuje i další pomocné soubory. • „Jméno.přípona“ prefix zůstává stejný, přípona se mění: • Povinné – .shp – samotný hlavní soubor s geodaty (geometrie). – .shx – indexový soubor (posun vůči počátku souboru, délka záznamu). – .dbf – soubor s atributy resp. popisné data. • Nepovinné – .prj – zdrojový souřadnicový systém. – WKT-string – (Well Known Text) – .cpg – specifikuje kódování v dbf souboru. – UTF-8. Geoinformatika Struktura *.SHP • Geometrický prvek v záznamu - shape • Samotnou geometrii shape ukládá jako sekvenci bodů (např. GPS souřadnic). • Nedefinuje topologickou strukturu. • Jeden záznam shape – jeden řádek v atributech. Geoinformatika Hlavička souboru *.SHP Z; M – odpovídají 3D (X,Y,Z) případně 4D (čas) Geoinformatika Hlavička/obsah záznamu Geoinformatika Atributová data *. dbf • Standartní DBF soubor (tabulka) • Ke každému záznamu existuje právě jeden řádek v tabulce ve stejném pořadí jako ve zdrojovém shapefile. • Stejný prefix jako zdrojový shapefile. • Kódování uloženo v .cfg souboru. • Velké množství dat, redundance. Shapefile - shrnutí + výhody • Neukládá topologii dat • Snadná editace bodů • Rychlá vizualizace geodat • Jednoduše pochopitelná struktura • Podpora v GIS softwarech • Snadná projekce do jiných souřadnicových systémů - výhody • Neukládá topologii dat • Redundance dat (např. body sousedících polygonů) • Manipulace s detailní shapefile (až 100MB soubor, max 2GB) je pomalá. • Špatná podpora Unicode (kódování češtiny). Geoinformatika Vektorová data Výhody • lze pracovat s jednotlivými objekty jako se samostatnými celky; • menší náročnost na paměť; • dobrá reprezentace jevové struktury dat; • vysoká geometrická přesnost • kvalitní grafika, přesné kreslení, znázornění blízké mapám; • jednoduché vyhledávání, úpravy a generalizace objektů a jejich atributů. Nevýhody • výpočtová náročnost (problémy při náročných analytických operacích); • komplikovanost datové struktury; • složitější odpovědi na polohové dotazy; • obtížná tvorba překryvů vektorových vrstev (overlay) ; • problémy při modelování a simulaci jevů.