Geoinformatika II – GIS jako zpracování dat jaro 2019 Petr Kubíček kubicek@geogr.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Geoinformatika Co je to GIS • Závěry vycházející z definic: GIS netvoří pouze software, ale i ostatní komponenty jako data, hardware, personál a způsob použití. • Několik definic, ale GIS můžeme popsat i výčtem základních otázek, které je možné řešit s pomocí GIS. • GIS nám umožní hledat odpovědi na následující otázky: – Co se nachází na ...? – Kde se nachází ...? – Jaký je počet ...? – Co se změnilo od ...? – Co je příčinou ...? – Co když ...? – DESKRIPCE x PREDIKCE Geoinformatika Členění GIS Podle různých kritérií: • Strukturální komponenty GIS • Funkční komponenty GIS • Koncepční přístupy k GIS Geoinformatika Členění GIS Strukturální komponenty GIS • Hardware • Software • Data • Lidé • Metody Geoinformatika Členění GIS Funkční komponenty GIS • Vstup dat. • Zpracování a uchování dat. • Vykonávání analýz a syntéz z využitím prostorových vztahů - jádro GIS, tedy to co nejvíce odlišuje GIS a jiné IS. • Prezentace výsledků (výstupy grafické mapy, negrafické - zprávy, souhrnné tabulky, statistická vyhodnocení, …). • Interakce s uživatelem (desktop GIS, Web GIS). Geoinformatika GIS životní cyklus dat Geoinformatika GIS a okolní svět Vztah GIS a ostatních oborů lidské činnosti Geoinformatika Je GIS přínosný? • Proč vůbec používat GIS? – 80 % dat lze prostorově lokalizovat. • Příklady využití GIS: – mapové portály, služby, – obchod, – ochrana proti pohromám – krizové řízení, – správa inženýrských sítí (distribuční společnosti), – životní prostředí, – veřejná správa (ministerstva, kraje, města), – školství. Historie GIS • V 50. letech 20. století začaly pokusy s automatizovaným mapováním za využití výpočetní techniky. • V roce 1963 zavedl pojem GIS Kanaďan R. F. Tomlinson a označil tak nové technologie pracující s daty a podávajícími informaci o terénu pomocí výpočetní techniky. ??Jak dostat mapu do počítače?? Historie GIS • Pionýrské období (konec 60. let až 1975) hlavně průkopnické práce, univerzity - důraz na digitální kartografii. • 1975- začátek 80. let - ujednocení pokusů s institucemi na lokální úrovni - první LIS. • 1982 - konec 80. let - komercionalizace problematiky – běžně dostupné softwarové systémy pro GIS (ESRI, Intergraph, …), první systémy založené na CAD (systémy před tím měly minimální grafické možnosti). Autocarto, EuroCarto (1987 Brno). • 1986 – P. Burrough - učebnice GIS; Konečný a Rais – GIS v ČR. Historie GIS • NCGIA – National Centre for Geographic Information and Analysis;GI science (USA). Změna pojetí GIS jako nástroje (research with GIS) na přijetí GIS jako výzkumného směru (research about GIS – spatial information theory). • 90. léta - počátky standardizace, uživatelské GIS, Desktop GIS, otevřené systémy (Open GIS), Internet. • Výuka GIS v Č(SS)R – Brno, Ostrava, Olomouc… • AGILE; Conference on Spatial Information Theory (COSIT). • Současnost - vývoj objektově orientovaných systémů, masivní propojení s databázemi, vzdálený přístup přes Internet/Intranet, webové služby, sociální sítě, geoparticipace (VGI). • Mobilní GIS ... Komplexní GIS schéma TEORETICKÉ POJETÍ GIS Pohledy na reálný svět Tři základní pohledy - Objektový , Jevový, Procesní Jevový a procesní pohled • Dělení jevů – kvalitativní x kvantitativní; statické x dynamické; kontinuální x diskrétní. • Procesní pohled – vnáší do reálného světa dynamiku a ovlivňuje jak jevy, tak objekty. • Pro modelování jevů a objektů využívá geoinformatika odlišné datové modely. Geoinformatika Modelování geografických objektů • V geoinformatice se nezaobíráme reálnými objekty, ale z důvodu zjednodušené reprezentace - modelem reality. • Modelování - abstrahování týkající se všech součástí geografické informace: – geometrické, – topologické, – tematické – dynamické. Geoinformatika Proces modelování • modelování – je proces abstrakce, při kterém jsou podstatné elementy reálného světa zdůrazněny a nepodstatné eliminovány (s ohledem na cíl, který má toto modelování splnit): – úmyslně – zobrazují se jen ty elementy, které jsou předmětem zkoumání, ostatní se potlačují; – neúmyslně – v dané fázi poznání jsou nedostupné či nepoznatelné. • Principem modelování je snaha o poznání vlastností studované části reality. Geoinformatika Složky geografických dat • Neprostorová složka (tzv. Atributy) – Čísla – kvantitativní hodnoty – Řetězce znaků – kvalitativní hodnoty – Datum – časové určení – Komplementární atributy – linky, videa, dokumenty … • Časový aspekt odráží změnu jevu v čase (od jednoho záznamu ke druhému) • Prostorová složka (tzv. Geometrie) – tvar – poloha – topologie Všechny měřitelné nebo popsatelné vlastnosti reálných entit spadají do jednoho z aspektů: prostoru (KDE), tématu (CO) nebo času (KDY). Geoinformatika Neprostorová složka - atributy Popisující geografické objekty a jejich vlastnosti • Typy atributových dat • poměr - např. procenta • interval - např. celá čísla z intervalu (0,10), desetinná čísla z intervalu (0.5-14.0) • pořadí (ordinální) - řadová číslovka • výčet (nominální) - např. pro typ silnice to může být (dálnice, rychlostní silnice, silnice 1.třídy, silnice 2.třídy, ostatní silnice) Příklad: • Objekt = lesní porost • Atribut = dřevinná skladba, průměrná výška porostu, věková struktura, apod. • Atributy jsou neprostorové (nereprezentují informaci o lokalizaci či o prostorových vztazích), mají vytvořenou vazbu na prostorové prvky atributové hodnoty, reprezentující kvalitu geografického objektu, nelze vždy měřit nebo udávat v jednotném měřítku. • Př. Borovicový porost není nikdy 100% složen pouze z borovice. Při analýzách to nevadí, ale je nutno s touto skutečností počítat (míry kvality). Geoinformatika Časová složka • Čas – dynamický popis – dynamika charakterizuje časovou variabilitu geografických objektů. – tyto změny se mohou týkat geometrie, topologie i tematického popisu. • Modelování dynamických prostorových procesů v rozměrném prostoru vyžaduje složité modely a metody. V praxi se ale používá zjednodušení: • 1. Analýza časové série na jednom měřícím bodě - časová změna. • 2. Prostorová změna atributové hodnoty mezi dvěma body v tom samém čase - prostorová změna. Geoinformatika Prostorová složka - tvar • Dvě chápání prostoru – vektorový a rastrový – Jev –> jeho vymezení -> hranice -> objekty • Kartografický model reality – Bod, Linie, Plocha • Uspořádaný soubor souřadnic - VEKTOR. – Prostor -> jeho rozdělení -> jaký jev je přítomen v dílu • Vzorkování • Různé druhy členění podle charakteru buněk – Pravidelnost, komplexita • Matice hodnot – u pravidelného a jednoduchého členění - RASTR. Geoinformatika Datové modelování – vektorová reprezentace Bod – nemá délku, hloubku ani šířku - bezrozměrný (0D) prvek – je jednotlivý pár souřadnic X, Y, reprezentující geografický prvek – je příliš malý na to, aby byl zobrazen jako linie či plocha. Geoinformatika Typy geometrických objektů - linie Linie – má délku, ale nemá šířku ani hloubku - jednorozměrný (1D) geografický prvek; – je sled orientovaných úseček (hran) definovaných souřadnicemi vrcholů (vertex) mezi dvěma uzly (nodes); – tvar reprezentovaného geografického prvku je příliš úzký na to, aby mohl být zobrazen jako plocha. Geoinformatika Typy geometrických objektů - plocha • Polygon (plocha) – mají délku a šířku, ale nemají hloubku - dvojrozměrný (2D) geografický prvek; – je uzavřený obrazec, jehož hranicí je uzavřená linie. – První a poslední vrchol jsou stejné. Geoinformatika Sítě • systém linií s topologickou strukturou; • je řada vzájemně propojených linií, podél níž probíhá tok informací. Povrchy • je to souvislá entita, pro kterou v každém bodě existuje nějaká hodnota (2,5 D) x,y,z. Objemy • mají všechny rozměry (délku, šířku, hloubku) - trojrozměrné (3D) geografické prvky. Geoinformatika Špagetový datový model • Nejjednodušší – CAD, CAM. • Objekt na mapě se reprezentuje jedním logickým záznamem v souboru a je definovaný jako řetězec x,y souřadnic. •Nevýhody - ačkoli jsou všechny objekty v prostoru definovány, struktura neposkytuje informace o vztazích mezi objekty. •Společná linie je pro každý polygon ukládána dvakrát. •Pro většinu prostorových analýz je tento model nevhodný, protože veškeré potřebné prostorové vztahy musí být spočítány před každou analýzou. Geoinformatika Topologický datový model • V tomto modelu každá linie začíná a končí v bodě nazývaném uzel - node. • Dvě linie se mohou protínat opět jenom v uzlu. Každá část linie je uložena s odkazem na uzly a ty jsou uloženy jako soubor souřadnic x,y. Ve struktuře jsou ještě uloženy identifikátory označující pravý a levý polygon vzhledem k linii. Tímto způsobem jsou zachovány základní prostorové vztahy •Použitelné pro analýzy. Navíc tato topologická informace umožňuje body, linie a polygony uložit v neredundantní podobě (bez opakovaného zápisu). Geoinformatika Geoinformatika Vektorová reprezentace - topologie • Topologie je matematický způsob, jak explicitně vyjádřit prostorové vztahy mezi jednotlivými geometrickými objekty. • Proč vůbec topologie? Má jisté výhody, například: – Umožní ukládat data efektivněji. – Mnoho analýz v GIS využívá pouze topologické a nikoli geometrické vztahy. • Důvod pro využívání topologie (ESRI 1995): • "Topology is useful in GIS because many spatial modeling operations don't require coordinates, only topological information. For example, to find an optimal path between two points requires a list of the arcs that connect to each other and the cost to traverse each arc in each direction. Coordinates are only needed for drawing the path after it is calculated." Geoinformatika Tři základní topologické koncepty • Konektivita – dvě linie se na sebe napojují v uzlech. • Definice plochy – linie, které uzavírají nějakou plochu, definují polygon. • Sousednost - linie mají směr a nesou informaci o objektech nalevo a napravo od nich. Geoinformatika Kahoot 