Geoinformatika IV - TIN a sběr dat jaro 2022 Petr Kubíček kubicek@geogr.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Geoinformatika Kompresní techniky pro rastry • Ztrátové – komprimují lépe než neztrátové – dochází ke ztrátě informace => někdy nevhodné! • Neztrátové – Run Length Codes – RLC – Run Length Encoding – RLE – Čtyřstrom – QuadTree – Adaptivní komprese Geoinformatika Run Length Codes • Definuje příslušnost buněk rastru k objektu po řádcích nebo sloupcích, přičemž udává jen začátek a konec úseku buněk v řádku či sloupci. • Pro černobílé/binární rastry Geoinformatika Run Length Encoding • Využití maticového zápisu dat. • Efektivní při rozsáhlých homogenních oblastech dat 1 1 1 1 5 5 9 9 9 9 9 9 9 2 9 9 9 (4 1)(2 5)(7 9)(1 2)(3 9) • Heterogenní  0 1 0 1 2 3 5 2 1 4 (1 0)(1 1)(1 0)(1 1)(1 2)(1 3)(1 5)(1 2)(1 1)(1 4) Jak zefektivnit kompresi? Geoinformatika Způsob procházení rastru • A) a B) - alternativy postupného procházení. • C) a D) – prostor vyplňující křivky (space-fill). • B) a D) jsou více efektivní – souvislost s Toblerovým zákonem (First law of Geography, autokorelace). Everything is related with everything else, but near things are more related than distant things. Geoinformatika Quad tree - čtyřstrom • Hierarchické uložení • Dělení kvadrantů až do doby, kdy jsou homogenní. Geoinformatika Hlavička rastru • NCOLS xxx • NROWS xxx • XLLCORNER xxx • YLLCORNER xxx • CELLSIZE xxx • NODATA_VALUE xxx • row 1 • row 2 • . • . • row n Geoinformatika Příklady rastrových formátů Geoinformatika Nepravidelná trojúhelníková síť • Nepravidelné rastrové reprezentace - problémy s tvorbou, analýzou i uložením – prakticky se nepoužívají. • Výjimkou je Nepravidelná trojúhelníková síť TIN (Triangulated Irregular Network). • Reprezentuje povrch jako soubor trojúhelníků (trojúhelníková), které jsou definovány třemi body umístěnými kdekoliv v prostoru. (nepravidelná) a pro tyto trojúhelníky uchovává topologické vztahy (síť). • Často se používá pro reprezentaci povrchů, například digitálního modelu reliéfu – DMR. Geoinformatika Principy triangulace • TIN je založen na tzv. Delaunay triangulaci (DT) • Pro sadu bodů P platí, že DT je validní, pokud uvnitř kružnice opsané k libovolnému trojúhelníku neleží žádný jiný bod množiny P. Geoinformatika Příklad tvorby trojúhleníků α + γ je větší než 180° Nekorektní triangulace Korektní triangulace α + γ je menší než 180° Geoinformatika TIN - porovnání s rastry • složitost datové struktury a tím i algoritmů s ní pracujících. + • zmenšení objemu uložených údajů při reprezentaci nehomogenních povrchů, • větší přesnost a věrnost pro nehomogenní povrchy • struktura automaticky obsahuje informace o sklonu a směru tohoto sklonu. • kompatibilita s moderními grafickými kartami . Geoinformatika Datové modely - shrnutí Vektorová data • geometrie prostorových objektů je vyjádřena za použití geometrických elementů; • základními geometrickými elementy jsou: bod, linie, polygon; • je možné pracovat s jednotlivými objekty jako se samostatnými celky; • atributy prostorových objektů jsou připojeny pomocí tabulky; • vztah mezi prostorovou objekty je zajištěný pomocí topologie; Rastrová data • rovinný prostor (pole, jev) je rozdělen pravidelnou mřížkou na jednotlivé dílky, zvané buňky (pixely); • poloha pixelu je dána jeho souřadnicemi (umístění v rastru); • každý pixel má v sobě jedinou hodnotu atributu; • prostorové vztahy mezi objekty jsou obsaženy v rastru. SBĚR DAT Geoinformatika Zdroje prostorových dat pro GIS • Naplňování databáze je v drtivé většině případu jednoznačně nejnáročnějším a nejzdlouhavějším krokem v rámci GIS projektu. • Obecně lze pro vstup použít různé zdroje údajů. • V úvahu přicházejí zvláštně mapy, náčrty v souřadnicovém systému, údaje z geodetických měření, fotogrammetrické snímky a obrazové záznamy DPZ, statistické údaje a další. • Při pořizování dat je ale důležité vybrat vhodný způsob a vhodná technická zařízení, která mi umožní získat data ve vhodné přesnosti a za přijatelnou cenu. • V zásadě je možné zdroje dat rozdělit na primární a sekundární. Geoinformatika Zdroje prostorových dat pro GIS • Primární – přímo měřená data – terestrická (pozemní/geodetická) měření – Globální polohové systémy (Global navigation satellite system GNSS - GPS, Glonass,…) – Fotogrammetrie – Dálkový průzkum Země (DPZ) – Laserové skenování (LIDAR) • Sekundární – již jednou zpracovaná data – manuální vstup přes klávesnici – digitalizace – skenování a vektorizace Geoinformatika Zdroje prostorových dat pro GIS Geodetická data Geoinformatika Zdroje prostorových dat pro GIS Geoinformatika Zdroje prostorových dat pro GIS - GNSS Global Navigation Satellite System (GNSS) – Globální družicový polohový systém • GPS NAVSTAR (Spojené státy americké) • GLONASS (Ruská federace) • Galileo (Evropská unie) • Baidu (Čína) Rádiový dálkoměrný systém Geoinformatika Segmenty GNSS • Uživatelský • Řídící • Vesmírný • GPS přijímač počítá rozdíly mezi vlastním časem a časem uvedeným v signálu družic pro zjištění vzdálenosti a polohy. • Vlivy atmosféry, povrchu, pohybu. Geoinformatika Signály vysílané družicemi GPS • družice vysílá signál, který tvoří dvě nosné vlny L1 a L2 a navigační zprávu. • Obě vlny modulovány dvěma pseudonáhodnými kódy – C/A kódem (pouze pro L1, krátká vlnová délka) a P-kódem (L1 i L2, lze uzamknout). • navigační zprava –základní informace o každém satelitu. Obsahuje tři hlavní komponenty: • 1. GNSS datum a čas, statut satelitu a informaci o jeho stavu, • 2. orbitální informace (efemeridy) – umožní přijímači vypočítat polohu družice, • 3. almanach = informaci o všech satelitech na orbitu, Geoinformatika Přijímač GNSS a výpočet polohy Typy přijímačů dle: • 1. Počet kanálů – jednokanálové (1 družice, přepínání kanálů, starší), vícekanálové (signál ze všech dostupných, 40 kanálů). • 2. Typ měřených dat: – Kódove měření – pracuje pouze s C/A kódem, přesnost 3–6 metrů, výpočet pomocí tranzitního času, – Fázová měření – pracuje přímo s fází nosných vln L1 a L2, založena na výpočtu z počtu vln nosného signálu mezi přijímačem a družicí, umožňuje postprocessing. 3. Uživatele – geodézie, armáda (uzamčení Pkódu), civilní (autonavigace, turistika). Geoinformatika Vliv počtu satelitů na určení polohy • 1 satelit = vzdálenost GNSS – satelit • Minimum 4 satelity Geoinformatika Další charakteristiky GNSS dat – Po zpracování jsou GPS data ve tvaru souboru [X,Y,Z] souřadnic a ty většina systémů umožní snadno zpracovat. – GPS se hojně používá pro navigaci, sledování objektů (vozidel, …) v reálném čase a analýzy v GIS na jejich základě. – GPS udává geografické souřadnice v souřadnicovém systému WGS 84, tudíž pro použití v ČR je nutné u získaných dat většinou převést data do jiného souřadnicového systému (S-JTSK). – produkuje vektorová data. Geoinformatika Laserové skenování Lidar • Light Detection and Ranging (LIDAR) • Princip LIDAR je postaven na aktivním senzoru, který vyšle laserový paprsek a zaznamená jeho zpětný odraz. • Odrazů může být několik, první je považován za digitální model povrchu (DMP, DSM – digital surface model). Poslední odraz je pak považován za digitální model reliéfu (DMR, DTM – digital terrain model). • Teprve potom se senzor otočí a zaznamenává další bod! • Existují letecké a pozemní scannery! Geoinformatika Lidar • Digitální model povrchu x model reliéfu Pokryté oblasti DMP DMR Geoinformatika Geoinformatika LLS - problémy Geoinformatika Horizontální skenování Geoinformatika Sekundární zdroje dat • Sekundární zdroje dat jsou již jednou zpracované primární zdroje • => jsou v nich obsaženy chyby získané již během prvního zpracování dat, tudíž nemohou být přesnější než zpracovávané primární zdroje. • Možnosti jejich vstupu do GIS – manuální vstup přes klávesnici (pracné, zdlouhavé) – digitalizace – skenování a vektorizace – import dat. Geoinformatika Manuální digitalizace • Využívá se tablet-digitizér, což je zařízení na snímání souřadnic s různě velkou pracovní plochou (obvykle A3-A0) a různou rozlišovací schopností a přesností . • Je třeba kalkulovat i s měřítkem podkladu! • Princip digitalizace – snímaný podklad se upevní na pracovní plochu a pomocí zaměřovacího kříže (kurzoru) je snímána poloha zaměřovaných bodů a z klávesnice nebo pomocí kurzoru se zadává identifikátor objektu. dvě základní metody digitalizace: – bodová (point) - kliká se na každém vrcholu, který je třeba zaznamenat. – proudová (stream) - počítač automaticky zaznamenává sekvence bodů v zadaném časovém nebo vzdálenostním intervalu. Geoinformatika Skenování a vektorizace • Stále rozšířenějším způsobem převodu dat z analogové do digitální (rastrové) formy. • zařízeních sloužících k optickému snímání dokumentů. • Typy skenerů: – Bubnové – Deskové (stolní) – Posuvné velkoformátové – 3D Geoinformatika Manuální zadávání atributů • Nejběžnější způsob zadávání atributových dat je manuálně, pomocí klávesnice, na což stačí pouze jednoduchý hardware. • Možné problémy s integritou dat – lze kontrolovat. • Atributy se následně navazují na prostorovou část pomocí unikátního identifikátoru, který prostorové prvky již obsahují (vytváří se obvykle již při jejich tvorbě). • Kontrola správnosti zadaných údajů. – Single Key Data Entry - jeden operátor zadává atributová data a druhý operátor již zadaná data kontroluje (porovnává originál s vytištěnými výpisy, …). – Double Key Data Entry - atributová data jsou zadávána dvěma na sobě nezávislými operátory (každý zadává stejná data) a poté se obě varianty v počítači porovnají. Při nalezení rozdílných hodnot se zadaný atribut překontroluje a opraví. Metoda se používá spíše na větší projekty, u kterých velice záleží na správnosti zadaných údajů. Geoinformatika Skenování + rozpoznávání textu • Další možností je scannování textu obsahující žádané atributy a poté jeho automatizované rozpoznávání pomocí nějakého OCR (Optical Character Recognition - nástroje na rozpoznávání písma) software. • Tato metoda, ačkoli relativně velice rychlá, je stále úspěšná jen z části a je možné ji aplikovat většinou pouze na již tištěný text (i z psacího stroje). Po automatickém převodu je navíc nutné vše pečlivě zkontrolovat (podobně jako u manuálního zadání pomocí metody Single Key Data Entry). • Problémy s diakritikou. • Další nevýhodou je obvyklá nutnost ručního navazování atributů na prostorovou část, podobně jako u ručního zadávání dat.