Kartografické modelování X – Prediktivní modelování jaro 2014 Petr Kubíček kubicek@geogr.muni.cz Laboratory on Geoinformatics and Cartography (LGC) Institute of Geography Masaryk University Czech Republic Kartografické modelování Podstata prediktivního modeování • Doposud jsme se zabývali problémem, jak počítač „vidí“ geografická dat prostřednictvím popisných (deskriptivních) technik a vytváří z nich oblasti s určitými vlastnostmi. • Další logický krok je použití „prediktivních – předpovědních“ technik k vytvoření extrapolačních map předvídajících budoucí podmínky. • Využití v řadě oblastí: – Predikce kriminality, – Archeologická naleziště – Výnosy plodin Kartografické modelování Případová studie• Využití prediktivního modelování pro precizní zemědělství (J. Berry). • Výnosy kukuřice – nízké (39 - červená) . Vysoké (279 – zelená) – závislá proměnná identifikující ten fenoméne (jev), který chceme predikovat. • Nezávislé proměnné jsou použity pro to, aby bylo možné odhalit prostorové vztahy a vytvořit predikční rovnici. • Využity data DPZ – odrazivost povrchu rostlin v červené a části spektra (RED) a v části blížící se infračervené (NIR). Kartografické modelování Případová studie II •Korelační diagram (Scatter plot) pro všechny existující dvojice hodnot. •Predikční rovnice vytvořená pomocí regresní analýzy – křivka nejlépe charakterizující datové rozložení. •Využití predikční rovnice pro další lokality. Kartografické modelování Kartografické modelování Případová studie IV • Problém? • Predikční křivka nevystihuje rozdělení dat nízké hodnoty R2 (jaké hodnoty jsou vyhovující?) • Možnosti využití kombinovaného indexu – NDVI • Normalized Density Vegetation Index (NDVI) • NDVI= ((NIR – Red) / (NIR + Red)) • Srovnání predikované a skutečné hodnoty (kalibrace modelu) – mapa odchylek. • Průměrná chyba 2,26 q/ha. Kartografické modelování Kartografické modelování Případová studie IV • Výsledky shlazují skutečné výnosy. • Nejedná se o skutečnou kalibraci modelu, ale spíše o první zjednodušený náhled, jaké by mohly výnosy být. • Jak můžeme výsledný model dále zlepšit? Kartografické modelování Případová studie V • Bližší pohled na mapu odchylek • Průměrná chyba 2,62 q/ha. • 67% odhadu +- 20 q/ha. • ALE – některé lokality až +144 a -173 q/ha. Kartografické modelování Případová studie VI • Řešení? • Stratifikace datové sady – rozdělení do skupin ze stejnými charakteristikami. Kartografické modelování Případová studie VII • Predikční rovnice bude lépe vystihovat jednotlivé vrstvy, než jedna rovnice pro celá data. • Více technik pro stratifikaci. • Využití histogramu – plus/minus směrodatná odchylka dělí histogram na 3 zóny. • Predikce funguje pro zónu 2. • Pro zóny 1 a 3 jsou výsledky pod a nadhodnocené. • Specifická predikční rovnice pro každou zónu by měla dát lepší predikci. Kartografické modelování Výpočet predikce pomocí separovaných predikčních rovnic • Vstupy – NDVI a výnosová mapa. • Algoritmus nejdříve zkontroluje mapu odchylek a určí, do které ze 3 zón daná oblast patří. • Následně jsou použity regresní rovnice pro predikci po zónách. • Složená predikční mapa vytvořena pomocí 3 rovnic a NDVI dat. Kartografické modelování Kartografické modelování Případová studie VIII • Vizuální srovnání : – Skutečné výnosy – Predikovaná mapa pro celou oblast – Predikovaná stratifikovaná mapa • Mapa odchylek pro stratifikovanou predikci – 80% odhadu je +- 20 q/ha. • Průměrná chyba je pouze 4q/ha. • Dobrá predikce úrody na základě DPZ více jak měsíc před sklizní  Kartografické modelování Kartografické modelování Na co dávat pozor? • Odlišné způsoby stratifikace dat: – Prostorové zóny – blízkost či vzdálenost od okraje pozemku. – Závislé mapové zóny – oblasti různé intenzity výnosů. – Datové zóny – půdní druhy, zrnitost, nutriční hodnoty. – Korelační mapové zóny – mikroreliéf – hřbety a deprese. Kartografické modelování Na co dávat pozor? • Citlivé užití mapy odchylek – zejména pro další extrapolaci v čase a prostoru. • Nutno využít dalších oblastí pro kalibraci a validaci. • V oblasti precizního zemědělství například možnost kombinace detailního měření v relativně dlouhé periodě (DPZ) s častým měřením s omezeným prostorovým výskytem (vzorky, senzory). Kartografické modelování Prediktivní modelování v ArcGIS • Obvykle se jednotlivé procedury modelování spouští samostatně a opakovaně. Možnost využít ModelBuilderu pro: 1) Zaznamenání všech postupných kroků v modelování; 2) Snadná opakovatelnost modelování a sdílení s dalšími uživateli; 3) Lepší vizuální reprezentace, která vede k lepšímu pochopení celého průběhu modelování.. Kartografické modelování Prediktivní modelování archeologického naleziště • Prediktivní modelování v archeologii – „nástroj pro vyjádření pravděpodobnosti výskytu archeologického naleziště kdekoliv v krajině“. • Snaha určit pravidla a preference pro výběr lokality danou kulturou. • Zahrnuje deskriptivní analýzu přírodních faktorů pro známé lokality a snahu najít společné opakující se kombinace. • Příklad: vybraná kultura (Mayové) preferovala historicky známá místa v blízkosti oceánu a mokřadů s výskytem porostů endemita Salvia apiana. • Která místa ve zkoumané oblasti odpovídají podmínkám?? Kartografické modelování 1. Omezení zkoumané oblasti • Omezení oblasti na severní Guatemalu a oříznutí vybraných vodních toků pomocí funkce Clip. • Vstupní a výstupní soubory + funkce. Kartografické modelování 2. Změření vzdálenosti lokalit od řeky • Říční síť nyní omezena na sledované území. • Určení vzdálenosti potenciálních archeologických nalezišť od říční sítě – Near. • Vyhledávací vzdálenost nastaveno na 5 km (=blízko). • Všechny lokality blíže než 5 km mají určenou přesnou (vzdušnou) vzdálenost (NEAR_DIST). • Ostatní lokality mají přiřazenu hodnotu -1. Kartografické modelování 3. Kombinace přírodních podmínek • Zjištění jaké přírodní podmínky obklopují naše archeologické lokality. • Vegetace – půdy – orientace svahu. • Nutná postupná analýza přírodních podmínek v několika krocích a postupné rozšíření atributové tabulky o přírodní ukazatele. • Použití nástroje Identity. • Vegetace +půdy= PP1 • PP1 + orientace=PP2 Kartografické modelování 4. Přírodní podmínky pro archeologické lokality • Spojení dat o archeologických lokalitách a PP2 pomocí nástroje IDENTITY. • Následný výběr potřebných atributů z tabulky – nástroj Idnetity zachovává všechny atributy a vytváří další. • Využití nástroje Frequency. Kartografické modelování Výběr atributů • Nutno zachovat: – NEAR_DIST - blízkost – DESC_ vegetace – R_FERT - půda – ASP_CODE - orientace Kartografické modelování Finální model Kartografické modelování 6. RUN a prozkoumání výsledků • Určení hlavních shluků přírodních podmínek. • Stanovení pracovních predikční hypotézy pro vybraná místa. • Ověření hypotézy.