GIS4SG Kartografická vizualizace Kartogramy – normalizace, klasifikace. podzim 2023 Lukáš Herman herman.lu@mail.muni.cz Opakování z minula ☺ Koblížková, A., Hána. D. (2023): Memorials as a part of the political symbolic space in Prague. Geografie. NEGATIVNÍ PŘÍKLAD • O jakou mapu jde? • Co se vám nepovedlo? • Řešili by jste to teď jinak? POZITIVNÍ PŘÍKLAD • O jakou mapu jde? • Co se vám na ní obzvláště povedlo? • Případně, jaké potíže jste museli překonat? Představení dvou svých map … − Čím se řídit? − Charakter zobrazovaných dat − Účel mapy − Uživatel − … Volba metody Kartogram = choropletová mapa z ruštiny a z angličtiny Volba metody https://www.linkedin.com/feed/update/urn:li:activity:7034157417185595392?updateEntityUrn= urn%3Ali%3Afs_feedUpdate%3A%28V2%2Curn%3Ali%3Aactivity%3A7034157417185595392% 29 Kartogram, choropletová mapa • Kartogram je mapa s dílčími územními celky, do kterých jsou plošným způsobem znázorněna statistická data (jedná se o relativní hodnoty) většinou geografického charakteru (Kaňok, 1999). • Vyjadřuje hodnotu jevu barvou (respektive odstínem šedé, rastrem, šrafováním), přičemž tyto barvy jsou uspořádány do stupnice • Výše uvedené se týká areálových/plošných dat, ale metoda intenzitních barev může být aplikována i na body nebo linie → • Nepravý kartogram – Tzv. kartogramy bez prostorového základu – Nepoužívají se data přepočtená na jednotku plochy – V praxi častější než běžný kartogram Měřítko a vymezení areálů Relativní a absolutní data • Můžu zobrazovat i absolutní data? – Jen když jsou použity jednotky stejného velikosti a tvaru • Jak je získat data relativní? – Už je stáhnu, dostanu, …. – Můžu je vypočítat z absolutních! • Normalizace, standardizace Normalizace • Dva obecné typy normalizace: – statistická normalizace – prostřednictvím dat – vizuální normalizace – s využitím grafických proměnných • úpravou sytosti (nebo průhlednosti) = „value-by-alpha“ mapa • úpravou velikosti jednotky = anamorfóza Bivariantní kartogram • Zobrazuje dvě charakteristiky Bivariantní kartogram – ArcGIS Pro Ke statistické normalizaci můžeme použít: 1)Plochu 2)Souhrnnou hodnotou za jednotku 3)Souhrnnou (průměr, modus, medián) hodnotou za všechny jednotky 4)Relevantní populaci 5)Předchozí časové období – viz vizualizace změn Normalizace plochou • Pravý kartogram • Vzniká hustota • Nejznámější příklad: hustota zalidnění (obyv./km2) Normalizace souhrnnou hodnotou za jednotku • Spočítám průměr/medián v jednotce • Je to sice průměr, ale nejsou to zase absolutní data?!? Normalizace souhrnnou hodnotou za všechny jednotky • Vypočítám průměr, modus, medián … za všechny územní celky • Dílčí jednotky pak znázorňují odchylku od „střední“ hodnoty Normalizace relevantní populací • „Per capita“ (na hlavu), na 1000 obyvatel, … • Počet obyvatel, počet nemocných, počet ekonomicky aktivních, počet domácností, … Normalizace předchozím časovým obdobím • Viz časové indexy Normalizace – závěr • Při normalizaci je nezbytně nutné, aby byla data normalizována vůči stejnému univerzu hodnot, ve kterých byly naměřeny dané jevy. – Podíl musí dávat smysl! • Př.: zastoupení nízkopříjmových domácnosti by měly být normalizovány vůči celkovému počtu domácností, nikoli vůči celkovému počtu obyvatel. • Pro pravdivou a efektivní kartografickou komunikaci dat je důležitá normalizace, a to jak statistická tak i vizuální. Klasifikace Klasifikace – příklad • Percentage of residents over the age of 25 in Wisconsin that possess a Bachelor's degree or higher in Wisconsin in 2016 by county • There are 72 values in the dataset representing one for each county, and the range is from a minimum of 10% and a maximum of 50%. • The data is based on the American Community Survey 5-year Estimates for educational achievement from 2012-2016 . • Data is modified very slightly for simplicity of illustration (the highest value, Dane County, rounded up to 50% from 49%, and lowest value, Clark County, rounded down to 10% from 11%). • The data is not heavily skewed, although there is a slight positive skew with some outliers. Klasifikace – metody 1) Stejné intervaly 2) Kvantily 3) Průměr a násobky směrodatné odchylky 4) Metoda maximálních zlomů (Maximum breaks) 5) Metoda přirozených zlomů 6) Vlastní • Jenks Stejné intervaly • Zadavá se počet intervalů a data jsou rozdělena do intervalů o stejném rozsahu (ArcGIS Pro: Equal Interval → počet; Defined Interval → šířka) • Mohou nastat připady, kdy v danem rozsahu třidy bude nula prvků! • Vzhledem k tomu, že v hraničních třidách se vyskytuji většinou málo četné odlehlé hodnoty, je toto rozděleni vhodné pro zvýraznění extrémů. • Není vhodné, pokud je rozděleni dat zešikmené nebo existuji v něm příliš odlehlé hodnoty. • Částečně související metodou jsou geometrické intervaly • Metoda definuje nejužší třídu a šířky ostatních tříd odvozuje pomocí proměnlivého násobného faktoru Kvantily • Kvartily, pentily, decily, percentily… • ArcGIS Pro: Quantile • Metoda rozděluje data do nerovnoměrně velkých tříd, ale se stejným počtem prvků ve třídách. • Metodu je vhodné použít v případě, kdy jsou data lineárně distribuována s přiměřeným počtem prvků s podobnými hodnotami nebo pokud se vyskytují extrémní hodnoty. • Metoda je nevhodná v případech velkého množství prvků s podobnými hodnotami Průměr a násobky směrodatné odchylky • Metoda vytváří třídy jako podíly směrodatné odchylky nad a pod průměrem dat, neboli ukazuje, jak moc se data odchylují od průměru • Ideální pro data kterém mají normální rozdělení • Není vhodná v případě velkého počtu extrémních hodnot. Metoda maximálních zlomů • Hledají se největší mezery v histogramu • Hranice se tříd se umístí do největších „mezer“ • Nevhodné v případě dat s několika odlehlými hodnotami Metoda přirozených zlomů • Natural breaks • Vychází z analýzy histogramu • Hledají se lokální minima (zlomy) • Subjektivní Vlastní klasifikace • Manuální zadání • Např. pokud jsou předem dány klíčové hodnoty • Při nevhodném zvolení šířky třídy se může stát, že poslední třída nesoucí maximální hodnoty může zůstat z velké části prázdná Jenks • Metoda hledá přirozené zákonitosti a seskupení v datech a vytváří třídy na základě těchto přirozených skupin. • Hranice jsou definovány v místech s relativně velkými rozdíly v datech • ArcGIS Pro: Natural Breaks (Jenks), v QGISu stejný název • Jedná se o univerzální klasifikační metodu, vhodnou pro většinu dat a začátečníky bez hlubší znalosti klasifikačních metod. • Vždy je však vhodné hranice intervalů manuálně upravit (zaokrouhlit) na „rozumné hodnoty“. Je klasifikace nutná? • Klasifikace usnadňuje a zrychluje čtení mapy = identifikaci prostorového vzoru Někdy to ale jde i bez klasifikace • Kontinuální barevná škála • Výšky extrudovaných areálů („3D“) nejsou ovlivněny klasifikaci do konečného počtu třid. V podstatě zobrazuji surová data a výška může napomoci například při volbě klasifikace. – Př.: výška areálu s dvojnásobnou hodnou zpracovávaného atributu je zobrazena jako dvojnásobná. – Funguje především v případě interaktivní 3D vizualizace Lze vyzkoušet zde: https://olli.wz.cz/3d_traffic_offences/speed-districts.html Zdroje: • Miklín, J., Dušek, R., Krtička, L., Kaláb, O. (2018). Tvorba map. Ostrava: Ostravská univerzita. ISBN: 978-80-7599-017-4, 302 s. https://tvorbamap.osu.cz/ke-stazeni/ • Kaňok, J. (1999). Tematická kartografie. Ostrava: Ostravská univerzita Přírodovědecká fakulta Ostravské univerzity. ISBN: 80- 7042-781-7, 318 s. • https://gistbok.ucgis.org/bok-topics/statistical-mapping- enumeration-normalization-classification • https://gistbok.ucgis.org/bok-topics/common-thematic-map-types • https://gistbok.ucgis.org/bok-topics/problems-scale-and-zoning • A odkazy přímo na slajdech