1 Statistický popis prostorově lokalizovaných dat „POINT DESCRIPTORS“ • Charakteristiky polohy • Charakteristiky rozptylu • Charakteristiky asymetrie • Charakteristiky špičatosti Popisná statistika bodových objektů „POINT DETECTORS“ Statistický popis bodů • To, jaké geografické objekty lze popsat pomocí bodů (tedy stupeň abstrakce) závisí na měřítku, ale také na druhu analýzy • Např. pro modelování optimálního spojení v síti sídel je vhodné je prezentovat centroidem, který tvoří uzel sítě). • Výpočet popisné statistiky často předchází použití geostatistických metod. • Umožňuje totiž ověřit některé vlastnosti studovaných souborů, které jsou pro aplikaci metod geostatistiky nezbytné. • Jedná se o ověření takových vlastností jako je normalita rozdělení, stacionarita, linearita vztahu dvou veličin apod. • Body představují nejčastější způsob prezentace geografických jevů. Jsou zpravidla umísťovány v těžišti objektů. Průměrný střed (mean centre) Charakteristiky polohy Charakteristiky polohy slouží k určování geografického středu či mediánu. Průměrný střed leží na průměru souřadnic X a Y. Má stejné nevýhody jako aritmetický průměr – je to především citlivost na extrémní hodnoty. Například v případě shlukového uspořádání bodů průměrný střed dobře nereprezentuje množinu bodů.         = ∑∑ == n y n x yx n i i n i i mcmc 11 ,),( Kde xi, yi jsou souřadnice bodu i a n je počet bodů. Vážený průměrný střed (weighted mean centre) Používá se v případě výskytu více událostí/objektů na stejném místě. Pak má každý bod váhu přímo úměrnou počtu událostí/objektů na tomto místě. Např. při výpočtu prostorového průměru několika měst bude průměrný střed dávat realističtější představu o centrální tendenci jestliže ho budeme vážit počtem obyvatel jednotlivých měst (nebo – koncentrací znečišťující látky v jednotlivých místech či frekvencí výskytu určitého jevu ).         = ∑ ∑ ∑ ∑ = = = = n i i n i ii n i i n i ii wmcwmc w yw w xw yx 1 1 1 1 ,),( kde wi jsou váhy jednotlivých bodů. i X Y váha wX wY 1 2 3 3 000 6 000 9 000 2 4 7 500 2 000 3 500 3 7 7 400 2 800 2 800 4 7 3 100 700 300 5 6 2 300 1 800 600 sum 26 22 4 300 13 300 16 200 w MC 3.09 3.77 ∑ ∑ ∑ ∑ == == i n i ii i n i ii w Yw Y w Xw X 11 , 0 105 0105 2,3 7,7 7,3 6,2 4,7 Vážený průměrný střed (weighted mean centre) Agregovaný průměrný střed Je alternativou váženého středu, kdy se nepoužívají původní souřadnice X,Y ale jen souřadnice čtverců s agregovaným počtem bodů uvnitř čtverce:         = ∑∑ == N yF N xF yx n i ii n i ii amcamc 11 ,),( N je celkový počet čtvercových buněk, obsahujících body Fi je frekvence bodů ve čtvercové buňce xi a yi jsou souřadnice čtvercových buněk i je od 1 do N. 2 Mediánový střed (Median Center) 1. najdeme medián na ose X a Y a vedeme z nich linie kolmé na směr osy. Takto definovaný „medián ze souřadnic“ ale nemusí odpovídat mediánu souboru bodů, protože distribuce nemusí být mezi kvadranty vyrovnaná. 2. (UK) - Mediánový střed je střed, kterým se studovaná plocha dělí do čtyř kvadrantů, z nichž každý obsahuje stejný počet bodů. 3. (US) - Mediánový střed jako střed vyžadující minimální (nejkratší) cestu. Tj. celková vzdálenost z mediánového středu do každého z bodů je minimální. Jinak řečeno – cesta z jakéhokoliv jiného místa do všech bodů oblasti bude delší než cesta z mediánového středu. Tuto podmínku lze vyjádřit vztahem: ∑ −+− 22 )()(min vyux ii kde xi a yi jsou souřadnice jednotlivých bodů a u, v jsou souřadnice mediánového středu. Analogickým způsobem lze definovat tzv. vážený mediánový střed: ∑ −+− 22 )()(min vyuxf iii Váhy fi pro jednotlivé body mohou být negativní či pozitivní podle toho, zda daný bod přitahuje či naopak odpuzuje polohu mediánového středu Mediánový střed (Median Center) K odvození polohy mediánového středu lze využít iteračního počtu, založeného na následujících krocích: 1. Zjistíme polohu průměrného středu jako iniciační pro hledání polohy mediánového středu. Tedy: ),(),( 00 mcmc yxvu = 2. V iteračním kroku t najdeme novou polohu mediánového středu podle vztahů: 2 1 2 1 2 1 2 1 )()( )()( −− −− −+− −+− = ∑ ∑ titii titiii t vyuxf vyuxxf u 2 1 2 1 2 1 2 1 )()( )()( −− −− −+− −+− = ∑ ∑ titii titiii t vyuxf vyuxyf v 3. Druhý krok opakujeme do té doby, dokud vzdálenost mezi dvěma posledními polohami mediánového středu (ut, vt) a (ut-1, vt-1) je menší než vzdálenost a priori definovaná jako prahová. Vlastnosti charakteristik polohy • Průměrný střed minimalizuje sumu čtverců vzdáleností • Mediánový střed minimalizuje sumu vzdáleností – jeho interpretace je jednodušší • Nejčastěji se využívá váženého mediánového středu (demografie) • Charakteristiky polohy bez uvedení charakteristik rozptylu mají malou vypovídací schopnost a mohou být zavádějící Charakteristiky rozptylu Směrodatná vzdálenost (standard distance) n yyxx SD n i n i mcimci∑ ∑= = −+− = 1 1 22 )()( ∑ ∑ ∑ = = = −+− = n i i n i n i mciimcii f yyfxxf SD 1 1 1 22 )()( Vážená směrodatná vzdálenost (weighted standard distance) Směrodatná vzdálenost je nejčastěji používána ve formě kružnice kolem průměrného středu (Standard distance circle), jejíž poloměr je právě hodnota směrodatné vzdálenosti. Různé směrodatné vzdálenosti pro různý typ jevů lze zakreslovat do stejného území. Tyto kružnice nám dávají představu o rozptylu hodnot kolem střední hodnoty pro jednotlivé typy jevů. Mohou být použity i pro studium dynamiky jevů (různé kružnice pro jeden jev v různých časových horizontech). Poloha váženého průměrného středu a kružnice směrodatné vzdálenosti pro pět měst ve státě Ohio. Jako váhy byl použit počet obyvatelstva Směrodatná vzdálenost (standard distance) je absolutní mírou – je problematické její použití k porovnání několika souborů Vhodnější jsou míry relativní 3 Koeficient relativního rozptylu • Poměr směrodatné vzdálenosti a poloměru kruhu se stejnou plochou jakou má studovaná oblast. • Řeší problém použití absolutní míry směrodatné vzdálenosti. Je-li oblast různě velká (ohraničená), vznikají zavádějící hodnoty. • K získání relativní míry při studiu variability obyvatelstva se někdy používá poloměr země nebo státu místo poloměru kruhu se stejnou plochou jakou má studovaná oblast. R SD R SD A SD CRD k π π ∗∗=∗=∗= 100100100 Směrodatná elipsa odchylek (Standard Deviational Ellipse) V mnoha případech může vykazovat prostorové rozdělení jevů určité rysy směrovosti (directional bias): rozdělení míst nejčastějších dopravních nehod podél dálnice, výskyt určitého druhu rostlin či živočichů kolem pobřeží atd. V tomto případě se použití kružnice jako míry rozptylu hodnot jeví jako nevhodné. Jako logické rozšíření směrodatné kružnice odchylek se může jevit použití směrodatné elipsy odchylek. Tuto elipsu popisují tři atributy: • úhel rotace • směrodatná odchylka podél hlavní osy elipsy • směrodatná odchylka podél vedlejší osy elipsy Směrodatná elipsa odchylek Jestliže prostorové rozmístění bodů vykazuje jistou směrovost, potom maximální rozptyl bude orientován v souladu s hlavní osou elipsy. Kolmo k tomuto směru bude směr minimálního rozptylu hodnot. Úhel rotace elipsy je definován jako úhel mezi směrem k severu a osou y ve směru pohybu hodinových ručiček: Odvození směrodatné elipsy odchylek 1. Vypočteme souřadnice průměrného středu (xmc, ymc), které budou počátkem transformovaného systému souřadnic. 2. Pro každý bod budeme transformovat jeho souřadnice: mcii yyy −=' mcii xxx −=' Určení úhlu rotace transformovaného systému: ∑ ∑ ∑∑∑ ∑∑ ∑ = = === == =       +      −+      − = n i n i ii n i i n i i n i n i ii n i n i ii yx yxyxyx 1 1 '' 2 1 ' 1 ' 2 1 1 2'2' 1 1 2'2' 2 4 tanθ Pozor na interpretaci hodnoty úhlu rotace ! Odvození směrodatné elipsy odchylek 3. Získáme-li úhel θ, potom lze vyjádřit hodnoty odchylek podél x a y osy: n yx n i ii x ∑ = − = 1 2'' )sincos( θθ δ n yx n i ii y ∑ = − = 1 2'' )cossin( θθ δ 4 Směrodatná elipsa odchylek – příklady použití • Množství kontaminující látky ve vzorku studní může indikovat trend jejích šíření • Porovnání velikosti, tvaru resp. překryvu elips k porovnání změn v rozšiřování etnik či rostlinných resp. živočišných společenstev • Epidemiologie – vystižení hlavního trendu šíření onemocnění v populaci Poznámky k deskripci bodů • hustota bodů v ploše (počet/plocha = n/R), • charakteristiky založené na vzdálenosti mezi body či na relativních vzdálenostech jako je např. di/dmax. • použití – porovnávání (např. v čase) • při výpočtech v relativně malých oblastech používáme euklidovskou geometrii, protože se v nich neprojeví zakřivení Země. • uvedené míry mohou být aplikovány i na plochy.