1 Geostatistika ­ vymezení pojmu Geostatistika v užším slova smyslu ­ skupina interpolačních algoritmů založených na metodě krigingu. V širším slova smyslu ­ statistická analýza prostorově lokalizovaných dat. Pomocí ,,klasických" statistických metod lze vhodně analyzovat především atributová data ­ jejich kvantitativní či kvalitativní vlastnosti. Velmi omezeně však jimi lze charakterizovat prostorové vlastnosti objektů a jevů. Tyto prostorové vlastnosti jako např. spojitost jevů, prostorovou autokorelaci, prostorové uspořádání (strukturu) lze charakterizovat právě pomocí geostatistických metod. Obr. 1.1. Prezentace prostorového rozšíření spojitého jevu metodami popisné statistiky a pomocí tzv. semivariogramu. 2 Na obrázku jsou znázorněny dva příklady zcela rozdílného prostorového rozšíření jistého spojitého jevu ­ např. koncentrace znečištění území jistou látkou. Z níže uvedené tabulky základních popisných charakteristik i histogramů nelze zjistit žádný podstatný rozdíl v prostorovém uspořádání studovaného jevu v obou porovnávaných mapách. Ten je však patrný pokud prostorové rozšíření charakterizujeme pomocí tzv. semivariogramu, který patří k základním nástrojům strukturní analýzy a geostatistických metod. Geostatistika představuje především: ˇ Statistický popis prostorově lokalizovaných dat (geografických objektů) ˇ Statistický popis prostorového uspořádání objektů (bodů, linií, ploch) ˇ Koncept prostorové autokorelace ˇ Strukturní analýzu a popis prostorové autokorelace strukturními funkcemi ˇ Konstrukci spojitých polí metodami krigingu ˇ Objektivní metody klasifikace jevů Statistický popis bodů Body představují nejčastější způsob prezentace geografických jevů. Body jsou zpravidla umísťovány v těžišti objektů. Těžiště se konstruuje např. v místě křížení nejdelší a nejkratší osy objektu (zpravidla plochy). U konvexních objektů se tak může těžiště dostat i mimo vlastní objekt. To, jaké geografické objekty lze popsat pomocí bodů (tedy stupeň abstrakce) závisí na měřítku, ale také na druhu analýzy (pro modelování optimálního spojení v síti sídel je vhodné je prezentovat centroidem, který tvoří uzel sítě). Popisná statistika bodových objektů 1. Charakteristiky polohy 2. Charakteristiky rozptylu 3. Charakteristiky asymetrie 4. Charakteristiky špičatosti Popisují distribuci bodů pomocí základních statistických charakteristik. Používají se k porovnání více bodových vzorků nebo ke sledování jejich vývoje v čase. Jejich výpočet často předchází použití geostatistických metod. Umožňuje totiž ověřit některé vlastnosti studovaných souborů, které jsou pro aplikaci metod geostatistiky nezbytné. Jedná se o ověření takových vlastností jako je normalita rozdělení, stacionarita, linearita vztahu dvou veličin apod. Charakteristiky polohy Charakteristiky polohy slouží k určování geografického středu či mediánu. Průměrný střed (mean centre) Průměrný střed leží na průměru souřadnic X a Y. Má stejné nevýhody jako aritmetický průměr ­ je to především citlivost na extrémní hodnoty. Například v případě shlukového uspořádání bodů průměrný střed dobře nereprezentuje množinu bodů. = == n y n x yx n i i n i i mcmc 11 ,),( kde mcmc yx , jsou souřadnice průměrného středu, xi, yi jsou souřadnice bodu i a n je počet bodů. Vážený průměrný střed (weighted mean centre) Používá se v případě výskytu více událostí/objektů na stejném místě. Pak má každý bod váhu přímo úměrnou počtu událostí/objektů na tomto místě. Například při výpočtu prostorového průměru několika 3 měst bude průměrný střed dávat realističtější představu o centrální tendenci jestliže ho budeme vážit počtem obyvatel jednotlivých měst (nebo ­ koncentrací znečišťující látky v jednotlivých místech či frekvencí výskytu určitého jevu ). = = = = = n i i n i ii n i i n i ii wmcwmc w yw w xw yx 1 1 1 1 ,),( kde wi jsou váhy jednotlivých bodů. Mediánový střed (Median Center) Jedná se o analogii mediánu. Existuje však několik způsobů jeho definování: A. najdeme medián na ose X a Y a vedeme z nich linie kolmé na směr osy. Takto definovaný ,,medián ze souřadnic" ale nemusí odpovídat mediánu souboru bodů, protože distribuce nemusí být mezi kvadranty vyrovnaná. B. (UK) - Mediánový střed je střed, kterým se studovaná plocha dělí do čtyř kvadrantů, z nichž každý obsahuje stejný počet bodů. C. (US) - Mediánový střed jako střed vyžadující minimální (nejkratší) cestu. Tj. celková vzdálenost z mediánového středu do každého z bodů je minimální. Jinak řečeno ­ cesta z jakéhokoliv jiného místa do všech bodů oblasti bude delší než cesta z mediánového středu. Tuto podmínku lze vyjádřit vztahem: -+- 22 )()(min vyux ii kde xi a yi jsou souřadnice jednotlivých bodů a u, v jsou souřadnice mediánového středu. Analogickým způsobem lze definovat tzv. vážený mediánový střed: -+- 22 )()(min vyuxf iii Váhy fi pro jednotlivé body mohou být negativní či pozitivní podle toho, zda daný bod přitahuje či naopak odpuzuje polohu mediánového středu. K odvození polohy mediánového středu lze využít iteračního počtu, založeného na následujících krocích: 1. Zjistíme polohu průměrného středu jako iniciační pro hledání polohy mediánového středu. Tedy ),(),( 00 mcmc yxvu = 2. V iteračním kroku t najdeme novou polohu mediánového středu podle vztahů: 2 1 2 1 2 1 2 1 )()( )()( -- -- -+- -+- = titii titiii t vyuxf vyuxxf u 2 1 2 1 2 1 2 1 )()( )()( -- -- -+- -+- = titii titiii t vyuxf vyuxyf v 3. Druhý krok opakujeme do té doby, dokud vzdálenost mezi dvěma posledními polohami mediánového středu (ut, vt) a (ut-1, vt-1) je menší než vzdálenost a priori definovaná jako prahová. 4 Charakteristiky rozptylu Popisují distribuci hodnot kolem měr polohy Směrodatná vzdálenost (standard distance) Je mírou rozptylu hodnot v populaci kolem průměrného středu. Na rozdíl od směrodatné odchylky se udává v jednotkách vzdálenosti. Lze ji vyjádřit z následujícího vztahu: n yyxx SD n i n i mcimci = = -+- = 1 1 22 )()( Vážená směrodatná vzdálenost (weighted standard distance) Atributy jednotlivých bodů lze použít jako vah fi k vyjádření vážené směrodatné vzdálenosti: = = = -+- = n i i n i n i mciimcii f yyfxxf SD 1 1 1 22 )()( Směrodatná vzdálenost je nejčastěji používána ve formě kružnice kolem průměrného středu (Standard distance circle), jejíž poloměr je právě hodnota směrodatné vzdálenosti. Různé směrodatné vzdálenosti pro různý typ jevů lze zakreslovat do stejného území. Tyto kružnice nám dávají představu o rozptylu hodnot kolem střední hodnoty pro jednotlivé typy jevů. Mohou být použity i pro studium dynamiky jevů (různé kružnice pro jeden jev v různých časových horizontech). Obr. 1.2. Poloha váženého průměrného středu a kružnice směrodatné vzdálenosti pro pět měst ve státě Ohio. Jako váhy byl použit počte obyvatelstva Koeficient relativního rozptylu (coefficient of relative dispersion) Vypočte se jako poměr směrodatné vzdálenosti a poloměru kruhu se stejnou plochou jakou má studovaná oblast. Řeší výše uvedený problém použití absolutní míry směrodatné vzdálenosti. Je-li oblast různě velká (ohraničená), vznikají zavádějící hodnoty. K získání relativní míry při studiu variability obyvatelstva se někdy používá poloměr země nebo státu místo poloměru kruhu se stejnou plochou jakou má studovaná oblast. Koeficient relativního rozptylu vypočteme: R SD R SD A SD CRD k === 100100100 K dalším jednoduchým kritériím popisu uspořádání bodů patří např. hustota bodů v ploše (počet/plocha = n/R). Při výpočtech v relativně malých oblastech používáme euklidovskou geometrii, protože se v nich neprojeví zakřivení Země.