1 Statistická analýza liniových prvků Linie mohou vystupovat na třech úrovních, které představují jistou hierarchii: 1. ,,Prosté" linie ­ např. zlomy ­ lze určit jen délku a orientaci. Může existovat jako jednoduchá spojnice dvou bodů či jako ,,řetězec" 2. ,,Trajektorie" ­ vektor pole větru ­ lze určit velikost (délku), orientaci a směr 3. Sítě - dopravní sítě, říční síť ­ lze určit prostorové uspořádání ­ topologické vztahy, konektivitu, dostupnost, ... Prostorové atributy liniových prvků Délka linie může být definována jako: ˇ přímá vzdálenost (vypočtená z Pythagorovy věty) ˇ ,,skutečná" vzdálenost (součet přímých vzdáleností jednotlivých segmentů) Orientace linie - orientace neurčuje směr (např. JV = SZ) ­ orientace zlomů, ulic. Nemá smysl otázka odkud - kam? Směr linie - typicky např. vektor pole větru Uvedené atributy linií lze vyjádřit pro jednotlivé segmenty sítě či pro celou síť jako celek (průměrná délka segmentů sítě, převládající orientace či směr segmentů sítě, ...). Topologie - atributy popisující jejich strukturu a uspořádání jako celek a dále popisují vztahy segmentů uvnitř sítě (topologii) ­ konektivita, segmentů, dostupnost, apod. Směrová statistika (Directional statistics) Směrový průměr (directional mean). Směr výsledného vektoru ox oy R =tan kde oy je suma délek vektorů ve směru osy y a ox suma délek vektorů ve směru osy x. Protože pracuje se směrem (úhlem) a ne s délkou, je možné linii prezentovat na základě jednotkových vektorů. Vektorovým součtem ­ přidáním počátku druhého vektoru na konec prvního dostaneme směrový průměr. Délka ve směru osy y je v podstatě sin úhlu a délka na ose x je cosinus úhlu. Potom, jsou-li vektory označeny a, b, c a odpovídající úhly a, b, c, potom: cba cba R coscoscos sinsinsin tan ++ ++ = Obecně, máme-li n vektorů v a úhel vektoru v od osy x je v, výsledný vektor OR má úhel R, měřený proti směru hodinových ručiček od osy x: = v v R sin sin tan což je tedy tangenta úhlu výsledného vektoru. Směrový průměr je potom arctan z výše uvedeného výrazu. Směrový průměr Prostorové atributy liniových prvků 0 10 20 30 40 50 km toky v povodí Jihlavy po Oslavu toky v povodí Oslavy Vodní toky v povodí horní Jihlavy a v povodí Oslavy 2 Směrový rozptyl (Circular variance) Pokud dáme dohromady vektory podobného směru, výsledný vektor bude relativně dlouhý. Jeho délka se bude blížit n, pokud bude n jednotkových vektorů. Naproti tomu, pokud dáme dohromady vektory opačného či značně rozdílného směru, výsledný vektor bude významně menší než n. Délku výsledného vektoru můžeme použít jako statistiku, která reflektuje variabilitu ve směru jednotlivých vektorů. Na základě výše uvedeného tedy platí: += 22 )cos()sin( vvOR Stejně jako v případě klasické popisné statistiky je charakterizování souboru prvků pouze měrou úrovně často nedostatečné a může být i zavádějící. (např. pokud dva vektory budou svírat úhel 180 stupňů). Proto je nutné použít i měr variability (rozptylu). Směrový rozptyl Směrový rozptyl Sv se vypočte ze vztahu: nORSv /1-= kde n je počet vektorů. Sv může nabývat hodnot 0 až 1. Je-li Sv=0, potom OR=n a všechny vektory mají stejný směr. Je-li Sv=1, potom OR=0, všechny vektory mají opačný směr a výsledný vektor je bod. Úvod do statistického popisu sítí Základní pojmy používané v síťové analýze: ˇ nódy ˇ hrany (spoje) Deskriptory sítě: ˇ deskriptory sítě jako celku ˇ deskriptory relací jednotlivých segmentů sítě. Základním topologickým aspektem sítě je způsob propojení jednotlivých segmentů ­ konektivita. Vhodným nástrojem používaným k charakterizování konektivity je matice konektivity. Je to matice čtvercová, binární, symetrická o n řádcích (sloupcích), kde n je počet segmentů sítě. Jednička v matici značí, že dva příslušné segmenty jsou bezprostředně spojeny. Na hlavní diagonále matice jsou nuly. Konektivita a matice konektivity ID 1 2 3 4 5 6 7 8 9 10 1 0 1 1 0 0 0 1 0 0 1 2 1 0 1 0 0 0 0 0 0 0 3 1 1 0 1 1 0 0 0 0 0 4 0 0 1 0 1 1 0 0 0 0 5 0 0 1 1 0 1 0 0 0 0 6 0 0 0 1 1 0 0 0 0 0 7 1 0 0 0 0 0 0 1 1 1 8 0 0 0 0 0 0 1 0 1 0 9 0 0 0 0 0 0 1 1 0 0 10 1 0 0 0 0 0 1 0 0 0 Konektivita a matice konektivity Matice konektivity shrnuje informaci o tom, které segmenty sítě spolu souvisí (jsou bezprostředně spojeny). Lze však charakterizovat i úroveň konektivity sítě jako celku. Pro fixní počet vrcholů má síť s větším počtem spojů lepší konektivitu. Dále existuje minimální počet spojů, který zajišťuje spojení všech vrcholů. Bude-li v ­ počet vrcholů sítě, e - počet hran sítě potom: 1min -= ve Minimálně propojená síť (Minimally conneted network - MCN) ­ odstraníme­li jakoukoliv jednu hranu, síť se rozpadne na dva subsystémy. Podobně lze pro daný počet vrcholů vytvořit maximální počet hran, které spojují všechny vrcholy. Tedy maximální počet hran v síti o v vrcholech: )2(3max -= ve Jednoduchou charakteristikou konektivity sítě je Gama index () ­ je definován jako poměr aktuálního a maximálního počtu vrcholů sítě. maxe e = Gama index 3 Další jednoduchou charakteristikou konektivity sítě je počet okruhů. Výskyt okruhů v síti značí možnost dostat se z jednoho místa do jiného alternativními cestami. Síť s minimální konektivitou nemá žádný okruh. Počet okruhů lze zjistit tak, že od aktuálního počtu hran v síti odečteme počet hran potřebný pro minimálně propojenou síť (MCN), tedy e-(v-1) nebo e-v+1. Obdobně pro daný počet vrcholů je maximální počet okruhů roven 2v-5. S oběma uvedenými počty okruhů lze vytvořit poměr aktuálního počtu k počtu maximálnímu ­ tedy tzv. alfa index 52 1 - +- = v ve Pomocí alfa indexu můžeme snadno porovnat dvě sítě. Alfa index Prostorová diferenciace větrných poměrů definovaná směrovým průměrem a rozptylem Dostupnost sítě (Acccessibility) Jedná se o charakteristiku jednotlivých vrcholů či hran sítě. Popisuje jejich dostupnost v rámci sítě. Další výklad se týká dostupnosti hran sítě, obdobné vztahy lze definovat i pro vrcholy. Jednoduchým ukazatelem dostupnosti hrany v rámci sítě je, s kolika jinými hranami daná linie přímo souvisí. Tuto informaci lze vyčíst z binární matice konektivity, pokud tuto doplníme řádkovým součtem. ID 1 2 3 4 5 6 7 8 9 10 SUMA 1 0 1 1 0 0 0 1 0 0 1 4 2 1 0 1 0 0 0 0 0 0 0 2 3 1 1 0 1 1 0 0 0 0 0 4 4 0 0 1 0 1 1 0 0 0 0 3 5 0 0 1 1 0 1 0 0 0 0 3 6 0 0 0 1 1 0 0 0 0 0 2 7 1 0 0 0 0 0 0 1 1 1 4 8 0 0 0 0 0 0 1 0 1 0 2 9 0 0 0 0 0 0 1 1 0 0 2 10 1 0 0 0 0 0 1 0 0 0 2 Výše uvedená charakteristika však může být zavádějící, protože nebere v úvahu relativní (topologickou) polohu hrany v rámci sítě. Hrana může mít i pouze jeden či dva spoje, přesto může být snadno dostupná, protože se nachází uprostřed sítě (a naopak). Relativní pozici každé hrany v rámci sítě lze zjistit např. pomocí počtu hran, kterými se lze z daného spoje dostat do nejvzdálenějšího místa sítě. Dostupnost sítě Diametr (poloměr) sítě ­ je to jedna (1) plus největší počet hran nutných k dosažení nejvzdálenějšího místa v síti. ID počet přímých spojů počet kroků k dosažení nejvzálenějšího místa 1 4 3 2 2 3 3 4 3 4 3 4 5 3 4 6 2 5 7 4 4 8 2 5 9 2 5 10 2 4 Kvalitu spojení dvou hran (vrcholů) definuje počet hran mezi nimi. Spojení mohou být přímá a nepřímá. Každou hranu lze popsat počtem přímých a nepřímých spojů, které jsou třeba, aby tato byla spojena se všemi hranami ostatními. Nepřímé spoje lze vážit počtem kroků. Zřejmě platí, že čím větší je celkový potřebný počet spojů, tím hůře dostupná je daná hrana. Celkový počet spojů (přímých i nepřímých) je mírou dostupnosti. Dostupnost sítě ID počet přímých spojů celkový počet přímých a nepřímých spojů 1 4 15 2 2 19 3 4 16 4 3 21 5 3 21 6 2 28 7 4 18 8 2 25 9 2 25 10 2 20 Okres Třebíč Jihlava Počet vrcholů 127 118 Počet hran 132 127 Gama index 0,352 0,364943 Alfa index 0,0240964 0,04329