STATISTICKÉ METODY V GEOGRAFII Odhady parametrů intervaly spolehlivosti Základní pojmy l základní soubor, l statistický soubor l výběrový soubor l náhodný výběr l k základnímu jednomu souboru lze získat více výběrových, různé charakteristiky l U dobré výběrové metody - dílčí směrodatné odchylky se kompenzují l reprezentativnost výběru – kvalita výběru l prostý náhodný výběr ( s opakováním a bez opakování) l oblastní náhodný výběr ( výběr z každé dílčí části) l systematický náhodný výběr ( podle pravidla, které nesouvisí se sledovaným znakem, např. sledovaný znak - počet obyvatel obce, seřadit obce podle abecedy a vybrat vždy každou pátou obec) Intervaly spolehlivosti l normální rozdělení, l interval spolehlivosti hranice l hodnoty, které leží mimo interval, v tzv. kritickém oboru se považují za nepřípustné, jejich odchylky od průměru za významné l lze použít i jiné intervaly spolehlivosti l např. pro 95 % (μ + - 1,960σ), l pro 99 % (μ + - 2,576σ), Testování statistických hypotéz l jak ověřit předpoklady o charakteristikách statistických souborů? l Je soubor A výběrem ze souboru B? l Do jaké míry se soubory shodují v rozdělení četností, podle aritm. průměru, podle směrodatné odchylky apod. Příklad Rozdělení četností souborů A , a STATISTICKÁ HYPOTÉZA: l předpoklad: l aritmetický průměr počtu narozených dětí v jednom měsíci je u obou souborů shodný l NULOVÁ HYPOTÉZA l Ar. průměry četností obou souborů jsou shodné l zvolíme hladinu významnosti l např. 5% , tj. p= 0,05, tj. shoda je s pravděpodobností 95 %, l aplikace testovacího kritéria Testování l Testovací kriterium – T – test l Výsledek 0,995 l je výsledek testování významný ? l podle výsledku přijmeme nebo odmítneme nulovou hypotézu l Přijmeme příklad l Stejné soubory: l Do jaké míry se liší rozložení četností v souboru pro Brno venkov od základního souboru pro ČR? l Hladina významnosti: 99% l Nulová hypotéza: l Míra rozložení je shodná na hladině významnosti 99 %. Test Chí - kvadrát l Pro shodnost rozložení četností je vhodný test chí - kvadrát F -test – test shody rozptylů l Příklad l Cvičné soubory A, a l Hladina významnosti: 95% l Nulová hypotéza: rozptyly obou souborů jsou shodné l Aplikace testovacího kriteria: F test l Výsledek: 0,958 l Přijmeme nul. hypotézu Obecný postup testování vybr. charakteristik statistických souborů l Stanovení hladiny významnosti (95%, 99%) l Formulace nulové hypotézy l Aplikace testovacího kriteria: l ( Chí – kvadrát – četnost, l F test - rozptyl l T – test – dvě stat. charakteristiky l Výsledek testování l Přijetí * odmítnutí nulové hypotézy Závislost náhodných veličin Závislost náhodných veličin l vztahy: – Počet obyvatel a název obce – teplota a nadm. výška, – Rok narození a jméno člověka – srážky a odtok v povodí – výška a váha člověka Závislost náhodných veličin l Do jaké míry závisí změna prvku jednoho statistického souboru změnu prvku druhého statistického souboru? l Jak podmiňuje změna prvku x změnu prvku y? l Jak těsně na sobě závisí prvky dvourozměrného statistického souboru? Vztahy náhodných veličin l Jednostranné ( nezávislá hodnota x jednoho stat. souboru podmiňuje hodnotu y druhého stat. Souboru l Vzájemné (nelze rozlišit závislou a nezávislou proměnou) Vztahy náhodných veličin podle stupně závislosti l Funkční ( pevnou) – ( určité hodnotě x odpovídá jediná hodnota y, vztah x a y lze tedy vyjádřit mat. funkcí), – např. konkrétní teplotě odpovídá jedna hodnota stupně nasycení vodní párou Vztahy náhodných veličin podle stupně závislosti l Statistická – ( jedné hodnotě x odpovídá více hodnot y, hodnoty y mají své rozdělení s průměrem, tento průměr hodnot y je i pro různá x shodný) Vztahy náhodných veličin podle stupně závislosti l Korelační – Se změnou hodnot x se mění soubory hodnot y, které mají své rozdělení a různých průměrech – např. pro určitou těl výšku existuje více hodnot hmotnosti, které budou mít normální rozdělení, – Př. Pro 170 cm existuje norm. rozdělení hmotností o průměru 68 kg, pro 180 cm opět normální rozdělení hmotností s průměrem 76 kg Obrázky vztah x a y l Funkční závislost hodnoty y ( tj. závislé) na x (nezávislé) l Statistická dtto l Korelační dtto l Korelace je druh závislosti mezi prvky dvou souborů l Regresní čára znázorňuje graficky tuto korelační závislost Př. lineární regrese l Vypočítejte parametry lineární regrese pro vztah délky slunečního svitu a teploty na datech meteorol. stanice Tuřany, 2002 Intervaly a pásy spolehlivosti pro lineární regresní závislost l Kolem regresní přímky lze sestrojit l interval spolehlivosti, l který určuje pro vybrané x interval, ve kterém se budou s určitou pravděpodobností nacházet hodnoty y