Aplikace regresní analýzy v humánní geografii Všeobecná souvislost jevů * Souvislost jevů *náhodná *příčinná souvislost • výskyt jedné proměnné podmiňuje výskyt jiné • nebo existuje další proměnná, která je společnou příčinou současného výskytu obou (všech) sledovaných proměnných * Náhodnost a příčinnost souvislostí je relativní *odpovídá stupni našeho poznání * Příklad: *srážky a nadmořská výška • příčinná souvislost * věk nevěst a věk ženichů • není příčinná souvislost, podmíněno komplexem faktorů životního cyklu * Zřetězení příčin a následků *proměnné mohou být v jednom vztahu příčinami a v jiném následky Funkční a stochastická závislost * Funkční (pevná) závislost *vždy dostaneme stejný nebo velmi podobný výsledek *typická v neživé přírodě (fyzika, chemie) • zákonitost • příklad: vztah teploty a objemu tělesa *mezi společenskými (geografickými) jevy se nevyskytuje * Stochastická (volná, statistická) závislost *při změnách nezávisle proměnné se zpravidla (v průměru) mění hodnoty závisle proměnné • ale ne v každém jednotlivém případě * Ve společenských procesech *vždy komplex příčin a následků *jednotlivé proměnné je obtížné identifikovat • mění se v prostoru a čase Postup zkoumání vztahu mezi proměnnými * Začátek analýzy: formulace hypotéz *o možných vnitřních příčinných souvislostech • logický rozbor vzájemného vztahu proměnných * Ověření existence závislosti *zda vůbec existuje (je významná) *jaký je její základní charakter • pozitivní • negativní *jaký je její specifický charakter • tvar (= regrese) *zjištění těsnosti závislosti (síly, intenzity závislosti) • do jaké míry zjištěné schéma platí? • kolik případů vztahů mezi proměnnými mu vyhovuje? Korelační vs. regresní analýza * Korelační analýza *první informace o existenci vtahu a jeho základním charakteru *měří intenzitu lineární závislosti mezi dvěma proměnnými * Regresní analýza *více ucelený proces studia vztahu mezi závisle proměnnou a souborem nezávisle proměnných Lineární regrese * Předpokládá lineární závislost *závisle proměnná (y) *nezávisle proměnné (vysvětlující, explanatory) (x) * Prokládá (vyrovnává) hodnoty přímkou * Zkoumá účinek (effect) proměnné x na y * Významným výsledkem analýzy je regresní rovnice *umožňuje předpovídat hodnoty y z hodnot x ŷ = a + bx • ŷ … předpokládaná hodnota y (predicted value) • x … pozorovaná hodnota x • a …intercept (průsečík, konstanta) (místo kde regresní přímka protíná vertikální osu) • b …sklon přímky • a, b … parametry regresní rovnice (přímky) Lineární regrese * Intercept (konstanta) nemusí mít vždy reálnou interpretaci *příklad: vztah ceny domu a jeho velikosti * Rezidua *rozdíl mezi očekávanou a skutečnou (naměřenou) hodnotou * Cíl regresní analýzy: *najít parametry (a,b) nejlépe vyhovující přímky/křivky • metoda nejmenších čtverců s minimalizace součtu čtverců vertikálních vzdáleností (= minimalizace součtu čtverců reziduí) Korelační analýza Závislost volební podpory KDU-ČSL (y) na podílu katolíků (x) Regresní přímka Závislost volební podpory KDU-ČSL (y) na podílu katolíků (x) Regresní přímka Závislost volební podpory KDU-ČSL (y) na podílu katolíků (x) Regresní křivka (kvadratická rovnice) Závislost volební podpory KDU-ČSL (y) na podílu katolíků (x) Regresní křivka (kvadratická rovnice) Závislost volební podpory KDU-ČSL (y) na podílu katolíků (x) Regresní křivka (kvadratická rovnice) Závislost volební podpory KDU-ČSL (y) na podílu katolíků (x) Regresní křivka (kvadratická rovnice) Závislost volební podpory KDU-ČSL (y) na podílu katolíků (x) Jednoduchá regresní analýza Závislost volební podpory KDU-ČSL (y) na podílu katolíků (x) Jednoduchá regresní analýza Graf: residua (x) a závisle proměnná - podpora KDU-ČSL (y) Histogram reziduí Histogram: residua (x) a četnost (frequency) (y) Příklad: podmíněnost suburbanizace vzdáleností od centrálního města Závisle proměnná: migrační saldo s Brnem na 1000 obyvatel Zázemí Brna, období 2000-04, obce do 18 km od Brna Vztah mezi migračním saldem s Brnem (na 1000 obyvatel) a vzdáleností od Brna Srovnání období 1991-1995 (zelená) a 2000-04 (modrá) Vícenásobná regrese * Závisle proměnná: *volební podpora KDU-ČSL * Nezávisle proměnné *podíl katolíků *volební účast Graf (scatterplot) Vícenásobná regrese Vícenásobná regrese Příklad: Využití regresní analýzy v politické geografii * Pramen: Tatu Vanhanen (1987) The level of democratization related to socioeconomic variables in 147 countries * Výchozí otázka: co podmiňuje nerovnoměrné rozložení stupně demokracie ve světě? * Východiska: * Demokracie je ve světě nerovnoměrně rozšířena • některé státy jsou více demokratické než jiné, některé nejsou demokratické vůbec * Existuje řada teorií, které vysvětlují stupeň demokracie charakterem společnosti * Jednotlivé teorie zdůrazňují význam různých faktorů • S. M. Lipset: úroveň hospodářského a sociálního rozvoje • R. Gastil: nezáleží tolik na hospodářství, ale na přijetí demokratických myšlenek • J. Linz: klíčové jsou politické proměnné („politické dovednosti“ charakter politického systému) • S. Huntington: důležité jsou kulturní faktory (vedle socioekonomických) • I. Wallerstein: záleží více na vnějších než na vnitřních podmínkách Vstupní hypotéza * Formulace vstupní hypotézy: * politika je zápasem o kontrolu zdrojů * proto rozložení moci ve společnosti odpovídá rozložení hlavních zdrojů moci ve společnosti • různé formy moci: politická, ekonomická, ideologická, vojenská * pokud jsou zdroje moci rozloženy mezi různé společenské skupiny – existují dobré předpoklady pro demokracii * pokud jsou koncentrovány v rukou malé skupiny – špatné předpoklady (dobré předpoklady pro autokracii) * tedy: relativní rozložení moci mezi jednotlivé části populace je předpokládanou podmínkou pro vysvětlené stupně demokracie * Testování hypotézy * hodnocení vztahu mezi stupněm demokracie a rozložením (některých) zdrojů moci (charakteristik společnosti) • existuje závislost? • je dostatečně silná? * ale: empirická analýza poskytne vždy jen částečné vysvětlení • teoretické koncepce jsou neúplné • část rozdílů mezi politickými systémy je zřejmě náhodná • nemáme dostatek dat… Operacionalizace * Metoda: *závisle proměnná: stupeň demokracie *nezávisle proměnné: vystihují rozložení zdrojů moci ve společnosti *jednotky analýzy: 147 států (s více než 200 000 obyvateli, nezávislé, existují data) * Operacionalizace:jak měřit stupeň demokracie? *demokracie má dvě hlavní dimenze: konkurenci a participaci *konkurence: stupeň konkurence mezi politickými subjekty (stranami) • podíl hlasů ve volbách pro všechny strany s výjimkou nejsilnější s byla jen jediná strana? → konkurence = 0 *participace: rozsah populace, která se účastní politiky (např. ve volbách) • volební účast *kombinace obou: index demokracie (násobek) • stanovení prahové hodnoty Nezávisle proměnné * snaha vybrat proměnné vycházející z teorie * ale nutnost dělat kompromisy * některé faktory nejsou (přímo) měřitelné * Proměnné, které použil Vanhanen: * IOD - index socioekonomické diverzifikace (socioeonomický rozvoj) • UP - urbanizace (podíl městské populace) • NAP – podíl nezemědělské populace * IKD - Index distribuce vzdělání • Students – počet studentů univerzit na 100 000 obyvatel • Literates – podíl gramotných obyvatel * ERD - Index distribuce ekonomických zdrojů • Family farms – podíl malých (rodinných) farem na celkové výměře zemědělské půdy • NARD – stupeň decentralizace nezemědělských zdrojů (Giniho koeficient – podíl veřejného, soukromého a zahraničního sektoru) * IPR - index zdrojů moci (kombinace tří předchozích) (násobek) * alternativní proměnné * HDP na obyvatele • hypotéza: v bohatších společnostech (více zdrojů) jsou příznivější podmínky pro demokracii * index etnické homogenity • hypotéza: v etnicky/jazykově homogenních společnostech jsou příznivější podmínky pro demokracii Analýza * Korelační analýza *první informace o existenci vztahů mezi proměnnými * Testování vztahu mezi nezávisle proměnnými *závislost by měla být nízká *každá proměnná vyjadřuje jinou vlastnost *omezení problému multikolinelarity * Regresní analýza *viz obr.