Fotka uživatele Petr Simecek. Kvantitativní zpracování dat Mgr. Jan Hanzelka Výsledek obrázku pro statistics Výsledek obrázku pro turkey Výsledek obrázku pro cap graduation Analýza a interpretace kvanti i kvali 1)Důležité je umět prezentovat data – sumarizace a zobrazení 2)Pro základní statistickou analýzu nepotřebujete speciální nástroje 3)Pokud potřebuji složitější nástroje, nechám si poradit 4)Mít základní přehled o konceptech analýzy • • Postup analýzy statistických dat 1)Příprava dat – převést data do digitální podoby, vyčistit od chybných hodnot a chybějících dat 2)Počátek analýzy – deskriptivní statistika 3) 3) •3) vizualizace •3) Pokročilejší analytické metody Výsledek obrázku pro regression murders Hlavní body •Naučte se alespoň základy statistiky a jak číst statistické závěry •Na většinu stačí Excel, maximálně R+ nebo SPSS •Nechte si poradit od někoho kdo se vyzná •POL593 Kvantitativní přístupy v politologii •https://is.muni.cz/auth/predmet/fss/podzim2016/POL593 Otázky: •Jaké druhy proměnných máme? (N, O, I(K)) •Co to znamená, že má něco pozitivní , korelaci? Dvě města: Extrémov a průměrov (Taleb) •Průměrná výška •Průměrná váha •Průměrná mzda •Průměrné IQ • Jak získáváme data? • • Chybí data? •Co dělat když chybí data? Nejlepší nic nevymýšlet – prostě chybí. •Začít se ptát proč nám chybí taková data, která potřebujeme •Chybějící data nekódujeme „0“ – může dojít ke zkreslení (škála 1-100) •Je rozdíl mezi: •Nevím •Ne •Nemůžu odpovědět •Nemůžu odpovědět v mezích předdefinovaných odpovědí Vyčistění dat po zadání •Jak předejít chybám v přepisu? Nejlépe když data zadávají dva výzkumnici a pak se provede rozdílový test •Jak předejít „překlikům“ – frekvenční analýza jednotlivých proměnných •Kontingenční tabulky •Vyřadím všechny pochybná data (neuspokojivé odpovědi na kontrolní otázky, přerušení sběru dat, podezření z podvodu atd.) • • Koho jste oslovovali (četnosti) Osloveno 295 Odmítnuli 146 49,49 % Nesplinili kriteria 47 15,93 % Vyplnilo 107 36,27 % https://docs.google.com/spreadsheets/d/15gM525oTTeK3mNYET_Q_IKg7dQJB727PhKTWhT_FBaA/edit?usp=sharin g Popisná statistika •Četnosti •Centrální tendence •Modus (nominální, ordinální, kardinální) •Medián (ordinální, kardinální) •Aritmetický průměr (kardinální) • •Jak se bojí ženy ve dne? •Aritmetický průměr – 4,46 •Medián - 4 •Modus - 4 • Jak se bojí muži ve dne? Aritmetický průměr – 2,79 Medián - 2 Modus - 2 Grafické znázornění dat • misleading graphs http://www.statisticshowto.com/wp-content/uploads/2014/01/Bush_cuts2.png • Image Source: http://cloudfront.mediamatters.org Source: http://freethoughtblogs.com/lousycanuck/2011/12/14/im-better-at-graphs-than-fox-news/ • Image: http://flowingdata.com/2009/11/26/fox-news-makes-the-best-pie-chart-ever/ Korelace •Korelace znamená vzájemný vztah mezi dvěma procesy nebo veličinami. • •Pokud se jedna z nich mění, mění se korelativně i druhá a naopak. Pokud se mezi dvěma procesy ukáže korelace, je pravděpodobné, že na sobě závisejí. • •Nelze z toho však ještě usoudit, že by jeden z nich musel být příčinou a druhý následkem. To samotná korelace nedovoluje rozhodnout, protože korelace neimplikuje kauzalitu. Příklad korelace 0,816 https://upload.wikimedia.org/wikipedia/commons/thumb/e/ec/Anscombe%27s_quartet_3.svg/325px-Anscombe %27s_quartet_3.svg.png Korelace Strachu v závislosti na věku Věk Strach Věk 1 Strach 0,23 1 23% případů vysvětluje trend výsledné rovnice (slabá pozitivní korelace) Proč si neplést korelaci a kauzalitu J • •