Popisné statistiky: ní tendence a variability Mgr. Zuzana Szabó Lenhartová ,*.i.:n- ■ :'ri<-i:htaifari;L*tis.tirtiT>ty[icfafy ■ rt-w.jHnnHpi rfriitH (Ml-iiy rtu 'UlmhUrauiAní Hf [EfMHdm) pCfHi^í IdiUJffli UIHUB .ůíftí pnuti' C e Popisné statistiky: ní tendence a variability Mgr. Zuzana Szabó Lenhartová ,*.i.:n- ■ :'ri<-i:htaifari;L*tis.tirtiT>ty[icfafy ■it-Ä-jWniiHpir|iTi[tH (Ml-iiy rtu 'UlmhUrauiAní Hf [EfMHdm) pCfHi^í IdiUJffli UIHUB .ůíftí pnuti' C e ■ jednorozměrný popis a analýza proměnných Kategoriální deskriptivy • entropie • modus Pořadové deskriptivy • medián • kvartily • percentily • grafické zobrazení pomocí pořadových dekriptiv - boxplot Odchylkové, momentové deskriptivy • aritmetický průměr • rozptyl, směrodatná odchylka • zešikmení • špičatost Centrální tendence i Střední hodnoty, umístění - nevýhoda tabulky četností i grafického zobrazení -neúspornost (hodně čísel -> špatná orientace) - nemůžeme proměnnou popsat rychle Jak zobrazení dat zredukovat? - úsporně popsat rozložení proměnných skrze ukazatele centrální tendence a ukazatele variability - najít hodnotu, která by všechny naměřené hodnoty dobře reprezentovavala = ukazatel středních hodnot; ukazatel míry polohy - charakteristika typické hodnoty dat - ukazuje, kde se na měřené škále (číselné ose) data nalézají - popisuje rozložení četností jedné proměnné - udává, jak moc či málo jsou data na škále rozptýlená Éjp Prezi Ukazatele centrální tendence - popisná statistika (číselná charakteristika proměnné) - ukazatel středních hodnot - udávají průměrnou, typickou, reprezentativní, očekávanou hodnotu - jeden údaj - jedno číslo - krásné a zrádné • modus • medián Modus X, Mo - kategoriální typická hodnota - nejčastější hodnota (hodnota s nejvyšší četností v datech) - jediná možnost u nominálních dat, u vyšších úrovní často užitečnou volbou - když známe všechny naměřené hodnoty, stanovíme modus tak, že zjistíme, která hodnota se v daném souboru vyskytuje nejčastěji Příklad: 14, 3, 18, 4, 8, 18, 4, 6, 8, 10, 8 - v případě tabulky četnosti s intervaly lze modus určit přibližně jako střed intervalu s největší četností - nezávislý na extrémních hodnotách naměřené veličiny - modus nemusí být určen jednoznačně - se stejnou nejvyšší frekvencí se může vyskytovat více hodnot - rozdělení s jedním modem (vrcholem) - unimodální Medián - pořadová střední hodnota - prostřední hodnota z řady hodnot seřazených podle velikosti - 50. percentil - rozděluje soubor dat na dvě stejné části - při sudém počtu prvků je mediánem průměr ze dvou prostředních hodnot/ kterékoli číslo z intervalu mezi nejbližší vyšší a nejbližší nižší hodnotou (konsensuálně střed intervalu) - používáme pro (ordinální) pořadová data a výše - nezávislý na extrémních hodnotách měřené veličiny Příklad: Měření vědomostí žáků didaktickým testem, výsledky: 14, 3, 18, 4, 8, 18, 4, 6, 8, 10, 8 Aritmetický průměr Příklad: Příklad Určete průměr, medián a modus u těchto čtyř rozložení (sad dat): a. 3, 3, 4, 5, 6, 8, 8, 8, 9 b. 2, 4, 4, 4, 6, 7, 7 c. 7, 7, 8, 9, 10, 10, 10 d. 1, 1, 3, 4, 5, 9 Míry variability (rozptýlenosti) - omezenost středních hodnot - udávají pouze to, kolem jaké hodnoty se data "centrují" - které jsou nejčastější - data se stejnou střední hodnotou mohou mít různou rozptýlenost Variabilita - jak moc či málo jsou data na škále rozptýlená • malá variabilita - většina hodnot v souboru je stejných nebo velmi blízkých • vysoká variabilita - hodnoty jsou velmi rozmanité • tři ukazatelé variability (podle škál) Na nominální Entrc dové škále: Variační rozpětí Pokud ano, lak: V,,. ,„ , , ;,;.....i £ifl lakud můžeme seřadil hodnoty ad nejmenái po nejvĚtSi b můžeme rici. li |r minimum ;i <:m je ninKlmufri, mňfrit: ■ i í = Knax - Kmtn r> raslE s velikosti vzorku - dím velSí soubor, lim vetii hodnrta ■ ncvýhodn Vymoká Ddivroil vuCi oullierLim Přiklad; 2.0.9.10.1.0.» Interkvartilové rozpětí - vzdále-nusl rrie2i dvěma budy ria Skále, které jsuu na nq miste, kleré múžemE snadnD definovat - používá se 25. ; percenlil - Q = Q3 ■ Ql [75- petcentil minus 25- petcentií) - používáme spíše než jednoduché variaCni ro?pĚ1i - chBrHklfiris.1iry zalaiené na odchylkách od průměru - friěFi rrlJiJTýltrrmsr ňiíí kcltrrri ;irilrnrlli:kéhĽh průhiňru F^H Rorplyl ■ aritmetický průměr čtverDd DdDhylQkrjdaTilmeliciíéhD průměru ( průměrná kvadraucka Qdcfiylka mefenl od aritmetického průměru, přičemž při průměruvanl Idu w)chy*y dělíme číslem (n 1) í = průměrná odchylka na druhou - populační rozptyl: (tn2 (n) - výberový roiplyl - vhodnost (E*2 f (n - 1) - pfi potilÄni pro räcd prvky populace f.fRifpr odchylek iifi druhem = suma étvertu (ňeftu cvtnhylky nrl ť) na. druhou) ■ používá ís v inrerevícni EiabsLce Směrodatná odchylka ■ standardní odchylka. - odmocnina rozptylu - návraJ k povodni'jednáte. 1 měříme CÍP pr*zí a nominální škále: Entropie veličina udávající "míru neuspořádanosti" zkoumaného systému míra neurčitosti systému o TU • *•••«* m ° o 2 aa O 9 - v sociálních vědách se moc nepoužívá Pokud ano, tak: - variační poměr či nominální variance Variační rozpětí - pokud můžeme seřadit hodnoty od nejmenší po největšř a můžeme říct, co je minimum a co je maximum, máme rozpětí - R = Xmax - Xmin - extrémně roste s velikostí vzorku - čím větší soubor, tím větší hodnota rozpětí - nevýhoda: Vysoká citlivost vůči outlierům Příklad: 2,8,9,10,1,0,5 Interkvartilové rozpětí - vzdálenost mezi dvěma body na škále, které jsou na nějakém místě, které můžeme snadno definovat - používá se 25. a 75. percentil - Q = Q3 - Ql (75. percentil minus 25. percentil) - používáme spíše než jednoduché variační rozpětí éTÍ 1 f£ charakteristiky založené na odchylkách od průměru měří rozptýlenost dat kolem aritmetického průměru Rozptyl - aritmetický průměr čtverců odchylek od aritmetického průměru ( průměrná kvadratická odchylka měření od aritmetického průměru, přičemž při průměrování této odchylky dělíme číslem (n-1)) = průměrná odchylka na druhou - populační rozptyl: (1x2 / n) - výběrový rozptyl - vhodnější: (1x2 / (n - 1) - při počítání pro všechny prvky populace součet odchylek na druhou = suma čtverců (sečtu odchylky od průměn na druhou) - používá se v inferenční statistice Směrodatná odchylka standardní odchylka odmocnina rozptylu - návrat k původní jednotce, ve které lenme Popisné statistiky: ní tendence a variability Mgr. Zuzana Szabó Lenhartová ,*.i.:n- ■ :'ri<-i:htaifari;L*tis.tirtiT>ty[icfafy ■ rt-w.jHnnHpi rfriitH (Ml-iiy rtu 'UlmhUrauiAní Hf [EfMHdm) pCfHi^í IdiUJffli UIHUB .ůíftí pnuti' C e