PSY117/454 Statistická analýza dat v psychologii Přednáška 2 ČETNOSTI A ROZLOŽENI MINOSTI 1 Je snadné lhát s pomocí statistiky. Je těžké říkat pravdu bez ní. Andrejs Dunkels; wikiquote (c) Stanislav Ježek, Jan Širůček JcJkcí hodnoty márne v UdlecU □ Jaké hodnoty proměnné/ých se v datech vyskytuiiV I I Jaké iwné odpovědi isme získali na tu kterou 1 olďzku dotazníku? U Jake různé počty sledovaných chovaní se při 1 pozorování vyskytly ŕ H □ Kolik kterých hodnot máme? - četnosti ■ Je některých vic, jiných miň? ■ Zda se byt v četnostech jednotlivých ho<^^ ^Ěpaký rad? (c) Stanislav Ježek, Jan Širůček Studium statistiky Frequency Percent Valid Percent Cumulative Percent Valid Missing Total mě asi bude bavit by mě možná mohlo bavit mě asi bavil nebude^ mě rozhodně bavit nebude Total nedokážu říci m m 36 m 85 H m 100,0 100,0 100,0 (c) Stanislav Ježek, Jan Širůček Kolik tak přečtete za měsíc knížek (včetně elektronických a sešitových komixů)? Frequency Percent Valid Percent Cumulative Percent Valid ,0 2 2,2 2,3 2,3 1,0 12 13,3 13,8 16,1 1,5 2 2,2 2,3 18,4 2,0 29 32,2 33,3 51,7 2,5 2 2,2 2,3 54,0 3,0 14 15,6 16,1 70,1 3,5 2 2,2 2,3 72,4 4,0 7 7,8 8,0 80,5 4,5 1 1,1 1,1 81,6 5,0 6 6,7 6,9 88,5 6,0 2 2,2 2,3 90,8 7,0 2 2,2 2,3 93,1 8,0 1 1,1 1,1 94,3 10,0 3 3,3 3,4 97,7 17,0 1 1,1 1,1 98,9 17,5 1 1,1 1,1 100,0 Total 87 96,7 100,0 Missing 999,0 3 3,3 Total 90 100,0 (c) Stanislav Ježek, Jan Širůček Kolik tak přečtete za měsíc knížek (včetně elektronických a sešitových komixů)? (Binned) Frequence Percent Valid Percent Cumulative Porce nil Missing Total <- 0.0 0/1 2,0 2,1 -4,0 4.1 -K,0 6.1 -0.0 8,1 -10,0 16,1 + lota I IUP n Ü 25 n 87 H 100,0 ^§¥p 90,8 ^P SPSS intervalové četnosti samo nedělá. Je třeba rekódovat hodnoty do intervalů (nová proměnná). K tomu např. fee Transform - Visual Binning. (c) Stanislav Ježek, Jan Širůček CD DO Tabulka četností: Pí 3: Koliktakp?e?tete za m?s?c kn??ek (v?etn? ej Četnost Kumulativní četnost Ffel. četnost Kumulativní rel.četnost 0,0(X)0(Ik=x<2,000000 2,0(X)0(Ik=x<4,000000 4,0(X)0(Ik=x<£,0(X)000 16 47 14 16 17,77778 63 77 52,22222 15,55556 17,7778 70,0000 85,5556 6,0(X)0ak=x-H, 0) 1 case^ Větev°list (jed, list 1, 000000 , např. 6°5 6, 5 00000E 0° 0000000 000000000 00000000 00000000 0000000 000000000 00 0000000 0000000 3° 0000000 00 5° 0000 0 7< 0 8° 0 10° 000000 ll1 12' 131 14' 15° 000 min = 0,000000 max = 15,00000 Celk. N= (c) Stanislav Ježek, Jan Širůček „Férové" zobrazení dat □ Každý graf (i tabulka) musí být natolik přehledně popsán (nadpis + popisky uvnitř), aby byl srozumitelný i bez ctení textu I 1 Rozhrne mriy, nnpr. Goori, Hnrriin ■ V zobrazení by nemělo být více dimenzí než v zobrazovaných datech (často i 7hvtpřný 1 rrizm^ ■ Popisky dat by neměly stínit datové body ■ Rozsah škál by měl být volen smysluplně, aby byla plocha užitečně využita = („nulové" body na škálách), i ■ Numerické osy naznačují spojilé proměnné, u kaleqoní volme raději lexlow popisky. ■ Nepropojujme datové body, jde-li o diskrétní škály, pokud nemá interpolace smysl, nebo pokud nemáme v úmyslu srovnání profilů (c) Stanislav Ježek, Jan Širůček (c) Stanislav Ježek, Jan Širůček Rozložení rozdělení, distribuce Četností □ Měřené jevy jsou nějak rozděleny do kategorií (intervalů) a tyto kategorie jsou různě „populární" - četné. □ Četnosti u reálných ordinálních a vyšších proměnných obvykle nebývají distribuovány nahodile - jejich rozdělení zobrazené histogramem má popsatolný tvar. ^ _ 1 skóry akůrW □ Rozdělení četností je tedy to, kolik relativně (či absolutně) máme kterých hodnot měřené proměnné. ■ Typicky lze přibližně popsat slovy, např.: vyskytlo se hodně středních hodnot j pí mlativrip máln pxtrpmnirh hnrinnt.j ■ Tntn rozloženi jpvú na mpřpnp škálp jp npjlppp vidŘt na qratprhP m Obvykle nějaké konkrétní rozložení očekáváme._ (c) Stanislav Ježek, Jan Širůček Tvar rozložení četností □ Normální □ Uniformní □ Počet vrcholů ■ Unimodální, bimodální, multimodální □ Zešikmení ■ Zešikmené zprava (pozitivně), efekt podlahy ■ Zešikmené zleva (negativně), efekt stropu □ Strmost ■ Leptokurtické, platykurtické Šikmost Špičatost Poiet vrcholů zešikmené zprava leptokurtické jeden vrchol (kladné zešikmení) (špičatější než normální) (unimodální) zešikmené zleva platykurtické dva vrcholy (záporné zešikmení) (méně špičaté než normální) (bimodální) symetrické, jeden vrchol, zvonovitý tvar AJ: frequency distribution, normal, rectangular, unimodal, bimodal, positively/negatively skewed, lepto(platy)kurtic, floor/ceiling effect (c) Stanislav Ježek, Jan Širůček Normální (Gaussovo) rozložení -to -2a -1