Stationery anabnr2
1
2_Frekvenční tabulky a grafy
n= sumarizace, „uvaření syrových (původních) dat“ do srozumitelné, interpretovatelné,
prezentovatelné podoby
n2 způsoby:
nFrekvenční/četnostní tabulky
nGrafy
nVizualizují data, ukazují prvotní trendy
n

Stationery anabnr2
2
Frekvenční tabulky 1
nKolik lidí spadá pod danou kategorii proměnné?=frekvence neboli četnost kategorie
n= shrnují četnosti každé hodnoty proměnné
nPř. Sharon administrativní pracovnice zařízení sociálních služeb chce vědět zda zařízení opravdu
slouží starším lidem (+=50)
n1) zaznamená si věk všech klientů za měsíc říjen, vznikne seznam 20 klientů, vidí že jen David je
+50
n
„Syrová data“
Jméno
Věk
Jméno
Věk
jméno
věk
Rashad
32
David
69
Clarisse
37
Rosina
27
Herb
26
Karen
26
Brad
26
Vincent
31
Elwin
49
Chuck
21
Rose
37
Tony
21
Shanti
37
Marguerite
49
Leon
27
Kathy
31
Raquel
31
Mario
31
Antoinette
32
Peter
27

Stationery anabnr2
3
Frekvenční tabulky 2
nSharon seřadí klienty podle věku a vznikne přehlednější seznam
nPřehlednost je zřetelnější pokud např. N=250 namísto N=20
nNyní může Sharon sjednocením dat konečně vytvořit první frekvenční tabulku, která je ještě
přehlednější
n
„Syrová data“ seřazená podle velikosti
Jméno
Věk
Jméno
Věk
jméno
věk
Chuck
21
Leon
27
Shanti
37
Tony
21
Kathy
31
Rose
37
Brad
26
Vincent
31
Clarisse
37
Herb
26
Raquel
31
Marguerite
49
Karen
26
Mario
31
Elwin
49
Rosina
27
Rashad
32
David
69
Peter
27
Antoinette
32

Stationery anabnr2
4
Frekvenční tabulky 3
n=tabulka absolutních četností
nKaždé hodnotě proměnné je přiřazeno číslo, podle toho kolikrát se vyskytuje
nLze sestrojit pro každý typ proměnné
nPř. 3 z 20 klientů mají 37 let
Tabulka 1: absolutních četností (proměnná věk)
Jméno
Věk
Abs. četnost
Chuck+Tony
21
2
Brad+Herb+Karen
26
3
Rosina+Peter+Leon
27
3
Kathy+Vincent
+Raquel+Mario
31
4
Rashad+Antoinette
32
2
Shanti+Rose+Clarisse
37
3
Marguerite+Elwin
49
2
David
69
1
Total
20

Stationery anabnr2
5
Frekvenční tabulky 4
n= tabulka kumulativních četností
n= kumulativní četnost hodnoty X je rovna součtu všech absolutních četností hodnot <=X
n Př. 17 klientů (2+3+3+4+2+3) z 20 má 37 let a méně
n (smysl interpretace pouze u nejméně ordinálních proměnných)
nPoslední řádek kumulativní četnosti = celkový počet případů
Tabulka 2: kumulativních četností
(proměnná věk)
Jméno
Věk
Abs.
četnost
Kum.
četnost
Chuck+Tony
21
2
2
Brad+Herb+Karen
26
3
5
Rosina+Peter+Leon
27
3
8
Kathy+Vincent
+Raquel+Mario
31
4
12
Rashad+Antoinette
32
2
14
Shanti+Rose+Clarisse
37
3
17
Marguerite+Elwin
49
2
19
David
69
1
20
Total
20

Stationery anabnr2
6
Frekvenční tabulky 5
n= tabulka relativních četností
nmáme-li 20 lidí ve vzorku, pak každý člen reprezentuje 5% (100/20) – viz David
nPř. 15 % lidí ve vzorku má 37 let
ndůkaz (3/20)*100=15%
n
Tabulka 3: relativních četností
(proměnná věk)
Jméno
Věk
Abs.
četnost
Rel.
četnost
Chuck+Tony
21
2
10
Brad+Herb+Karen
26
3
15
Rosina+Peter+Leon
27
3
15
Kathy+Vincent
+Raquel+Mario
31
4
20
Rashad+Antoinette
32
2
10
Shanti+Rose+Clarisse
37
3
15
Marguerite+Elwin
49
2
10
David
69
1
5
Total
20
100

Stationery anabnr2
7
n=tabulka relativních kumulativních četností
nRelativní kumulativní četnost pro hodnotu X je rovna součtu všech relativních četností hodnot <= X
nPř. 85% klientů má 37 let a méně (10+15+15+20+10+15=85)
nUžitečné chcem-li znát relativní pozici určité hondoty vzhledem k ostatním v datech (viz též
percentil)
Tabulka 4: relativních kumulativních četností
Jméno
Věk
Abs.
četnost
Rel.
četnost
Rel. Kum. četnost
Chuck+Tony
21
2
10
10
Brad+Herb+Karen
26
3
15
25
Rosina+Peter+Leon
27
3
15
40
Kathy+Vincent
+Raquel+Mario
31
4
20
60
Rashad+Antoinette
32
2
10
70
Shanti+Rose+Clarisse
37
3
15
85
Marguerite+Elwin
49
2
10
95
David
69
1
5
100
Total
20
100
Frekvenční tabulky 6

Stationery anabnr2
8
nPokud mnoho dat (zvláště spojitých), je přehlednější vytvořit skupiny (intervaly)
nJak široké mají intervaly být?
n2 hlediska:
na) dostatečný počet případů v každé skupině
nb) logika skupin (homogenita uvnitř skupiny)
nPokud jsou hodnoty rovnoměrně rozložené, pak v každém intervalu stejně případů.
nPokud ne, pak snaha o smysluplné skupiny zhledem k určité vlivné proměnné
n
nKaždý případ musí spadat pouze do jednoho intervalu
nPokud je případ na hranici např. 29.6 pak zaokrouhlujeme (dolní hranice intervalu 30-39 =29.5,
horní hranice=39.49)
Tabulka 5: seskupených relativních kumulativní četností (proměnná věk)
Věkové skupiny
Abs.Rel.četnost
Kum.rel.
četnost
20-29
40
40
30-39
45
85
40-49
10
95
50-59
0
95
60-69
5
100
Total
100
Frekvenční tabulky 7

Stationery anabnr2
9
Užití frekvenčních tabulek v analýze 1
nPř. Jennifer chce prozkoumat neomluvené absence personálu, zda neexistuje nějaké sezónní vzorce,
které by mohly být odstraněny přizpůsobením politiky dovolených.
nVidí, že zatímco na jaře (duben+květen) bylo zaznamenáno 70 (35 %) případů, tak v létě
(červen+červenec) jich bylo 130 (65 %)
n
Počet denních absencí personálu podle měsíců (N=200)
                  (celkem v měsíci)
měsíc
Abs. četnost
Kum.rel.
četnost
Duben
30
15
Květen
40
35
Červen
60
65
Červenec
70
100

Stationery anabnr2
10
Užití frekvenčních tabulek v analýze 2
nUžitečné chceme-li srovnat měření z dvou rozdílných skupin nebo databází
nPř. SoPka Sue vytvořila studijní příručku - je příručka efektivní?
n Jak zjistit? Srovnat zkouškové body lidí kteří použili příručku (experimentální skupina X) a
kteří ji nepoužili (kontrolní skupina C)
n Vidí že:
n20 % lidí v X skórovalo nad 90 zatímco v C pouze 5 %
nv X skórovalo pouze 10 % pod 70, zatímco v C relativně 2x více (20 %) – příručka zdá se pomohla!
nNa základě rel.kum.četn. lze určit pořadí – tzv. percentil
n= percentilové pořadí určuje procento případů jejichž hodnota je nižší než příslušná hodnota
nPř. Clarice skórovala 90 bodů – skončila lépe než nejméně 80 % všech lidí v X skupině
nVšimnětě si různé velikosti skupin (N=200 a N=300) – použití procent umožňuje srovnání skupin
Skóre experimentální skupiny (X) (N=300)
Skóre
Abs.Rel.četnost
Kum.rel. četnost
50-59
0
0
60-69
10
10
70-79
40
50
80-89
30
80
90-100
20
100
Skóre kontrolní skupiny (C) (N=200)
Skóre
Abs.Rel.četnost
Kum.rel. četnost
50-59
5
5
60-69
15
20
70-79
40
60
80-89
35
95
90-100
5
100

Stationery anabnr2
11
Chybná prezentace výsledků 1
Užití frekvenčních tabulek v analýze 3
Tabulka náborů 2001 2002 ve firmě XYZ
podle pohlaví
Klasifikace pracovního místa
Muži
ženy
Počet
Rel.
Četnost
počet
Rel.
četnost
A
3 ze 6
50
4 ze 6
67
B
1 ze 3
33
1 ze 2
50
C
0 z 1
0
1 z 10
10
D
85 ze 100
85
2 ze 40
5
E
2 ze 3
67
2 ze 2
100
F
3 ze 7
43
4 ze 7
57
Celkem
94 ze 120
78
14 ze 67
21
nPř. Personální pracovnice Emma pyšně sděluje řediteli firmy, že její snaha zaměstnat více žen byla
velmi úspěšná
nEmma: „v 5 ze 6 sektorů jsem přijala relativně (vyšší procento) více žen než mužů“
nPravda ale: celkově přijala jen 21% žen vs. 78 % mužů
nChyba Emmy: používala nestejně velké skupiny (D>A+B+C+E+F)
nObecně je lepší používat procenta pouze u vysokých četností jako 146 z 411, u četností jako 3 z 5
lépe používat absolutní hodnoty

Stationery anabnr2
12
nZpůsobuje chudoba delikvenci?
n1. tabulka: nedostatek evidence – třeba porovnat s bohatými (2.tabulka)
n
Chudí
Delikventní
7
Nedelikventní
93
100
(400)
Chudí
Bohatí
Delikventní
7
7
Nedelikventní
93
93
100
(400)
100
(654)

Stationery anabnr2
13
Grafická prezentace dat
nGrafická prezentace obětuje přesnost (detail) za komunikativnost sdělení o distribuci hodnot
proměnné
nvhodné pokud publikum není např. vědecká rada
nExistuje mnoho grafů – který použít?
na) jasnost prezentace
nb) úroveň měření proměnné
nVětšina grafů používá osy x(pro hodnoty proměnné) a y(pro četnost)
n
n

Stationery anabnr2
14
nNominální data
n
nKaždý sloupec stejná šířka
n
nPořadí sloupců nehraje roli (mezi kategoriemi pouze kvalitativní rozdíly)
n
nSloupce se nedotýkají (nespojitost)
n
nVýška sloupce reflektuje četnost hodnoty
n
nPř. 2x vyšší sloupec=2x vyšší četnost
Sloupcové/čárové diagramy/grafy (bar/line graphs/charts)

Stationery anabnr2
15
nCelý koláč = proměnná = 100 %
nJednotlivé porce (trojúhelníčky) = kategorie proměnné
n
nČím větší porce, tím větší četnost
n
nVýhoda: nabízí okamžitý pohled na distribuci proměnné
n
nNevýhoda: nehodí se na proměnné s více kategoriemi - nepřehledné
n
n
Koláčové diagramy/grafy (pie graphs/charts)

Stationery anabnr2
16
histogramy
nPodobné sloupcovým grafům
n
nRozdíly:
n
nšířka jednotlivých sloupců=šířka intervalu (intervalové/poměrové proměnné seskupené do intervalů)
n
nPořadí sloupců=pořadí kategorií (ordinální proměnná)
n

Stationery anabnr2
17
Graf stonků a listů (Stem and leaf plot)
Frekv.
Stonek
listy
1
5
9
2
6
24
6
6
566889
4
7
1144
16
7
5577777777788999
6
8
014444
3
8
558
1
9
5
1
10
3
Graf stonků a listů: věk klientů rezidenční péče N=40
nStonek=první číslo hodnoty proměnné
nList=poslední číslo hodnoty proměnné
nPř. Jeden klient má 62 let a druhý 64 let