1 Bodové a intervalové rozdělení četností Bodové rozdělení četností Příklad 1.1. Načtěte soubor znamky.txt. Znakům X, Y, Z vytvořte návěští (X - známka z matematiky, Y - známka z angličtiny, Z - pohlaví studenta). Popište, co znamenají jednotlivé varianty (u znaků X a Y: 1 - výborně, 2 -chvalitebně, 3 - dobře, 4 - neprospěl, u znaku Z: 0 - žena, 1 - muž). ## matematika angličtina pohlavi ## 1 chvalitebné chvalitebné zena ## 2 výborne dobre muz ## 3 nedostatečné dobre muz ## 4 výborne výborne zena Příklad 1.2. Vytvořte a) variační řadu známek z matematiky a známek z angličtiny; b) sloupkový diagram absolutních četností znaků X=Matematika a Y=Angličtina; c) polygon absolutních četností znaků X=Matematika a Y=Angličtina, a) Variační řada známek z matematiky ## nj Nj pj Fj ## výborne 7 7 0.35 0.35 ## chvalitebné 3 10 0.15 0.50 ## dobre 2 12 0.10 0.60 ## nedostatečné 8 20 0.40 1.00 Variační řadu můžeme také získat použitím funkce variacni_rada(X, názvy), která je naprogramovaná ve skriptu AS-funkce. Variační řada známek z angličtiny ## výborne ## chvalitebné ## dobre nj NJ PJ FJ 4 4 0.20 0.20 4 8 0.20 0.40 7 15 0.35 0.75 ## nedostatečné 5 20 0.25 1.00 b) Sloupkový diagram absolutních četností znaků X=Matematika a Y=Angličtina Sloupkový diagram - Matematika Sloupkový diagram - Angličtina H výborne chvalitebné dobre nedostatečné Známka výborne chvalitebné dobre nedostatečné Známka 1 41 c) Polygon četností Polygon četnosti - Matematika Polygon četnosti - Angličtina i-1-1-1- i i i r výborne dobre výborne dobre Známka Známka Příklad 1.3. Vytvořte variační řady známek z matematiky a angličtiny pouze a) pro ženy, b) pro muže. a) Variační řada známek z matematiky pro ženy ## nj Nj pj Fj ## výborne 5 5 0.50.5 ## chvalitebné 2 7 0.2 0.7 ## dobre 1 8 0.1 0.8 ## nedostatečné 2 10 0.2 1.0 Variační řada známek z angličtiny pro ženy ## nj Nj pj Fj ## výborne 4 4 0.4 0.4 ## chvalitebné 2 6 0.2 0.6 ## dobre 1 7 0.1 0.7 ## nedostatečné 3 10 0.3 1.0 Příklad 1.4. Nadále budeme pracovat s celým datovým souborem. Vytvoříme kontingenční tabulku simultánních absolutních četností znaků X a Y. ## výborne chvalitebné dobre nedostatečné suma ## výborne 4 12 0 7 ## chvalitebné 0 2 1 0 3 ## dobre 0 0 1 12 ## nedostatečné 0 13 4 8 ## suma 4 4 7 5 20 Vidíme, že ve výběrovém souboru byli 4 studenti, kteří měli z obou předmětů "výborně", jeden student, který měl z matematiky "výborně"a z angličtiny "chvalitebně"atd. až 4 studenti, kteří z obou předmětů neprospěli. 2 Příklad 1.5. Vytvořte kontingenční tabulku řádkově a sloupcově podmíněných relativních četností znaků X=Ma-tematika a Y=Angličtina. ## angličtina ## matematika výborne chvalitebné dobre nedostatečné ## výborne 0.571 0.143 0.286 0.000 ## chvalitebné 0.000 0.667 0.333 0.000 ## dobre 0.000 0.000 0.500 0.500 ## nedostatečné 0.000 0.125 0.375 0.500 Interpretace např. 2. sloupce ve 4. řádku: V souboru bylo 8 studentů, kteří neprospěli z matematiky. Mezi nimi byl jeden, který měl chvalitebně z angličtiny, což představuje 1/8 = 12.5%. ## angličtina ## matematika výborne chvalitebné dobre nedostatečné ## výborne 1.000 0.250 0.286 0.000 ## chvalitebné 0.000 0.500 0.143 0.000 ## dobre 0.000 0.000 0.143 0.200 ## nedostatečné 0.000 0.250 0.429 0.800 Interpretace např. 4. řádku ve 2. sloupci: V souboru byli 4 studenti, kteří měli chvalitebně z angličtiny. Mezi nimi byl jeden, který neprospěl z matematiky, což představuje 1/4 = 25%. Intervalové rozdělení četností Práci s intervalovým rozdělením četností si ukážeme na datovém souboru lebky.txt. Popis datového souboru: Máme k dispozici údaje o rozměrech lebek staroegyptské populace. Jedná se o 216 mužů a 109 žen. Znak X ... nej větší délka mozkovny v mm (tj. přímá vzdálenost kraniometrických bodů glabella a opisthocranion) Znak Y ... nej větší šířka mozkovny v mm (tj. přímá vzdálenost kraniometrických bodů euryon dx a euryon sin) Znak Z ... pohlaví osoby (1-muž, 0-žena) Příklad 1.6. Načtěte soubor lebky.txt. Podle Sturgersova pravidla najděte optimální počet třídicích intervalů pro znaky X a Y a vhodně stanovte meze třídicích intervalů a) pro muže, b) pro ženy. ## délka ## 1 188 ## 2 172 ## 3 176 ## 4 184 ## 5 183 ## 6 177 ## [1] 9 sirka pohlavi 145 muz 139 muz 138 muz 128 muz 139 muz 143 muz a) Protože mužů je 216, podle Sturgersova pravidla je optimální počet třídicích intervalů 9. Musíme zjistit minimum a maximum, abychom vhodně stanovili meze třídicích intervalů: ## [1] 164 199 ## [1] 35 ## [1] 4 3 Pro znak X = Délka lebky je minimum 164 a maximum 199, rozsah těchto hodnot je 35 a ideální délka jednoho třídicího intervalu vyšla jako 199~164 « 4. Jeví se vhodné dolní mez prvního třídicího intervalu zvolit 163, horní mez posledního třídicího intervalu 199. Celkem třídicí intervaly pro znak X budou: (163,167), (167,171), ..., (195,199). ## [1] 124 149 ## [1] 25 ## [1] 3 Pro znak Y = šířka lebky je minimum 124 a maximum 149, rozsah těchto hodnot je 25 a ideální délka jednoho třídicího intervalu vyšla jako 149~124 « 3. Jeví se vhodné dolní mez prvního třídicího intervalu zvolit 123, horní mez posledního třídicího intervalu 150. Celkem třídicí intervaly pro znak X budou: (123,126), (126,129), ..., (147,150). b) Protože žen je 109, podle Sturgersova pravidla je optimální počet třídicích intervalů 8. Postup je analogický jako u mužů. Přesný tvar třídicích intervalů pro ženy viz Sbírka příkladů k předmětu Aplikovaná statistika. Příklad 1.7. Vytvořte histogram pro X a pro Y (s uvedenými absolutními a relativními četnostmi jednotlivých třídicích intervalů) a) pro muže, b) pro ženy. a) Histogram pro muže Histogram délky lebky u muzu Histogram sirky lebky u muzu 1-1-r~ 163 167 171 -1-1- 175 179 183 Délka lebky -1-1-1-1 187 191 195 199 47; 22%48;22% i-1-1-1-1-1-r~ 123 126 129 132 135 138 141 sirka lebky -1-1-1 144 147 150 b) Histogram pro ženy Postup je analogický jako u mužů. Přesný tvar histogramů pro ženy viz Sbírka příkladů k předmětu Aplikovaná statistika. 4