2 Výpočet číselných charakteristik jednorozměrného a dvourozměrného datového souboru Přehled použitých funkcí: data.frame, apply, library, round, cramersV, read.delim, source, head, names, factor, quantile, boxplot, cor, dotplot, abline, length, mean, var, sqrt, skewness, kurtosis, cbind. Příklad 2.1. Ve vzorku, který tvořilo 200 studentů (100 mužů a 100 žen) byly standardní dermatogliřickou metodou snímány dematoglyfy dlaně (Býmová, 1990). Na otiscích bylo hodnoceno zakončení tří hlavních dlaňových linií. Podle vzorce zakončení byly jednotliví studenti rozděleni do tří kategorií: vysoká (Hi), střední (Mi) a nízká (Lo). Současně byla zhodnocena barva vlasů studentů podle standardní Fisher-Sallerové stupnice (Martin a Saller, 1957-1966, s. 391), na zákadě které byli studenti rozděleni do tří skupin: Světlá (LoH), střední (MH) a tmavá (DaH). K dispozici máme početnosti jedinců v jednotlivých kategoriích, zvlášť pro muže a zvlášť pro ženy. A) Početnosti v jednotlivých kategoriích pro muže Hi Mi Lo líh 6 6 4 MH 20 15 7 DaH 18 12 12 B) Početnosti v jednotlivých kategoriích pro ženy Hi Mi Lo líh 4 4 6 MH 18 10 10 DaH 12 22 12 A) 1. Určete modus zakončení dlaňových linií a modus barvy vlasů pro muže. 2. Pomocí Cramérova koeficientu stanovte stupeň závisloti mezi zakončením dlaňových linií a barvy vlasů u mužů. B) 1. Určete modus zakončení dlaňových linií a modus barvy vlasů pro ženy. (střední; tmavé) 2. Pomocí Cramérova koeficientu stanovte stupeň závisloti mezi zakončením dlaňových linií a barvy vlasů pro ženy. (0.179) A) 1. Stanovení modu pro muže ## vysoké stredni nizke ## 44 33 23 ## svetle stredni tmavé ## 16 42 42 Interpretace: Znak X, zakončení dlaňových linií u mužů, má modus .............. .......................zakončení dlaňových linií. Znak Y, barva vlasů u mužů, má modus tj. nejvíce mužů má barvu vlasů .............................................................. 2. Výpočet Cramérova koeficientu ## [1] 0.101 Interpretace: Cramérův koeficient nabývá hodnoty................, tedy mezi zakončením dlaňových linií a barvou vlasů u mužů existuje................................................................... , tj. nejvíce mužu má 1 Cramérův koeficient interpretace 0 - 0.1 zanedbatelná závislost 0.1 - 0.3 slabá závislost 0.3 - 0.7 střední závislost 0.7- 1 silná závislost B) 1. Stanovení modu pro ženy ## vysoké stredni nizke ## 34 38 28 ## svetle stredni tmavé ## 16 38 46 Interpretace: Znak X, zakončení dlaňových linií u žen, má modus......................., tj. nejvíce žen má.................. zakončení dlaňových linií. Znak Y, barva vlasů u žen, má modus ......................., tj. nejvíce žen má barvu vlasů ....................................... 2. Výpočet Cramérova koeficientu ## [1] 0.179 Interpretace: Cramérův koeficient nabývá hodnoty................, tedy mezi zakončením dlaňových linií a barvou vlasů u žen existuje................................................................... Příklad 2.2. Načtěte datový soubor znamky_me.txt. a) Pro známky z angličtiny a matematiky vypočtěte medián, dolní a horní kvartil, kvartilovou odchylku a vytvořte krabicový diagram. b) Vypočtěte Spearmanův korelační koeficient známek z angličtiny a matematiky pro všechny studenty. a) ## medián kvl kv3 IQR ## angličtina 3.0 2 3.5 3.0 ## matematika 2.5 1 4.0 1.5 Interpretace: 1. Hodnota mediánu pro známku z angličtiny je............., tedy.............studentů mělo známku z angličtiny lepší nebo rovnu ............. a............. studentů mělo známku z angličtiny horší nebo rovnu............... 2. Hodnota dolního kvartilu pro známku z angličtiny je ............., tedy ............. studentů mělo známku z angličtiny lepší nebo rovnu ............ a............studentů mělo známku z angličtiny horší nebo rovnu ............. 3. Hodnota horního kvatrilu pro známku z angličtiny je ............., tedy ............. studentů mělo známku z angličtiny lepší nebo rovnu ............ a............studentů mělo známku z angličtiny horší nebo rovnu ............. 4. Hodnota mediánu pro známku z matematiky je............., tedy.............studentů mělo známku z matematiky lepší nebo rovnu ............. a.............studentů mělo známku z matematiky horší nebo rovnu .............. 5. Hodnota dolního kvartilu pro známku z matematiky je ............., tedy ............. studentů mělo známku z matematiky lepší nebo rovnu ............. a ............. studentů mělo známku z matematiky horší nebo rovnu 6. Hodnota horního kvatrilu pro známku z matematiky je ............., tedy ............. studentů mělo známku z matematiky lepší nebo rovnu ............. a ............. studentů mělo známku z matematiky horší nebo rovnu 2 Krabicový graf - Známky co co E N CM - angličtina matematika b) ## [1] "Spearmanuv koeficient - M + F: 0.688442" ## [1] "Spearmanuv koeficient - F: 0.860314" ## [1] "Spearmanuv koeficient - M: 0.373544" Interpretace: (a) Hodnota Spearmanova korelačního koeficientu je ........................., tedy mezi známkami z angličtiny a matematiky existuje............................................................................................................... (b) Hodnota Spearmanova korelačního koeficientu je ........................., tedy mezi známkami z angličtiny a matematiky u žen existuje ............................................................................................................... (c) Hodnota Spearmanova korelačního koeficientu je ........................., tedy mezi známkami z angličtiny a matematiky u mužů existuje ............................................................................................................... Tečkový graf známek ---