Příklady k lekci pro týden 8 - Míry centrální tendence a variability Střední hodnoty 1. Máme soubor skórů proměnné X: 1,3,6,8,9,9,10,10,10 1.1 Jaká je hodnota modu? 1.2 Jaké je n? Jaká je hodnota mediánu? 1.3. Jaká je hodnota průměru? 1.4 Jaký je tvar rozložení těchto dat? 2. Následující otázky se týkají modu, mediánu a aritmetického průměru. 2.1 Který z nich vyžaduje pouze nominální škálu? 2.2 Který je tím „nejprostřednějším“ skórem? 2.3 Který z nich je bodem, pod i nad kterým leží polovina skórů seřazených podle velikosti? 2.4 Který z nich je ovlivněn každým jednotlivým skórem v souboru? 2.5 Které dva z nich jsou si rovny u symetrického rozložení? 2.6 Jsou si u normálního rozložení rovny všechny tři? 2.7 Který z nich bude mít nejvyšší hodnotu u pozitivně zešikmeného rozložení? 2.8 Který z nich bude mít nejvyšší hodnotu u negativně zešikmeného rozložení? 2.9 Který z nich nemá u zešikmených rozložení ani nejvyšší ani nejnižší hodnotu? 2.10 Se kterým z nich můžeme dále dobře aritmeticky pracovat? 2.11 Který z nich se nejvíce používá ve statistickém usuzování (statistické indukci)? 2.12 Který z nich snadno určíme z histogramu či sloupcového diagramu? 2.13 Který z nich je roven P50 či Q2 ? 2.14 Který z nich je obvykle znázorněn v boxplotu? 3. Představte si, že máte soubor skórů, jehož průměr je 65,5, medián je 64 a modus 60. Později se dozvíte, že jeden ze skórů byl chybný, místo 70 měl být skór 90. Která ze středních hodnot byla touto chybou určitě ovlivněna? 4. Pokud je průměrná mzda deseti učitelek 45000 Kč a průměrná mzda 40 učitelů 50000 Kč, jaká je průměrná mzda všech padesáti vyučujících? 5. Pro následující 2 otázky mějme 2 testy: průměrný výkon v prvním testu (T1) je 40 bodů a průměrný výkon v druhém testu (T2) je 50 bodů. Testy absolvovalo 93 lidí. 5.1 Jakého průměrného součtu bodů dosáhli studenti v obou testech (jaký je průměr T1+T2)? 5.2 Jaký je průměrný rozdíl mezi skóry v obou testech (jaký je průměr T2-T1)? 6. Určete modus, medián a průměr následující sady skórů: 1,2 1,5 1,7 2,1 2,4 2,4 2,7 2,8, 3,0 3,0 3,0 3,0 3,1 3,1 3,4 7. Kdybychom ke každému skóru u příkladu 7 přičetli 1, jaké budou hodnoty modu, mediánu a průměru? 8. Kdybychom každý skór u příkladu 7 vynásobili 3, jaké budou hodnoty modu, mediánu a průměru? 9. Sada A obsahuje 10 skórů o průměru 14,5 a mediánu 13. Sada B obsahuje 20 skórů o průměru 12,7 a mediánu 10. Jaký je průměr a medián všech 30 skórů? 10. Pět celých čísel má průměr 4, modus 1 a medián 5. Určete tato čísla. 11. Máme symetrické rozložení s mediánem 4. Jaký je průměr tohoto rozložení? 12. Určete průměr, medián a modus u těchto čtyř rozložení (sad dat): a. 3, 3, 4, 5, 6, 8, 8, 8, 9 b. 2, 4, 4, 4, 6, 7, 7 c. 7, 7, 8, 9, 10, 10, 10 d. 1, 1, 3, 4, 4, 5, 9 13. Co byste řekli o tvaru každého z těchto rozložení? a) průměr= 24, medián = 16, modus=12 b) průměr= 123, medián = 143, modus=150 c) průměr= 6, medián = 6, modus=6 d) průměr= 19, medián = 19, modus=9 a 29 e) průměr= 56, medián = 66, modus=70 f) průměr= 48, medián = 36, modus=32 Variabilita 14. Jestliže máme sadu tří skórů: 40, 45, 50 14.1. Jaká je hodnota variačního rozpětí? 14.2 Jaká je suma čtverců, Σixi2? 14.3 Jaká je hodnota výběrového rozptylu? 14.4 Jaká je hodnota s? 14.5 Když každý ze tří skórů zvýšíme o 10, jak se změní s a s2 ? 14.6 Když každý ze tří skórů vynásobíme 10, jak se změní s a s2 ? 15. Jsou dány dva vzorky, v jednom se n = 36, ve druhém n = 60. Které rozložení bude mít větší rozptyl? Který vzorek má pravděpodobně větší variační rozpětí? 16. Předpokládejme dva vzorky: v prvním je průměr = 78, ve druhém = 155. Který vzorek bude mít větší rozptyl? 17. Školní psycholog chce informovat učitele o průměru a směrodatné odchylce IQ skórů studentů. Vypočítejte průměr a směrodatnou odchylku IQ skórů: 98, 111, 102, 100, 101, 109 18. Vypočítejte variační rozpětí, rozptyl a směrodatnou odchylku z těchto skórů: 2, 4, 7, 4, 8, 5, 1, 4, 4, 5 19. Na následujících datech spočítejte výběrovou směrodatnou odchylku. 10 6 8 7 5 5 4 9 2 9 8 6 7 8 3 4 3 5 5 7 6 4 6 6 7 Jaká by byla její hodnota, kdybychom všechny skóry vynásobili dvěma a přičetli 100? 20. Výzkumník, který použil srdeční tep jako závislou proměnou, zjistil, že rozložení skórů srdečního tepu je pozitivně zešikmené. 75. percentil je zjištěn u tepu = 111 a 25. percentil u tepu = 81. Druhý kvartil je 101. Spočítejte kvartilové rozpětí (IQR). 21. Spočítejte populační rozptyl a směrodatnou odchylku těchto skórů: 22, 32, 21, 20, 19, 15, 23 22. Která sada skórů má větší rozptyl? Sada A: 2, 4, 5, 1, 1, 2, 3, 9 Sada B: 34, 39, 34, 35, 33, 32 23. Rozložení má průměr 500 a směrodatnou odchylku 100. Předpokládejte, že rozložení je negativně zešikmené. Je možné určit procento skórů, které spadají mezi 400 a 600? Jestliže ano, jaké procento skórů bude v tomto intervalu?