V roce 1999 došlo ke změně studijních plánů a předmět základy zpracování geologických dat byl přesunut z 2. ročníku studia do 1. Z tohoto důvodu ve školním roce 1999/2000 měli současně výuku studenti 1. i 2. ročníku. V tabulce je uvedený celkový zisk bodů jednotlivých studentů ve třech průběžných testech (max. 60 bodů). "a) nejprve ověř normalitu obou souborů (utvoř histogram absolutních experimentálních a absolutních očekávaných četností a b) potom vhodným testem ověř, zda studijní výsledky studentů odou ročníků byly srovnatelné." pracuj s hladinou významnosti 5%. a) ověření normality obou výběrových souborů pomocí Analýzy dat/histogram zjistím četnosti v jednotlivých intervalech očekávané čet 2.ročník hranice kumul relat relat četn absol četn chi-kvadrát test zadám do histogramu vlastní hranice = POZOR oblast dat I10:I14 2. ročník 1. ročník interval střed int Četnost (no-ne)^2/no 1 24 1 21 2 27 2 22 3 28 3 23 4 28 4 24 5 29 5 24 6 30 6 26 7 31 7 27 test krit 8 34 8 28 krit hodnota CHISQ.INV(0.95;3) 9 35 9 29 očekávané čet staré MS Office CHIINV(0.05;3) 10 35 10 29 1. ročník hranice kumul relat relat četn absol četn chi-kvadrát test 11 36 11 31 interval 20 střed int Četnost oček absol četn (no-ne)^2/no 12 37 12 32 1 26 23 13 37 13 33 2 32 29 14 38 14 34 3 38 35 15 39 15 35 4 44 41 16 39 16 35 5 50 47 17 42 17 36 6 56 53 18 43 18 36 test krit 19 43 19 36 krit hodnota CHISQ.INV(0.95;3) 20 43 20 37 staré MS Office CHIINV(0.05;3) 21 44 21 37 22 44 22 38 2. ročník - bodové zisky odpovídají normálnímu rozdělení pravděpodobností 23 45 23 38 1. ročník - bodové zisky odpovídají normálnímu rozdělení pravděpodobností 24 46 24 39 25 47 25 40 "Můžu použít parametrický t-test, k testování shody výsledků " 26 47 26 41 b) 27 48 27 41 testování shody výsledků studentů 1. a 2. ročníku 28 50 28 42 "nejprve provedu F-test Ho:Sx2=Sy2, k volbě vhodného t-testu" 29 51 29 42 testovací kritérium 30 51 30 42 kritická hodnota F.INV(0.975;38;40) 31 53 31 43 nebo FINV(0.025;38;40) 32 55 32 43 "Ho přijmu, rozptyly jsou si rovny" 33 55 33 45 34 56 34 45 Dvouvýběrový t-test s rovností rozptylů (tento test vyberu v data/analýza dat) 35 56 35 46 36 57 36 47 všechny tyto parametry uvedené v tabulce spočte zvolený test automaticky (pro nás z pohledu interpretace testu jsou podstatné jen ty níže popsané) 37 58 37 48 38 58 38 48 39 59 39 49 40 53 výběrová SMODCH 41 56 "zadává se obvykle 0 (pokud testujeme shodu průměrů , tedy předpoklad hypotetického rozdílu mezi průměry dvou souborů je 0)" výběrový rozptyl "v případě, že chcete aby např. hodnota průměrů dvou souborů se lišila, pak se zadává hodnota toho rozdílu" výběrová SMODCH vypočtená hodnota testovacího kritéria výběrový rozptyl kritická hodnota pro jednostrannou variantu testu variační rozpětí k počet intervalů kritická hodnota pro oboustrannou variantu testu 6 intervalů šířka intervalů "Ho zamítám, mezi výsledky testů studentů 1. a 2. ročníku je statisticky významný rozdíl" ##### Sheet/List 2 ##### Ve vzorcích půd v okolí 2 benzínových čerpacích stanic byly na několika vybraných lokalitách stanovené obsahy PCBs. "a) Limit dle vyhlášky č. 13/1994 je v případě celkové sumy sledovaných PCBs v půdách 10 ng/g. Otestujte, zda koncentrace látek v půdě převyšují stanovený limit." "Předpokládáme, že koncentrace PCBs ve stanovených vzorcích mají normální rozdělení." Pracuj s hladinou významnosti 5% V následující tabulce jsou uvedené koncentrace PCBs (ng/g) ve vzorcích půd oblast 1 oblast 2 suma PCBs suma PCBs lokalita 1 9.8 12.8 lokalita 2 36.2 17.5 lokalita 3 6.3 16.2 lokalita 4 41.6 15.9 lokalita 5 15.5 14.9 lokalita 6 7.8 25.8 lokalita 7 8.9 10.6 lokalita 8 9.6 12.3 lokalita 9 4.5 14.4 lokalita 10 13.3 11 lokalita 11 18.2 18.3 lokalita 12 4.6 10.8 lokalita 13 11.9 6.2 aritmetický průměr SMODCH.VÝBĚR.S t-test 1 výběr Ho: 14.48≤10 Ho: 14.36≤10 Ha: 14.48>10 Ha: 14.36>10 testovací kritérium "kritická hodnota Tk(1-a, n-1)" jedná se o jednostrannou variantu testu - tedy kritická hodnota se stanoví pro jednostrannou variantu testu- hodnota kvantilu 0.95 studentova rozdelení pro 12 stupňů volnosti rozhodnutí testu Ho: 14.48≤10 Ha: 14.36>10 koncentrace PBCs ve druhé oblasti převyšují stanové limity ##### Sheet/List 3 ##### Byly stanovené koncentrace stopových prvků v drobách a břidlicích moravsko-slezského kulmu. "Zhodnoť, zda obsahy REE (suma všech REE bez Y - ppm) jsou v obou litologiích srovnatelné." Nejprve a) ověř normalitu obou výběrových souborů (znázorni relativní kumulované četnosti - experimentální i očekávané do histogramu b) ověř testem Kolmogorov-Smirnov shodu mezi obsahy REE v drobách a břidlicích (pracuj s a=5%). stanovení počtu intervalů (rozdělím data do 5 intervalů) a) ověření normality obou výběrů Ho: výběrový soubor má normální rozdělení pravděpodobností pro ověření normality musím data zpracovat na intervaly a zjistit četnosti v těchto intervalech četnosti výběr souboru pomocí Analýzy dat/histogram stanoveny četnosti v jednotlivých intervalech REE ppm REE ppm seřazená data droby stanovení hranic abs četn abs kumul kumul rel oček rel kum test Kolm-Smir zadám do histogramu vlastní hranice = POZOR oblast dat L12:L15 droby břidlice droby břidlice interval DH (bez) HH (včetně) ne Ne Fe Fo abs(Fe-Fo) 1 130.46 225.38 103.64 125.29 min 1 100 120 2 139.39 143.31 106.2 143.31 2 120 140 3 113.46 190.27 108.69 156.24 3 140 160 4 122.22 206.95 111.46 168.35 4 160 180 5 115.36 125.29 113.34 178.69 5 180 200 6 126.62 258.96 113.46 185.31 testovací kritérium 7 124.23 296.34 115.36 190.27 četnosti výběr souboru kritická hodnota (tabulky) 8 113.34 168.35 122.22 202.78 břidlice stanovení hranic abs četn abs kumul kumul rel oček rel kum test Kolm-Smir zadám do histogramu vlastní hranice = POZOR oblast dat L21:L24 9 111.46 236.74 122.58 206.95 interval DH (bez) HH (včetně) ne Ne Fe Fo abs(Fe-Fo) 10 108.69 185.31 124.23 219.54 1 125 160 11 152.96 269.59 126.62 225.38 2 160 195 12 148.26 178.69 130.46 236.74 3 195 230 13 122.58 202.78 139.39 248.36 4 230 265 14 103.64 248.36 148.26 258.96 5 265 300 15 199.25 219.54 152.96 269.59 testovací kritérium 16 106.2 156.24 199.25 296.34 max kritická hodnota (tabulky) aritm průmer 95.61 171.05 variační rozp "ze sloupce ne vyplývá, že Chi-kvadrat test není vhodný, příliš malé soubory -1) více než 20% četností menší než 5 a 2) přítomnost nulových četností" sm odch výběr 19.122 34.21 šířka int (var rozp/počet int) normalitu dat ověřím testem Kolmogorov- Smirnov pro 1 výběr 20 35 šířka int - zaokrouhleno nahoru "Ho přijmu, oba soubory dat mají přibližně normální rozdělení pravděpodobností" b) neparametrický test Kolmogorov-Smirnov pro 2 vybery var rozp celkove počet int =6 šířka int- zaokrouhleno nahoru droby stanovení hranic droby břidlice interval DH (bez) HH (včetně) n1 n2 N1 N2 F1 F2 abs(Fi1-Fi2) 1 2 max 3 4 5 6 testovací kritérium "0,75>0,48" "Ho zamítnu, mezi koncentracemi REE v drobách a břidlicích je statisticky významný rozdíl" krit hodn "1,36*odmocnina((n1+n2)/(n1*n2))" ##### Sheet/List 4 ##### Kritické hodnoty D1;p Kolmogorova-Smirnovova testu pro jeden výběr n a = 0.05 1 0.975 2 0.842 3 0.708 4 0.624 5 0.563 6 0.519 7 0.483 8 0.454 9 0.43 10 0.4 11 0.391 12 0.375 13 0.361 14 0.349 15 0.338 16 0.327 17 0.318 18 0.309 19 0.301 20 0.294 21 0.287 22 0.281 23 0.275 24 0.269 25 0.264 26 0.259 27 0.254 28 0.25 29 0.246 30 0.242 31 0.238 32 0.234 33 0.231 34 0.227 35 0.224 36 0.221 37 0.218 38 0.215 39 0.213 40 0.21