Otázky k tématu 11 – neparametrické testy 1. Odpovězte na následující otázky: 1.1 Jakou nulovou hypotézu testuje test Mann-Whitney? 1.2 Jakou nulovou hypotézu testuje znaménkový test pro jeden výběr? 2. Následující otázky se týkají chí-kvadrátu: 2.1 Pro které z následujících účelů můžeme použít chí-kvadrát? a) srovnání relativních četností, H[0]: π[1] = π[2] b) určení, zda jsou dvě kategoriální proměnné nezávislé c) porovnat mediány ve dvou skupinách d) porovnat mediány ve třech a více skupinách 2.2 Který z c^2 testů je třeba použít, chceme-li zjistit, jestli je mezi 116 kluky a 78 holkami statisticky významný rozdíl v procentu leváků? a) c^ 2 test dobré shody b) c^ 2 test nezávislosti 2.3 Který z následujících symbolů reprezentuje kritickou hodnotu chí-kvadrátu se dvěma stupni volnosti při α = 0,05? a) [0,90] c[ 2]^2 b) [0,95] c[ 2]^2 c) [0,95] c^ 2 2.4 Která z následujících hodnot je nejvyšší? a) [0,90] c[ 1]^2 b) [0,95] c[ 1]^2 c) [0,99] c[ 1]^2 2.5 Která z následujících hodnot je nejvyšší? a) [0,95][1]^2 b) [0,95][2]^2 c) [0,95][3]^2 2.6 Známe při c^ 2 testu dobré shody očekávané relativní četnosti ještě dříve než začneme sbírat data? 2.7 Při c^ 2 testu nezávislosti kategoriálních proměnných (2x5 kategorií), který z následujících symbolů odpovídá kritické hodnotě chí-kvadrátu při α = 0,01? a) [0,99] c[ 1]^2 b) [0,99] c[ 4]^2 c) [0,99] c[ 5]^2 d) [0,01] c[ 4]^2 2.8 Když použijeme c^ 2 test dobré shody na rozložení proměnné o 8 kategoriích, jaká je kritická hodnota chí-kvadrátu při α = 0,05? 2.9 Když nám na 3x3 kontingenční tabulce vyjde hodnota c^ 2 = 9, je vztah mezi proměnnými významný na 5% hladině statistické významnosti? 3. Jaké jsou správné odpovědi? 3.1. Při n = 100, při jaké hodnotě π (relativní četnost) je směrodatná chyba σ[p] nejvyšší? (σ[p] = √(π(1-π)/n); zkuste to metodou pokus omyl). 3.2 Při n = 100 a π = 0,5, jaká je směrodatná chyba σ[p] ? 3.3 Kdybychom dělali opakovaně předvolební průzkum na 100hlavých vzorcích populace, v níž 50% lidí (π = 0,5) preferuje kandidáta A (i B), v kolika procentech průzkumů by nám vyšla nejméně 60% podpora kandidáta (p = 0,6)? 3.4 Pokud 80% populace souhlasí s určitým tématem, jaká je hodnota směrodatné chyby σ[p][ ]pro následující velikosti vzorků n = 25, n = 100 a n = 400 3.5 Jak byste zobecnili výsledky předchozí otázky: vztah mezi n a σ[p] ? 4. Odpovězte na následující otázky: 4.1 Ve vzorku 100 učitelů 50 preferovalo úkolovou mzdu. Vytvořte 95% interval spolehlivosti okolo p = 0,5. Použijte p ± 2σ[p]. 4.2 Pokud jsou všechny ostatní podmínky stejné, který z následujících intervalů spolehlivosti je nejširší? a) 90% interval spolehlivosti b) 95% interval spolehlivosti c) 99% interval spolehlivosti 5. Vyberte adekvátní statistický test: 5.1 Jaký statistický test či metodu je třeba k otestování hypotézy „Mezi počtem sourozenců (0,1,2,3,4 a více) a vlastnictvím magisterského či vyššího akademického titulu (má/nemá) není žádný vztah“. Své rozhodnutí zdůvodněte. 5.2 Jaký statistický test či metodu je třeba k otestování hypotézy „Muži a ženy se liší v úrovni dosaženého vzdělání“? Své rozhodnutí zdůvodněte. 6. V ročníku je 120 studentů, kteří se mohou rozhodnout mezi čtyřmi cvičícími seminářů ze statistiky. Použili jsme chí-kvadrát, abychom zjistili, jestli se volba cvičících statisticky významně liší od náhodné volby. 6.1 Jaká je očekávaná relativní četnost, π, pro každého cvičícího? 6.2 Jaká je kritická hodnota chí-kvadrátu při α = 0,05? 6.3 Pokud vypočítáme c^ 2 = 15,4, můžeme zamítnout H[0] na 5% hladině statistické významnosti? Na 1% hladině? A na 0,1% hladině? 7. Freud postuloval, že ženy mají nevědomou závist mužského penisu. Johnson (1966) testoval tuto hypotézu následovně. Studentům a studentkám byla zapůjčena tužka, s kterou měli vyplnit předložený test. Krabice s názvem „tužky“ byla umístěna vedle stolu, kam měli umísťovat vyplněné testy. Vyšetřující počítal, kolik mužů nebo žen vrátí tužku do krabice. Hypotéza zněla, že ženy si pravděpodobně častěji ponechají objekt podobný falu. Data byla konzistentní s hypotézou. Následující data jsou hypotetická, ale konzistentní s nálezy Johnsona. Proveďte test chí-kvadrát (Můžete uvést nějakou interpretaci, která by neměla co dělat se záviděním penisu?) 8. Specifikujte správné df pro každý z designů: 8.1 2 x 2 8.2 3 x 4 8.3 4 x 5 8.4 1 x 3 9. Diskutujete s kamarádem o tom, jak se policisté rozhodují zastavit řidiče za porušení dopravních předpisů. Trváte na tom, že policisté pravděpodobněji zastaví někoho, když existuje nějaká evidence o tom, že řidič nemá policisty rád. Získáte pomoc od 50 řidičů. Dvacet pět z nich požádáte, aby si dali na nárazník vozu nálepku se slovy „Stop policejní brutalitě!“ Ostatních 25 dostanou nálepku se slovy „Usmívejte se!“. Předpokládejte, že ve skutečnosti není žádný rozdíl v tom, jak jednotliví řidiči řídí. Za šest měsíců je zjištěno, kolikrát jednotlivé řidiče policisté zastavili. Řidiči, kteří vyjadřovali brutalitu, byli zastavení 18krát, ti s úsměvem pouze 5krát. Žádný z řidičů nebyl zastaven více než jednou. 9.1 Vyjádřete nulovou hypotézu 9.2 Specifikujte f[0 ] pro každou buňku. 9.3 Vypočtěte chí-kvadrát a test signifikance na hladině α = 0,05 9.4 Interpretujte výsledky. 10. Pro každou oblast, doplňte chybějící pozorované a marginální četnosti. Dále, vypočtěte f[e ] pro každé políčko. 11. Frank a Lester (1988) zjistili, že dospívající ve věku 15-24 let, častěji páchají sebevraždu v neděli. Následující hypotetická data jsou konzistentní s jejich výsledky. Proveďte výpočet chí-kvadrátu z těchto dat. 12. V padesátých letech, Samuel Steward opustil pozici univerzitního profesora a stal se tetovacím umělcem v Chicagu. Alfred Kinsey, proslulý výzkumník sexu, požádal Stewarda, aby si vedl deník jeho zkušeností a věnoval specifickou pozornost možným sexuálním motivacím, které vedou osobu k rozhodnutí, nechat si udělat tetování. Steward uváděl následující data: * 1724 chlapců po tom, co si nechalo udělat tetování, měli sex s dívkou. * 635 se porvalo. * 1031 se jich opilo (více než 800, kteří odpověděli, že měli sex, uváděli i toto) * 879 přiznalo, že masturbovali nad obdivem ze svého nového tetování. Hodí se tato data sama o sobě pro test chí-kvadrát? Jaké předpoklady pro tuto metodu jsou porušena, na základě způsobu vypovídání o jednotlivých zkušenostech? (Ignorujte fakt, že subjekty nejsou náhodný vzorek, ze všech, kteří si nechali udělat tetování.) 13. Výzkumník se zabývá vztahem mezi diabetem a protrahovaným hojením ran. Výzkumná otázka zní, jestli se u diabetiků častěji objevuje protrahované hojení. Otestujte hypotézu o nezávislosti diabetes a hojení na hladině α = 0,05. Hojení normální Hojení protrahované Celkem Diabetikové 125 329 454 Bez diabetes 245 111 356 Celkem 370 440 810 14. Dermatolog se zajímá o srovnání čtyř odlišných způsobů léčby lupů. Po šesti týdnech léčby kolega ohodnotí, zda se každý pacient zlepšil či ne. Existuje nějaký důvod usuzovat, že druhy léčby měly odlišný efekt na lupy? Stanovte alfa = 0,05. 15. Postgraduální studijní program v klinické psychologii má 2 výcvikové skupiny – kognitivně-behaviorální a psychoanalytickou. V prvním roce studia jsou studenti náhodně rozděleni do těchto dvou skupin. Profesora zajímá, zda se absolventi různých výcvikových skupin liší v základních dovednostech dělání rozhovoru. Proto po roce běhu obou výcvikových skupin analyzuje profesor videozáznamy zkušebního rozhovoru s klientem všech studentů a seřadí všech 12 studentů od nejhoršího po nejlepšího. Zde jsou výsledky: KBT Psychoanalýza 12 10 9 2 11 3 8 1 4 5 7 6 15.1 Formulujte nulovou a alternativní hypotézu a zvolte si 5% hladinu významnosti. 15.2 Zvolte test a nechte si ho spočítat (nebo to zkuste ručně podle Hendla) 15.3 Interpretujte výsledek. 16. Srovnáváme 3 postupy terapie panické úzkosti – hypnóza (treatment I), farmakoterapie (treatment II), gestalt terapie (treatment III). Po roce terapie jsou klienti klasifikováni podle míry ústupu symptomů oproti původnímu stavu do 2 kategorií – zlepšení (favorable) a nezlepšení (unfavorable). Počítejte s α = 0,05 a zjistěte, zda se na této hladině statistické významnosti liší léky ve svém účinku. Použijte standardizovaná rezidua R k určení, které buňky (pole tabulky) přispívají k signifikantnímu c^ 2. Interpretujte výsledky. 17. Jedna politická strana si udělala drobný předvolební průzkum. 17.1 Ze 100 náhodně vybraných respondentů by svůj hlas této straně dalo 10 %. Vytvořte 95% interval spolehlivosti pro procento příznivců strany v populaci. (p [relativní četnost; v procentech] má přibližně normální rozložení se směrodatnou chybou odhadu √[p(100-p)/n]) 17.2 Jaký by byl 95% interval spolehlivosti pro procento příznivců strany v populaci, kdyby jí svůj hlas dalo 90 % respondentů? 18. Máme 3 kandidáty na post v akademickém senátu: Adalberta, Beatrix a Ceslava. Studenti udělali malý předvolební průzkum na 100hlavém náhodném vzorku, v němž vyšlo, že Adalberta by volilo 40 lidí, Beatrix 32 a Ceslavovi by dalo svůj hlas 28 lidí. 18.1. Jaký test byste zvolili, abyste zjistili, zda má některý z kandidátů navrch (tj. zda p[A] p[B] ≠ p[C])? 18.2 Otestujte na 5% hladině statistické významnosti, zda má některý z kandidátů navrch (tj. zda p[A] = p[B] = p[C]). 19. Terapeut po letech praxe formuluje domněnku, že mladší a starší sourozenci se od sebe v období adolescence odlišují co do úrovně pocitu důvěry ve vztahu s rodiči. Tuto hypotézu chce ověřit způsobem nezávislým na svém úsudku, a proto použije diagnostickou dotazníkovou metodu na měření pocitu důvěry ve vztahu s rodiči, kterou administruje padesátce dvojic sourozenců. Dotazníky pošle svému známému, který zrovna absolvoval kurz statistiky, a obdrží od něj následující výsledek: 19.1 Formulujte terapeutovu věcnou hypotézu a statistikovu nulovou hypotézu. 19.2 Proč asi zvolil statistik mezi jinými možnostmi právě tento test? 19.3 Zformulujte závěr této studie o rozdílu mezi mladšími a staršími sourozenci. 19.4 Co lze na základě prezentovaných statistik říci o velikosti případného rozdílu mezi mladšími a staršími sourozenci? 19.5 Jakým jiným testem by bylo možno terapeutovu hypotézu ověřit? 20. Studentka Daniela ověřovala hypotézu, že lidé s vysokou mírou rysu zvaného potřeba kognice (PK) se nechají méně ovlivnit kontextem, v němž je prezentována otázka na postoj k počítačovým hrám (PH). Potřebu kognice měřila a intervalové škále od 1 do 10, kdy 10 znamená maximální míru PK. Účastníky výzkumu náhodně rozdělila na dvě skupiny, kterým dala odlišnou verzi dotazníku. První skupina dostala dotazník, kde bylo před otázkou na postoj k počítačovým hrám deset otázek týkajících se sociálních aspektů života mladých lidí. Dotazník, který dostala druhá skupina, měl namísto toho 10 otázek zaměřených na psychomotorický výkon. Otázka na postoj k počítačovým hrám nabízela 5 možností odpovědi na škále od 1 (hraní her je škodlivé) do 5 (hraní her je přínosné). Vedle toho se ještě účastníků zeptala, jak moc (hodin týdně) hrají počítačové hry, aby mohla vliv této proměnné zohlednit. Zde jsou data 12 respondentů: Skupina s otázkami na sociální aspekty života mladých lidí (Skupina 1) Pohlaví resp. m Pohlaví resp. ž Pohlaví resp. ž Potřeba kognice 2 Potřeba kognice 2 Potřeba kognice 1 Postoj ke hrám 1 Postoj ke hrám 3 Postoj ke hrám 2 Hraní her (h/týden) pořád Hraní her (h/týden) 7 Hraní her (h/týden) nehraji Pohlaví resp. m Pohlaví resp. m Pohlaví resp. ž Potřeba kognice 4 Potřeba kognice 10 Potřeba kognice 3 Postoj ke hrám 2 Postoj ke hrám 3 Postoj ke hrám 4 Hraní her (h/týden) 15 Hraní her (h/týden) 50 Hraní her (h/týden) 50 Skupina s otázkami na psychomotorický výkon (Skupina 2) Pohlaví resp. ž Pohlaví resp. m Pohlaví resp. ž Potřeba kognice 3 Potřeba kognice 3 Potřeba kognice 8 Postoj ke hrám 2 Postoj ke hrám 5 Postoj ke hrám 4 Hraní her (h/týden) 6 Hraní her (h/týden) 3 Hraní her (h/týden) 0 Pohlaví resp. ž Pohlaví resp. m Pohlaví resp. m Potřeba kognice 3 Potřeba kognice 4 Potřeba kognice 9 Postoj ke hrám 3 Postoj ke hrám 2 Postoj ke hrám 5 Hraní her (h/týden) 5-15, to je různé Hraní her (h/týden) 8 Hraní her (h/týden) 25 Daniela kategorizovala čas trávený hraním her do 3 kategorií: občasní hráči: 0-5 hodin týdně, pravidelní hráči: 6-20 hodin, závislí hráči: 21 a více hodin. a. Vytvořte kontingenční tabulku zachycující vztah mezi takto kategorizovanou intenzitou hraní her a příslušností ke skupině. Četnosti vynásobte deseti a vztah otestujte (α = 0,05). b. Vyjádřete těsnost vztahu vhodným ukazatelem velikosti účinku. c. Jakým jiným testem, než tím, který jste patrně nad kontingenční tabulkou spočítali, se dal spočítat rozdíl mezi skupinami v míře hraní her a proč? 21. Profesor Šikula se zabývá atraktivitou barev. Uspořádal experiment, v němž mělo 1000 studentů vyplňovat tužkou škrtací test. Každý student dostal test a z velké nádoby si vybral tužku. Tužky byly nalakované různými barvami. Místo vyhodnocování škrtacích testů se profesor zaměřil na to, jakou barvu tužky si kdo vybral, a také na to, zda tužku vrátil (nebo si ji nechal). Výsledky celého experimentu jsou uvedeny v následující složené kontingenční tabulce: barva vybrané tužky Celkem červená černá modrá žlutá ženy vrátila 120 130 90 170 510 nechala si 20 25 25 20 90 muži vrátil 85 45 90 100 320 nechal si 20 25 20 15 80 Celkem 245 225 225 305 1000 Kdybychom považovali za primární ukazatel obecné atraktivnosti barvy to, jak často si ji studenti vybírali, mohli bychom testovat hypotézu, zda se barvy ve své atraktivitě liší (bez ohledu na pohlaví). Otestujte ji na 5% hladině statistické významnosti nulovou hypotézu, že všechny barvy jsou voleny stejně často. 22. Ktoré z rozložení χ^2 sa bude najviac podobať normálnemu rozloženiu? a) rozloženie χ^2 so stupňami voľnosti 0 b) rozloženie χ^2 so stupňami voľnosti 1 c) rozloženie χ^2 so stupňami voľnosti 2 d) rozloženie χ^2 so stupňami voľnosti 10 23. Kúpili ste si balíček so 40 cukríkmi. Vnútri sú cukríky 4 rôznych farieb. Ste zvedavý či máte vo vrecúšku cukríky každej farby rovnako zastúpené, alebo či je jedna farba cukríkov prevláda. Ak by platilo, že každá farba cukríkov je zastúpená rovnako, koľko by ste očakávali cukríkov v každej farbe? 24. Predstavte si, že v balíčku s cukríkmi ste našli 8 červených cukríkov, 5 zelených, 12 oranžových a 15 modrých. Otestujte nulovú hypotézu, že farby cukríkov v balíčku majú rovnakú frekvenciu. Aká je hodnota c^2? 25. Študent Janko sa zaujíma o to, či existuje vzťah medzi pohlavím a odborom štúdia na univerzite, kde študuje. Náhodne sa spýtal mužov a žien v kampuse a v tabuľke sú uvedené dáta, ktoré získal. Prírodné vedy Spoločenské vedy Humanitné vedy Spolu Muži 10 14 10 34 Ženy 11 8 4 23 Spolu 21 22 14 57 a) aká je očakávaná početnosť žien v spoločenských vedách? b) vypočítajte c^ ^2 pre zistenie vzťahu medzi pohlavím a odborom štúdia.