Téma: Zpracování dotazníkového šetření Popis situace: V prosinci 2004 a lednu 2005 ve 22 třídách 10 státních gymnázií v kraji Vysočina, kraji Pardubickém, Královehradeckém, Zlínském, Moravskoslezském a Jihomoravském proběhlo dotazníkové šetření, v němž studenti mj. hodnotili prestiž učitelského povolání. Hodnocení prestiže učitelského povolání jednotlivým studentem bylo zkoumáno pomocí škály, která obsahuje 26 dvojic povolání, přičemž jedním členem dvojice byl vždy učitel a druhým členem pak další povolání, např. programátor, ministr, soukromý zemědělec atd. Student v každé dvojici volí to povolání, které považuje za prestižnější. Pokud zvolí učitele, je příslušné dvojici povolání přiřazena jednička, jinak nula. Prestiž učitelského povolání tedy může nabývat hodnot od 0 do 26. Seznam povolání byl převzat z Centra pro výzkum veřejného mínění, které se výzkumy prestiže povolání zabývá již dlouhou řadu let. Anamnestický dotazník obsahoval otázky, které se týkaly pohlaví studenta, jeho věku, prospěchu, velikosti sídla trvalého bydliště, zda student pochází z rodiny, kde aspoň jeden z rodičů učí na základní či střední škole a zda má zájem o získání vzdělání pro učitelské povolání. Popis proměnných: V datovém souboru prestiz.sta máme údaje o 483 studentech zaznamenané v následujících proměnných: SEX - specifikuje pohlaví studenta (varianta 1 - muž, varianta 2 - žena). SÍDLO - udává velikost sídla trvalého bydliště (varianta 1 - sídlo do 8000 obyvatel, varianta 2 - sídlo nad 8000 obyvatel). PROSPĚCH - odlišuje "výborné" studenty od ostatních studentů (varianta 1 student je jinými studenty označen za výborného studenta a sám s tímto zařazením souhlasí, přičemž souhlasili všichni. V jednotlivých třídách bylo takových studentů od dvou do pěti. Varianta 2 - ostatní studenti. V dalším textu zkracujeme na označení "jedničkář", "není jedničkář"). UČ_RODINA - specifikuje, zda student pochází z učitelské rodiny (varianta 1 aspoň jeden z rodičů je učitelem na ZŠ nebo SŠ, varianta 2 - žádný z rodičů není učitelem na ZŠ nebo SŠ). UČ_POVOLÁNÍ - informuje o snaze studenta získat vzdělání pro učitelské povolání (varianta 1 - chce se stát učitelem, varianta 2 - nechce se stát učitelem). OT1 až OT26 – každá z těchto proměnných nabývá hodnoty 1, když respondent považuje v dané dvojici povolání učitelské povolání za prestižnější než to druhé, jinak nabývá hodnoty 0. Dotazník „Škála prestiže povolání“ Posuďte prosím, jak hodnotíte různá povolání. Ve dvojici zakroužkujte to povolání, které hodnotíte výše z hlediska jeho prestiže. Například takto, pokud byste se rozhodl/a pro povolání B: B Povoláním učitel se rozumí učitel na základní nebo střední škole. Odpovědi nejsou správné nebo chybné, vyjádřete svůj vlastní názor. Pokud si nejste jisti, dávejte první odpověď, která Vás napadne. 1. A učitel B uklízečka 2. A učitel B lékař na poliklinice 3. A učitel B voják z povolání – major 4. A sekretářka B učitel 5. A učitel B soukromý praktický lékař 6. A docent nebo profesor na VŠ B učitel 7. A učitel B opravář televizorů 8. A seřizovač, nástrojář B učitel 9. A učitel B vědec 10. A bankovní úředník B učitel 11. A učitel B kněz 12. A majitel malého obchodu B učitel 13. A učitel B profesionální sportovec 14. A policista B učitel 15. A učitel B soudce 16. A učitel B mistr v továrně 17. A účetní B učitel 18. A učitel B novinář 19. A poslanec B učitel 20. A učitel B starosta 21. A programátor B učitel 22. A učitel B strojvedoucí 23. A ministr B učitel 24. A učitel B soukromý zemědělec 25. A konstruktér, projektant B učitel 26. A učitel B manažer Úkol 1.: Načtěte datový soubor prestiz.sta. Vytvořte proměnnou PRESTIŽ jako součet proměnných OT1 až OT26. Nakreslete sloupkový diagram všech variant této proměnné a spočtěte její číselné charakteristiky (průměr, směrodatná odchylka, šikmost, špičatost, minimum, maximum). Řešení: Sloupkový diagram: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 0 10 20 30 40 50 60 70 Tabulka číselných charakteristik: Popisné statistiky (prestiz_uc_povolani.sta) Proměnná N platných Průměr Minimum Maximum Sm.odch. Šikmost Špičatost PRESTIZ 483 10,6 1 23 3,63 0,64 0,63 Úkol 2.: Prozkoumejte závislost mezi dvojicemi proměnných (SEX, PROSPĚCH), (SEX, UČ_POVOLÁNÍ), (SÍDLO, UČ_POVOLÁNÍ), (UČ_RODINA, PROSPĚCH), (UČ_RODINA, UČ_POVOLÁNÍ). Ve všech pěti případech vytvořte kontingenční tabulky řádkově podmíněných relativních četností, pomocí Pearsonova chí-kvadrát testu testujte na hladině významnosti 0,05 hypotézu o nezávislosti (nezapomeňte vždy ověřit splnění podmínek dobré aproximace) a pro ohodnocení síly závislosti vypočtěte Cramérův koeficient. Řešení: Pro dvojici (SEX, PROSPĚCH): Kontingenční tabulka (prestiz_uc_povolani.sta) Tab. : SEX PROSPĚCH je jedničkář PROSPĚCH není jedničkář Řádk. součty Četnost muž 17 158 175 Řádk. četn. 9,71% 90,29% Četnost žena 66 242 308 Řádk. četn. 21,43% 78,57% Četnost Vš.skup. 83 400 483 Mezi muži je 9,7 % jedničkářů, mezi ženami je 21,4 % jedničkářek. Souhrnná tab.: Očekávané četnosti (prestiz_uc_povolani.sta) Pearsonův chí-kv. : 10,7604, sv=1, p=,001037 SEX PROSPĚCH je jedničkář PROSPĚCH není jedničkář Řádk. součty muž 30,07246 144,9275 175,0000 žena 52,92754 255,0725 308,0000 Vš.skup. 83,00000 400,0000 483,0000 Podmínky dobré aproximace jsou splněny. Hodnota testové statistiky pro test nezávislosti je 10,7604, počet stupňů volnosti je 1 a příslušná p-hodnota je 0,001. S rizikem omylu nejvýše 5 % jsme tedy prokázali, že mezi pohlavím a prospěchem existuje závislost. Rozdíl mezi 9,7 % a 21,4 % je prokazatelný na hladině významnosti 0,05. Cramérův koeficient je 0,1493, což znamená, že závislost mezi pohlavím a prospěchem je slabá. Pro dvojici (SEX, UČ_POVOLÁNÍ): Kontingenční tabulka (prestiz_uc_povolani.sta) Tab. : SEX UČ_POVOLÁNÍ nechce byt ucitel UČ_POVOLÁNÍ chce byt ucitel Řádk. součty Četnost muž 146 29 175 Řádk. četn. 83,43% 16,57% Četnost žena 205 103 308 Řádk. četn. 66,56% 33,44% Četnost Vš.skup. 351 132 483 Vidíme, že pouze 16,6 % mužů chce být učiteli, zatímco 34,4 % žen má v úmyslu se věnovat učitelskému povolání. Souhrnná tab.: Očekávané četnosti (prestiz_uc_povolani.sta) Pearsonův chí-kv. : 15,9916, sv=1, p=,000064 SEX UČ_POVOLÁNÍ nechce byt ucitel UČ_POVOLÁNÍ chce byt ucitel Řádk. součty muž 127,1739 47,8261 175,0000 žena 223,8261 84,1739 308,0000 Vš.skup. 351,0000 132,0000 483,0000 Podmínky dobré aproximace jsou splněny, hypotézu o nezávislosti proměnných SEX a UČ_POVOLÁNÍ zamítáme na hladině významnosti 0,05. Cramérův koeficient je 0,182. Pro dvojici (SÍDLO, UČ_POVOLÁNÍ): Kontingenční tabulka (prestiz_uc_povolani.sta) Tab. : SÍDLO UČ_POVOLÁNÍ nechce byt ucitel UČ_POVOLÁNÍ chce byt ucitel Řádk. součty Četnost do 8000 144 76 220 Řádk. četn. 65,45% 34,55% Četnost nad 8000 207 56 263 Řádk. četn. 78,71% 21,29% Četnost Vš.skup. 351 132 483 Mezi studenty z menších sídel (do 8000 obyvatel) je 34,6 % těch, kteří chtějí být učiteli, zatímco mezi studenty z větších sídel je to jen 21,3 %. Souhrnná tab.: Očekávané četnosti (prestiz_uc_povolani.sta) Pearsonův chí-kv. : 10,5938, sv=1, p=,001135 SÍDLO UČ_POVOLÁNÍ nechce byt ucitel UČ_POVOLÁNÍ chce byt ucitel Řádk. součty do 8000 159,8758 60,1242 220,0000 nad 8000 191,1242 71,8758 263,0000 Vš.skup. 351,0000 132,0000 483,0000 Podmínky dobré aproximace jsou splněny, hypotézu o nezávislosti proměnných SÍDLO a UČ_POVOLÁNÍ zamítáme na hladině významnosti 0,05. Cramérův koeficient je 0,148. Pro dvojici (UČ_RODINA, PROSPĚCH): Kontingenční tabulka (prestiz_uc_povolani.sta) Tab. : UČ_RODINA PROSPĚCH je jedničkář PROSPĚCH není jedničkář Řádk. součty Četnost je z uč. rodiny 11 75 86 Řádk. četn. 12,79% 87,21% Četnost není z uč. rodiny 72 325 397 Řádk. četn. 18,14% 81,86% Četnost Vš.skup. 83 400 483 Mezi studenty z učitelských rodin je 12,8 % jedničkářů. Mezi studenty z neučitelských rodin je 18,1 % jedničkářů. Souhrnná tab.: Očekávané četnosti (prestiz_uc_povolani.sta) Pearsonův chí-kv. : 1,41921, sv=1, p=,233534 UČ_RODINA PROSPĚCH je jedničkář PROSPĚCH není jedničkář Řádk. součty je z uč. rodiny 14,77847 71,2215 86,0000 není z uč. rodiny 68,22153 328,7785 397,0000 Vš.skup. 83,00000 400,0000 483,0000 Podmínky dobré aproximace jsou splněny, hypotézu o nezávislosti proměnných UČ_RODINA a PROSPĚCH nezamítáme na hladině významnosti 0,05. Znamená to, že rozdíl mezi 12,8 % a 18,1 % není prokazatelný na hladině významnosti 0,05. Cramérův koeficient je 0,054. Pro dvojici (UČ_RODINA, UČ_POVOLÁNÍ): Kontingenční tabulka (prestiz_uc_povolani.sta) Tab. : UČ_RODINA UČ_POVOLÁNÍ nechce byt ucitel UČ_POVOLÁNÍ chce byt ucitel Řádk. součty Četnost je z uč. rodiny 59 27 86 Řádk. četn. 68,60% 31,40% Četnost není z uč. rodiny 292 105 397 Řádk. četn. 73,55% 26,45% Četnost Vš.skup. 351 132 483 31,4 % studentů z učitelských rodin chce být učiteli. U studentů z neučitelských rodin je to jen 26,5 %. Souhrnná tab.: Očekávané četnosti (prestiz_uc_povolani.sta) Pearsonův chí-kv. : ,871037, sv=1, p=,350668 UČ_RODINA UČ_POVOLÁNÍ nechce byt ucitel UČ_POVOLÁNÍ chce byt ucitel Řádk. součty je z uč. rodiny 62,4969 23,5031 86,0000 není z uč. rodiny 288,5031 108,4969 397,0000 Vš.skup. 351,0000 132,0000 483,0000 Podmínky dobré aproximace jsou splněny, hypotézu o nezávislosti proměnných UČ_RODINA a UČ_POVOLÁNÍ nezamítáme na hladině významnosti 0,05. Cramérův koeficient je 0,042. Úkol 3.: Každá z pěti zkoumaných alternativních proměnných SEX, SÍDLO, PROSPĚCH, UČ_RODINA, UČ_POVOLÁNÍ rozdělí soubor studentů na dvě nezávislé skupiny, např. na muže a ženy, na jedničkáře a ostatní studenty atd. Na hladině významnosti 0,05 testujte hypotézu, že střední hodnota proměnné PRESTIŽ je v daných dvou skupinách stejná. Vzhledem k velkému rozsahu skupin lze použít dvouvýběrový t-test, i když v některých případech proměnná PRESTIŽ vykazuje určité odchylky od normality. Kromě obvyklého výpočtu průměrů a směrodatných odchylek v obou skupinách, realizace testové statistiky a příslušné p-hodnoty nakreslete též krabicové diagramy proměnné PRESTIŽ. V případě, že nulovou hypotézu zamítnete, zjistěte sílu dvouvýběrového t-testu a vliv skupiny na variabilitu hodnot proměnné PRESTIŽ posuďte pomocí Cohenova koeficientu. Řešení: Pro proměnnou SEX: Výsledek dvouvýběrového t-testu společně s výsledkem F-testu t-testy; grupováno: SEX (prestiz_uc_povolani.sta) Skup. 1: muž Skup. 2: žena Proměnná Průměr muž Průměr žena t sv p Poč.plat muž Poč.plat. žena Sm.odch. muž Sm.odch. žena F-poměr Rozptyly p Rozptyly PRESTIZ 9,902857 10,92532 -2,99915 481 0,002848 175 308 3,581039 3,612899 1,017873 0,904976 Hypotézu o shodě rozptylů nezamítáme na hladině významnosti 0,05, avšak hypotézu o shodě středních hodnot proměnné PRESTIŽ ano. Rozdíl mezi průměrem mužů (9,9) a žen (10,9) je prokazatelný na hladině významnosti 0,05. Krabicové grafy Krabicový graf : PRESTIZ Průměr Průměr±SmCh Průměr±1,96*SmCh muž žena SEX 9,2 9,4 9,6 9,8 10,0 10,2 10,4 10,6 10,8 11,0 11,2 11,4 11,6 PRESTIZ Síla testu je 0,83, lze tedy konstatovat, že neplatnou nulovou hypotézu test zamítá s pravděpodobností aspoň 0,83. Cohenův koeficient nabývá hodnoty 0,28, což svědčí o malém vlivu pohlaví na hodnocení prestiže učitelského povolání. Pro proměnnou SÍDLO: Výsledek dvouvýběrového t-testu společně s výsledkem F-testu t-testy; grupováno: SÍDLO (prestiz_uc_povolani.sta) Skup. 1: do 8000 Skup. 2: nad 8000 Proměnná Průměr do 8000 Průměr nad 8000 t sv p Poč.plat do 8000 Poč.plat. nad 8000 Sm.odch. do 8000 Sm.odch. nad 8000 F-poměr Rozptyly p Rozptyly PRESTIZ 10,59545 10,52091 0,224463 481 0,822493 220 263 3,743485 3,541270 1,117465 0,388739 Hypotézu o shodě rozptylů a hypotézu o shodě středních hodnot nezamítáme na hladině významnosti 0,05. Krabicové grafy Krabicový graf : PRESTIZ Průměr Průměr±SmCh Průměr±1,96*SmCh do 8000 nad 8000 SÍDLO 10,0 10,2 10,4 10,6 10,8 11,0 11,2 PRESTIZ Pro proměnnou PROSPĚCH: Výsledek dvouvýběrového t-testu společně s výsledkem F-testu t-testy; grupováno:PROSPĚCH (prestiz_uc_povolani.sta) Skup. 1: je jedničkář Skup. 2: není jedničkář Proměnná Průměr je jedničkář Průměr není jedničkář t sv p Poč.plat je jedničkář Poč.plat. není jedničkář Sm.odch. je jedničkář Sm.odch. není jedničkář F-poměr Rozptyly p Rozptyly PRESTIZ 10,67470 10,53000 0,330076 481 0,741486 83 400 3,346306 3,690956 1,216596 0,280345 Hypotézu o shodě rozptylů a hypotézu o shodě středních hodnot nezamítáme na hladině významnosti 0,05. Krabicové grafy Krabicový graf : PRESTIZ Průměr Průměr±SmCh Průměr±1,96*SmCh je jedničkář není jedničkář PROSPĚCH 9,8 10,0 10,2 10,4 10,6 10,8 11,0 11,2 11,4 11,6 PRESTIZ Pro proměnnou UČ_RODINA: Výsledek dvouvýběrového t-testu společně s výsledkem F-testu t-testy; grupováno:UČ_RODINA (prestiz_uc_povolani.sta) Skup. 1: je z uč. rodiny Skup. 2: není z uč. rodiny Proměnná Průměr je z uč. rodiny Průměr není z uč. rodiny t sv p Poč.plat je z uč. rodiny Poč.plat. není z uč. rodiny Sm.odch. je z uč. rodiny Sm.odch. není z uč. rodiny F-poměr Rozptyly p Rozptyly PRESTIZ 10,67442 10,52897 0,336469 481 0,736664 86 397 3,393564 3,684158 1,178594 0,359129 Hypotézu o shodě rozptylů a hypotézu o shodě středních hodnot nezamítáme na hladině významnosti 0,05. Krabicové grafy Krabicový graf : PRESTIZ Průměr Průměr±SmCh Průměr±1,96*SmCh je z uč. rodiny není z uč. rodiny UČ_RODINA 9,8 10,0 10,2 10,4 10,6 10,8 11,0 11,2 11,4 11,6 PRESTIZ Pro proměnnou UČ_POVOLÁNÍ: Výsledek dvouvýběrového t-testu společně s výsledkem F-testu t-testy; grupováno:UČ_POVOLÁNÍ (prestiz_uc_povolani.sta) Skup. 1: nechce byt ucitel Skup. 2: chce byt ucitel Proměnná Průměr nechce byt ucitel Průměr chce byt ucitel t sv p Poč.plat nechce byt ucitel Poč.plat. chce byt ucitel Sm.odch. nechce byt ucitel Sm.odch. chce byt ucitel F-poměr Rozptyly p Rozptyly PRESTIZ 9,943020 12,18182 -6,27436 481 0,000000 351 132 3,103390 4,371696 1,984391 0,000001 Vzhledem k tomu, že F-test zamítl na hladině významnosti 0,05 hypotézu o shodě rozptylů, musíme použít variantu dvouvýběrového t-test se separovanými odhady rozptylu. t-testy; grupováno:UČ_POVOLÁNÍ (prestiz_uc_povolani.sta) Skup. 1: nechce byt ucitel Skup. 2: chce byt ucitel Proměnná Průměr nechce byt ucitel Průměr chce byt ucitel t samost odh.rozp sv p oboustr. Poč.plat nechce byt ucitel Poč.plat. chce byt ucitel Sm.odch. nechce byt ucitel Sm.odch. chce byt ucitel PRESTIZ 9,943020 12,18182 -5,39470 182,8987 0,000000 351 132 3,103390 4,371696 Testová statistika je -5,3947, p-hodnota je blízká 0, tedy hypotézu o shodě středních hodnot proměnné PRESTIŽ zamítáme na hladině významnosti 0,05. S rizikem omylu nejvýše 5 % jsme prokázali, že rozdíl mezi průměry 9,94 a 12,18 je prokazatelný na hladině významnosti 0,05. Krabicové grafy Krabicový graf : PRESTIZ Průměr Průměr±SmCh Průměr±1,96*SmCh nechce byt ucitel chce byt ucitel UČ_POVOLÁNÍ 9,0 9,5 10,0 10,5 11,0 11,5 12,0 12,5 13,0 13,5 PRESTIZ Síla testu je 0,99 a Cohenův koeficient je 0,51. To svědčí o středně silném vlivu snahy o získání vzdělání pro učitelské povolání na hodnocení prestiže učitelského povolání.