Zpracování datového souboru získaného z dotazníkového šetření o mobilech Autor: Bc. David Fiedor V této části se zaměříme na testování hypotéz, že hmotnost mobilů, jejich výška, šířka, hloubka a objem neliší u mužů a žen. Hmotnost Pozorovaný kvantil Oček.normál.hodnoty Pohlaví: žena 20 40 60 80 100 120 140 160 180 200 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 Pohlaví: muž 20 40 60 80 100 120 140 160 180 200 Obr.1.: Normální pravděpodobnostní graf proměnné Hmotnost kategorizovaný podle pohlaví. Tab.1.: Testy normality dat pro proměnnou Hmotnost podle pohlaví. Testy normality (Datový soubor o mobilech v Mobily-testy normality) Zhrnout podmínku: ženy N max D Lilliefors - p W p Hmotnost: 46 0,121518 p < ,10 0,875526 0,000152 Testy normality (Datový soubor o mobilech v Mobily-testy normality) Zhrnout podmínku: muži N max D Lilliefors - p W p Hmotnost: 21 0,177332 p < ,10 0,887229 0,019940 Tab.2.: Dvouvýběrový Wilcoxonův test (Mann-Whitney test) pro proměnnou Hmotnost testující shodnost mediánu v závislosti na pohlaví. Mann-Whitneyův U test (Datový soubor o mobilech v Mobily-testy normality) Dle proměn. Pohlaví Označené testy jsou významné na hladině p <,05000 Sčt poř. - žena Sčt poř. - muž U Z p- hodn. Z - upraven é p- hodn. N platn. - žena N platn. - muž 2*1str. přesné p Hmot nost 1441,500 836,5000 360,5 000 - 1,648 95 0,099 159 - 1,65037 0,098 869 46 21 0,098027 Komentář k získaným výsledkům: U proměnné hmotnost je již z N-P grafu patrné, že je porušena normalita dat. Tato skutečnost se nám prokázala i testem normality, a proto jsme byli nuceni použít dvouvýběrový Wilcoxonův test, který systém Statistica pojmenovává jako Mann-Whitneyho test. Jelikož p-hodnota tohoto testu je rovna 0,098027, což je větší než 0,05, na hladině významnosti 0,05 nezamítáme nulovou hypotézu H0, která říká, že se mediány hmotnosti mobilních telefonů u žen a mužů neliší. Výška Pozorovaný kvantil Oček.normál.hodnoty Pohlaví: žena 80 85 90 95 100 105 110 115 120 125 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 Pohlaví: muž 80 85 90 95 100 105 110 115 120 125 Obr.2.: Normální pravděpodobnostní graf proměnné Výška kategorizovaný podle pohlaví. Tab.3.: Testy normality dat pro proměnnou Výška podle pohlaví. Testy normality (Datový soubor o mobilech v Mobily-testy normality) Zhrnout podmínku: ženy N max D Lilliefors - p W p Výška: 46 0,165033 p < ,01 0,951896 0,055502 Testy normality (Datový soubor o mobilech v Mobily-testy normality) Zhrnout podmínku: muži N max D Lilliefors - p W p Výška: 21 0,139896 p > .20 0,950079 0,341817 Tab.4.: Dvouvýběrový t-test a F-test pro proměnnou Výška testující shodnost průměrů a rozptylů v závislosti na pohlaví. t-testy; grupováno: Pohlaví (Datový soubor o mobilech v Mobily-testy normality) Skup. 1: žena Skup. 2: muž Průměr - žena Průměr - muž t sv p Poč.pl at - žena Poč.plat . - muž Sm.odch. - žena Sm.odch. - muž F-poměr - Rozptyly p - Rozptyly Výška 103,258 106,985 -1,78267 65 0,079309 46 21 8,537150 6,389858 1,785021 0,161077 Komentář k získaným výsledkům: N-P graf proměnné výška vykazuje oproti hmotnosti normální rozložení dat základního souboru. Tím, že p-hodnota S-W testu normality dat převýšila hodnotu 0,05 u žen i u mužů, nezamítáme hypotézu o normalitě těchto dat. Proto lze využít dvouvýběrového t-testu a F-testu pro testování těchto dat. Tabulka 4 nám již přináší výsledky těchto testů, přičemž podle p-hodnot t-testu i F-testu nezamítáme nulové hypotézy o shodě středních hodnot a rozptylů a lze konstatovat, že se na hladině významnosti 0,05 neliší výška mobilního telefonu u žen a u mužů. Šířka Pozorovaný kvantil Oček.normál.hodnoty Pohlaví: žena 38 40 42 44 46 48 50 52 54 56 58 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 Pohlaví: muž 38 40 42 44 46 48 50 52 54 56 58 Obr.3.: Normální pravděpodobnostní graf proměnné Šířka kategorizovaný podle pohlaví. Tab.5.: Testy normality dat pro proměnnou Šířka podle pohlaví. Testy normality (Datový soubor o mobilech v Mobily-testy normality) Zhrnout podmínku: ženy N max D Lilliefors - p W p Šířka: 46 0,185555 p < ,01 0,926318 0,006235 Testy normality (Datový soubor o mobilech v Mobily-testy normality) Zhrnout podmínku: muži N max D Lilliefors - p W p Šířka: 21 0,162842 p < ,15 0,950910 0,354371 Tab.6.: Dvouvýběrový Wilcoxonův test (Mann-Whitney test) pro proměnnou Šířka testující shodnost mediánu v závislosti na pohlaví. Mann-Whitneyův U test (Datový soubor o mobilech v Mobily-testy normality) Dle proměn. Pohlaví Označené testy jsou významné na hladině p <,05000 Sčt poř. - žena Sčt poř. - muž U Z p- hodn. Z - upraven é p- hodn. N platn. - žena N platn. - muž 2*1str. přesné p Šíř ka 1510,500 767,5000 429,5 000 - 0,716 347 0,473 778 - 0,72156 4 0,470 563 46 21 0,472654 Komentář k získaným výsledkům: Proměnná šířka vykazuje opět porušení normality dat – jak u N-P grafu, tak u testu normality dat. Proto použijeme ke zjištění rozdílu mezi šířkou mobilních telefonů mužů a žen opět Wilcoxonova dvouvýběrového testu. P-hodnota, která je rovna 0,472654 je vyšší než zvolená hladina významnosti 0,05, proto na této hladině významnosti nelze zamítnout nulovou hypotézu o shodě mediánů výšek mobilních telefonů mužů a žen. Hloubka Pozorovaný kvantil Oček.normál.hodnoty Pohlaví: žena 6 8 10 12 14 16 18 20 22 24 26 28 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 Pohlaví: muž 6 8 10 12 14 16 18 20 22 24 26 28 Obr.4.: Normální pravděpodobnostní graf proměnné Hloubka kategorizovaný podle pohlaví. Tab.7.: Testy normality dat pro proměnnou Hloubka podle pohlaví. Testy normality (Datový soubor o mobilech v Mobily-testy normality) Zhrnout podmínku: ženy N max D Lilliefors - p W p Hloubka: 46 0,130623 p < ,10 0,943514 0,026522 Testy normality (Datový soubor o mobilech v Mobily-testy normality) Zhrnout podmínku: muži N max D Lilliefors - p W p Hloubka: 21 0,116046 p > .20 0,921430 0,092684 Tab.8.: Dvouvýběrový Wilcoxonův test (Mann-Whitney test) pro proměnnou Hloubka testující shodnost mediánu v závislosti na pohlaví. Mann-Whitneyův U test (Datový soubor o mobilech v Mobily-testy normality) Dle proměn. Pohlaví Označené testy jsou významné na hladině p <,05000 Sčt poř. - žena Sčt poř. - muž U Z p- hodn. Z - upraven é p- hodn. N platn. - žena N platn. - muž 2*1str. přesné p Hlou bka 1539,500 738,5000 458,5 000 - 0,324 384 0,745 648 - 0,32513 0 0,745 083 46 21 0,742522 Komentář k získaným výsledkům: Protože je porušena podmínka normality dat u žen, jsme nuceni testovat shodu středních hodnot pomocí neparametrického testu – v tomto případě použijeme opět dvouvýběrový Wilcoxonův test. Tento test nám znovu prokázal nezamítnutí nulové hypotézy o shodě mezi muži a ženami, neboť p-hodnota tohoto testu je rovna 0,742522, což je vyšší než 0,05. Objem Pozorovaný kvantil Oček.normál.hodnoty Pohlaví: žena 20000 40000 60000 80000 1E5 1,2E5 1,4E5 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 Pohlaví: muž 20000 40000 60000 80000 1E5 1,2E5 1,4E5 Obr.5.: Normální pravděpodobnostní graf proměnné Objem kategorizovaný podle pohlaví. Tab.9.: Testy normality dat pro proměnnou Objem podle pohlaví. Testy normality (Datový soubor o mobilech v Mobily-testy normality) Zhrnout podmínku: ženy N max D Lilliefors - p W p Objem: 46 0,103343 p > .20 0,971787 0,322268 Testy normality (Datový soubor o mobilech v Mobily-testy normality) Zhrnout podmínku: muži N max D Lilliefors - p W p Objem: 21 0,111175 p > .20 0,956673 0,451800 Tab.10.: Dvouvýběrový t-test a F-test pro proměnnou Objem testující shodnost průměrů a rozptylů v závislosti na pohlaví. t-testy; grupováno: Pohlaví (Datový soubor o mobilech v Mobily-testy normality) Skup. 1: žena Skup. 2: muž Průměr - žena Průměr - muž t sv p Poč. plat - žena Poč. plat. - muž Sm.odch. - žena Sm.odch. - muž F-poměr - Rozptyly p - Rozptyly Objem 72327,85 79186,49 -1,14427 65 0,256708 46 21 21379,89 25592,86 1,432936 0,313729 Komentář k získaným výsledkům: Poslední proměnnou, která již byla uměle vytvořena ze získaných dat, je objem. Tato proměnná vykazovala již podle normálního pravděpodobnostního grafu normální rozložení. Tato skutečnost se potvrdila jak u mužů tak u žen použitím testu normality. Pro testování hypotézy o shodě mediánů jsme zvolili parametrický t-test doplněný F-testem pro testování shody rozptylů. Na hladině významnosti 0,05 nelze zamítnout nulovou hypotézu o tom, že se střední hodnoty objemu mobilních telefonů u žen a mužů neliší.