1 SOC108/708 LEKCE 04: TESTOVÁNÍ HYPOTÉZ (c) Petr Mareš a Ladislav Rabušic 2002 LEKCE12 FAKTOROVÁ ANALÝZA vzorový výsledek cvičení JMéNO A PříJMENí: UČO: IMATRIK. ROčNíK: 4.1 Udělejte 15 náhodných výběrů ze souboru EVS-CR1999.sav tak, abyste v každém výběru náhodně vybrali vždy přesně 400 případů z celkového počtu případů. Sledujte, jak se mění průměr a směrodatná odchylka proměnné VEK v těchto výběrech a srovnejte tyto hodnoty s celkovým průměrem. Zobrazte hodnoty těchto průměrů zaokrouhlené do grafu a zjistěte, zdali tato distribuce má charakteristiky normálního rozložení. Budou výsledky vašich řešení identické s řešením vašich kolegů, nebo se budou lišit? Zdůvodněte svou odpověď. 1. Výpočet parametru (nezapomínejme, že soubor, s kterým pracujeme, je pro nás v tomto případě ZÁKLADNÍ SOUBOR, z kterého provádíme NÁHODNÉ VÝBĚRY (o velikosti 400 případů). Parametr je tedy 45,69 let. 2. Výběr případů provedeme v proceduře SELECT CASES: Random sample of cases (400) Pro každý takto určený výběr provedeme výpočet průměrného věku (FREQUENCIES) a pak musíme znovu provést výběr a znovu provést výpočet atd. Každý výsledek zapíšeme do tabulky. Průměry ve vámi vybraných jednotlivých podsouborech budou odlišné, neboť ani jeden z výběrů není svou strukturou identický se strukturou základního souboru. Vaše výsledky také nemohou být identické ani s tímto vzorovým příkladem, ani s řešením vašich kolegů, protože jde o různé výběry. Pokud bychom ale zvýšili počet výběrů například tím, že bychom do řešení zahrnuly všechny vaše výběry, zvýšení jejich počtu by a) přiblížilo rozložení průměrných věku ve výběrových souborech normálnímu rozložení b) přiblížilo průměr vypočítaný z těchto výběrových souborů parametru. Jeden z možných výsledků: Rozložení průměrů v 15 výběrech: pořad průměr St.odc í h. 1 44.99 16.31 2 46.09 17.14 3 46.61 17.03 4 46.32 17.40 5 46.46 16.55 6 45.00 16.71 7 45.44 16.99 8 45.22 17.05 9 47.21 16.63 10 46.30 16.37 11 46.30 17.34 12 45.68 16.27 13 45.71 16.74 14 45.22 16.60 15 45.39 16.46 CELKE 45.86 16.77 M Další postup: Tabulku vyplněnou v EXCELU (nastavte si desetinné tečky - vyžaduje to SPSS) zablokujete a vyklopíte do prázdné matice SPSS (jiným způsobem jak převést excelový soubor na systémový soubor v SPSS by bylo použít FILE ? OPEN DATABASE ? NEW QUERY). Pak si jen popíšete obě proměnné (průměr a standardní odchylku): dáte jim jména, labels a ponecháte 2 desetinná místa. Následně v modulu GRAPHS můžete zadat histogramy a nechat je proložit modelem normálního rozložení. Jak je vidět, k normální rozložení má našich 15 výběrů daleko, ale to se při tak malém počtu dalo předpokládat. Při tak malém počtu výběrů se budou také vaše výsledky od výsledků ostatních značně lišit. Avšak čím více výběrů byste udělali tím více by se vaše výsledky blížily normálnímu rozložení a také by byly stále podobnější výsledkům vašich kolegů a kolegyň (za předpokladu, že by i ono zvyšovali stejným způsobem počet svých výběrů).