Výběrové rozdělení Povinná literatura: Mann (2016), Kapitola 7 Z čeho studovat sedmou lekci? Povinná literatura: Mann (2016), kap. 07 Příprava na cvičení: Leaflet 08 Koncepty a procedury, cv. 08, kap. 07 Příprava na zkoušku: Mann (2016), kap. 07 Leaflet 08 Sbírka úloh, kap. 07 Koncepty a procedury, cv. 08, kap. 07 ·Výběrové rozdělení · 2 / 66 Motivační vstup Chápání výběrových rozdělení a statistických charakteristik, jako je střední hodnota a směrodatná odchylka, nám umožňuje porozumět chování populací na základě malých vzorků dat. Tento přístup je nepostradatelný při analýze dat v oblastech jako ekonomie, marketing, zdravotnictví nebo finance. Pochopení těchto základních konceptů vám nejen pomůže správně interpretovat výsledky průzkumů a experimentů, ale také se vyhnout častým chybám a zkreslením v datech. ·Výběrové rozdělení · 3 / 66 Obsah Výběrové rozdělení Pravděpodobnostní rozdělení populace a výběru Výběrová chyba a Chyby nezpůsobené výběrem Střední hodnota a směrodatná odchylka ¯x Tvar výběrového rozdělení ¯x Výběr z populace, která má normální rozdělení Výběr z populace, která nemá normální rozdělení Aplikace výběrového rozdělení ¯x Podíly populace a vzorku Výběrové rozdělení podílu ˆp Střední hodnota s směrodatná odchylka ˆp Tvar výběrového rozdělení ˆp Aplikace výběrového rozdělení ˆp ·Výběrové rozdělení · 4 / 66 Výběrové rozdělení Pravděpodobnostní rozdělení populace a výběru Pravděpodobnostní rozdělení populace a výběru Pravděpodobnostní rozdělení populace je pravděpodobnostní rozdělení dat celé populace. Obecně se pravděpodobnostní rozdělení statistického údaje získaného ze vzorku dat nazývá výběrové rozdělení. Pravděpodobnostní rozdělení výběrového průměru ¯x je získané ze všech možných vzorků stejné velikosti vybraných z populace. Toto pravděpodobnostní rozdělení ¯x udává různé hodnoty, které může ¯x nabývat a také pravděpodobnost realizace každé z těchto hodnot. ·Výběrové rozdělení · 5 / 66 Výběrové rozdělení Pravděpodobnostní rozdělení populace a výběru Pravděpodobnostní rozdělení populace Ukázka: Předpokládejme, že ve třídě pokročilé statistiky je pouze pět studentů a výsledky jejich půlsemestrálních zkoušek jsou následující: 70, 78, 80, 80, 95. Nechť x označuje skóre studenta. Četnost populace a relativní četnostní rozdělení (vlevo) a pravděpodobnostní rozdělení populace (vpravo) ·Výběrové rozdělení · 6 / 66 Výběrové rozdělení Pravděpodobnostní rozdělení populace a výběru Výběrové rozdělení Znovu se podívejme na soubor půlsemestrálních výsledků pěti studentů. Uvažujme všechny možné vzorky tří výsledků z této skupiny, které lze vybrat bez vracení. Celkový počet možných výběrů je 5 3 = 5! 3!(5 − 3)! = 5 · 4 · 3 3 · 2 · 1 = 10. Předpokládejme, že přiřadíme písmena A, B, C, D a E k výsledkům pěti studentů tak, že: A = 70, B = 78, C = 80, D = 80, E = 95. Pak deset možných výběru tří výsledků jsou: ABC, ABD, ABE, ACD, ACE, ADE, BCD, BCE, BDE, CDE ·Výběrové rozdělení · 7 / 66 Výběrové rozdělení Pravděpodobnostní rozdělení populace a výběru Všechny možné výběry a jejich průměry, když je velikost vzorku 3 ·Výběrové rozdělení · 8 / 66 Výběrové rozdělení Pravděpodobnostní rozdělení populace a výběru Pravděpodobnostní rozdělení výběru z populace Četnost výběru a relativní četnostní rozdělení ¯x (vlevo) a pravděpodobnostní rozdělení ¯x (vpravo) ·Výběrové rozdělení · 9 / 66 Výběrové rozdělení Výběrová chyba a Chyby nezpůsobené výběrem Výběrová chyba a Chyby nezpůsobené výběrem Výběrová chyba je rozdíl mezi hodnotou statistického údaje získaného ze vzorku a hodnotou odpovídajícího parametru populace. V případě průměru platí: Výběrová chyba = ¯x − µ, za předpokladu, že výběr je náhodný a nebyla učiněna žádná chyba ve vzorkování. Chyby, které nastanou při sběru, zaznamenávání a tabulaci dat, se nazývají chyby nezpůsobené náhodným výběrem. ·Výběrové rozdělení · 10 / 66 Výběrové rozdělení Výběrová chyba a Chyby nezpůsobené výběrem Důvody výskytu chyb nezpůsobených náhodným výběrem 1. Pokud je výběr nenáhodný (a tudíž nejpravděpodobněji nereprezentativní), mohou být výsledky ze získaného vzorku příliš odlišné od výsledků sčítání lidu. 2. Otázky mohou být formulovány tak, že nejsou plně pochopeny členy vzorku nebo populace. 3. Respondenti mohou úmyslně poskytovat falešné informace v reakci na některé citlivé otázky. 4. Osoba provádějící průzkum může udělat chybu a zadat nesprávné číslo do záznamů nebo udělat chybu při zadávání dat do počítače. ·Výběrové rozdělení · 11 / 66 Výběrové rozdělení Výběrová chyba a Chyby nezpůsobené výběrem Příklad 1 Zadání: Znovu se podívejme na soubor pěti hodnocení studentů. Předpokládejme, že z této sady byl vybrán jeden vzorek tří hodnocení, a tento vzorek obsahuje hodnocení 70, 80 a 95. Vypočtěte výběrovou chybu. Řešení: µ = 70 + 78 + 80 + 80 + 95 5 = 80.60 ¯x = 70 + 80 + 95 3 = 81.67 Výběrová chyba = ¯x − µ = 81.67 − 80.60 = 1.07 To znamená, že odhadnuté průměrné skóre ze vzorku je o 1.07 vyšší než průměrné skóre populace. Poznamenejme, že k tomuto rozdílu došlo náhodně, protože jsme použili vzorek místo celé populace. ·Výběrové rozdělení · 12 / 66 Výběrové rozdělení Výběrová chyba a Chyby nezpůsobené výběrem Výběrová chyba a Chyby nezpůsobené výběrem Předpokládejme nyní, že vybereme vzorek tří hodnocení a omylem zaznamenáme druhé hodnocení jako 82 místo 80. V důsledku toho vypočítáme průměr vzorku jako ¯x = 70 + 82 + 95 3 = 82.33. Rozdíl mezi tímto průměrem vzorku a průměrem populace je ¯x − µ = 82.33 − 80.60 = 1.73. Tento rozdíl nepředstavuje výběrovou chybu. Pouze 1.07 tohoto rozdílu je způsobeno výběrovou chybou. ·Výběrové rozdělení · 13 / 66 Výběrové rozdělení Výběrová chyba a Chyby nezpůsobené výběrem Výběrová chyba a Chyby nezpůsobené výběrem Zbývající část představuje chybu nezpůsobenou výběrem. Tato chyba je rovna 1.73 - 1.07 = .66 a stala se kvůli chybě, kterou jsme udělali při zaznamenávání druhého skóre ve vzorku. Chyba nezpůsobená výběrem = Nesprávné ¯x − Správné ¯x = 82.33 − 81.67 = .66 ·Výběrové rozdělení · 14 / 66 Střední hodnota a směrodatná odchylka ¯x Výběrové rozdělení Pravděpodobnostní rozdělení populace a výběru Výběrová chyba a Chyby nezpůsobené výběrem Střední hodnota a směrodatná odchylka ¯x Tvar výběrového rozdělení ¯x Výběr z populace, která má normální rozdělení Výběr z populace, která nemá normální rozdělení Aplikace výběrového rozdělení ¯x Podíly populace a vzorku Výběrové rozdělení podílu ˆp Střední hodnota s směrodatná odchylka ˆp Tvar výběrového rozdělení ˆp Aplikace výběrového rozdělení ˆp ·Výběrové rozdělení · 15 / 66 Střední hodnota a směrodatná odchylka ¯x Střední hodnota a směrodatná odchylka ¯x Střední hodnotu a směrodatnou odchylku výběrového rozdělení ¯x budeme v tomto kurzu označovat µ¯x a σ¯x. Střední hodnota výběrového rozdělení ¯x je vždy rovna střední hodnotě populace. Platí: µ¯x = µ. Směrodatná odchylka výběrového rozdělení ¯x je σ¯x = σ √ n , kde σ je směrodatná odchylka populace a n je velikost vzorku. Tento vzorec se používá, když n N ≤ .05, kde N je velikost populace. ·Výběrové rozdělení · 16 / 66 Střední hodnota a směrodatná odchylka ¯x Vsuvka Pokud není splněna podmínka n N ≤ .05, používáme následující vzorec pro výpočet σ¯x: σ¯x = σ √ n N − n N − 1 kde faktor N−n N−1 se nazývá korekční faktor pro konečnou populaci. ·Výběrové rozdělení · 17 / 66 Střední hodnota a směrodatná odchylka ¯x Dvě důležité charakteristiky 1. Rozptyl výběrového rozdělení ¯x je menší než rozptyl odpovídajícího rozdělení populace, tzn. σ¯x < σx 2. Směrodatná odchylka výběrového rozdělení ¯x klesá s rostoucí velikostí vzorku. ·Výběrové rozdělení · 18 / 66 Střední hodnota a směrodatná odchylka ¯x Příklad 2 Zadání: Střední hodnota hodinové mzdy pro všech 5000 zaměstnanců pracujících ve velké společnosti je 27.50 dolarů a směrodatná odchylka je 3.70 dolarů. Nechť ¯x je hodnota průměrné hodinové mzdy pro vzorek určitých zaměstnanců vybraných z této společnosti náhodným výběrem. Určete střední hodnotu a směrodatnou odchylku ¯x pro následující velikosti vzorku: (a) 30 (b) 75 (c) 200. ·Výběrové rozdělení · 19 / 66 Střední hodnota a směrodatná odchylka ¯x Příklad 2: Řešení N = 5000, µ = $27.50, σ = $3.70. Řešení (a) V tomto případě, n N = 30 5000 = .006 < .05. µ¯x = µ = $27.50 σ¯x = σ √ n = 3.70 √ 30 = $ .676 Řešení (b) V tomto případě, n N = 75 5000 = .015 < .05. µ¯x = µ = $27.50 σ¯x = σ √ n = 3.70 √ 75 = $ .427 Řešení (c) V tomto případě, n N = 200 5000 = .04 < .05. µ¯x = µ = $27.50 σ¯x = σ √ n = 3.70 √ 200 = $ .262 ·Výběrové rozdělení · 20 / 66 Tvar výběrového rozdělení ¯x Obsah Výběrové rozdělení Pravděpodobnostní rozdělení populace a výběru Výběrová chyba a Chyby nezpůsobené výběrem Střední hodnota a směrodatná odchylka ¯x Tvar výběrového rozdělení ¯x Výběr z populace, která má normální rozdělení Výběr z populace, která nemá normální rozdělení Aplikace výběrového rozdělení ¯x Podíly populace a vzorku Výběrové rozdělení podílu ˆp Střední hodnota s směrodatná odchylka ˆp Tvar výběrového rozdělení ˆp Aplikace výběrového rozdělení ˆp ·Výběrové rozdělení · 21 / 66 Tvar výběrového rozdělení ¯x Tvar výběrového rozdělení ¯x Tvar výběrového rozdělení ¯x souvisí s následujícími dvěma případy: 1. Populace, ze které jsou vzorky čerpány, má normální rozdělení. 2. Populace, ze které jsou vzorky čerpány, nemá normální rozdělení. ·Výběrové rozdělení · 22 / 66 Tvar výběrového rozdělení ¯x Výběr z populace, která má normální rozdělení Výběr z populace, která má normální rozdělení Pokud je populace, ze které jsou odebírány vzorky, normálně rozdělena se střední hodnotou µ a směrodatnou odchylkou σ, pak bude výběrové rozdělení průměru ¯x získaného ze vzorku také normálně rozděleno s následující střední hodnotou a směrodatnou odchylkou (a to bez ohledu na velikost vzorku): µ¯x = µ a σ¯x = σ √ n ·Výběrové rozdělení · 23 / 66 Tvar výběrového rozdělení ¯x Výběr z populace, která má normální rozdělení Výběr z populace, která má normální rozdělení ·Výběrové rozdělení · 24 / 66 Tvar výběrového rozdělení ¯x Výběr z populace, která má normální rozdělení Příklad 3 Podle Zprávy o odměňování lékařů za rok 2015 vydělávali v roce 2014 američtí internisté v průměru 196 000 dolarů. Předpokládejme, že příjmy všech amerických internistů v roce 2014 jsou normálně rozděleny se střední hodnotou 196 000 dolarů a směrodatnou odchylkou 20 000 dolarů. Nechť ¯x je průměr příjmů náhodného vzorku amerických internistů za rok 2014. Spočtěte střední hodnotu a směrodatnou odchylku ¯x a popište tvar jejího výběrového rozdělení pro velikost vzorku (a) 16 (b) 50 (c) 1000. ·Výběrové rozdělení · 25 / 66 Tvar výběrového rozdělení ¯x Výběr z populace, která má normální rozdělení Příklad 3: Řešení Řešení (a) µ¯x = µ = 196 000 USD a σ¯x = σ √ n = 20 000 USD √ 16 = 5 000 USD Řešení (b) µ¯x = µ = 196 000 USD a σ¯x = σ √ n = 20 000 USD √ 50 = 2 828.427 USD Řešení (c) µ¯x = µ = 196 000 USD a σ¯x = σ √ n = $20, 000 √ 1000 = 632.456 USD Protože roční příjmy všech amerických internistů za rok 2014 jsou normálně rozdělené, rozdělení průměru ¯x pro vzorky 16, 50 a 1000 takových lékařů jsou také přibližně normálně rozdělené. ·Výběrové rozdělení · 26 / 66 Tvar výběrového rozdělení ¯x Výběr z populace, která má normální rozdělení Příklad 3: Řešení graficky Řešení (a): Řešení (b): Řešení (c): ·Výběrové rozdělení · 27 / 66 Tvar výběrového rozdělení ¯x Výběr z populace, která nemá normální rozdělení Výběr z populace, která nemá normální rozdělení Centrální limitní věta Podle centrální limitní věty, v případě velkého rozsahu vzorku1, je pravděpodobnostní rozdělení ¯x přibližně normální, a to bez ohledu na tvar rozdělení populace, na které je vzorkování provedeno. Střední hodnota a směrodatná odchylka rozdělení ¯x jsou µ¯x = µ a σ¯x = σ √ n . 1 Velikost vzorku je obvykle považována za velkou, pokud n ≥ 30. ·Výběrové rozdělení · 28 / 66 Tvar výběrového rozdělení ¯x Výběr z populace, která nemá normální rozdělení Výběr z populace, která nemá normální rozdělení ·Výběrové rozdělení · 29 / 66 Tvar výběrového rozdělení ¯x Výběr z populace, která nemá normální rozdělení Příklad 4 Zadání: Průměrná výše nájemného, kterou platí všichni nájemci v malém městě, je 1550 dolarů a směrodatná odchylka činí 225 dolarů. Rozdělení nájemného všech nájemců v tomto městě je však zešikmené doprava. Spočítejte střední hodnotu a směrodatnou odchylku rozdělení ¯x a popište jeho tvar, v případech, kdy je velikost vzorku: (a) 30 (b) 100. ·Výběrové rozdělení · 30 / 66 Tvar výběrového rozdělení ¯x Výběr z populace, která nemá normální rozdělení Příklad 4: Řešení Řešení (a) Nechť ¯x je střední hodnota nájemného zaplacená vzorkem 30 nájemců µ¯x = µ = $1550 σ¯x = σ √ n = 225 √ 30 = $41.079 Řešení (b) Nechť ¯x je střední hodnota nájemného zaplacená vzorkem 100 nájemců µ¯x = µ = $1550 σ¯x = σ √ n = 225 √ 100 = $22.500 Ačkoliv rozdělení nájemného placeného všemi nájemci není normální, velikost vzorku je velká (n ≥ 30), proto podle centrální limitní věty je tvar rozdělení ¯x přibližně normální. ·Výběrové rozdělení · 31 / 66 Tvar výběrového rozdělení ¯x Výběr z populace, která nemá normální rozdělení Příklad 4: Řešení graficky Řešení (a): Řešení (b): ·Výběrové rozdělení · 32 / 66 Aplikace výběrového rozdělení ¯x Obsah Výběrové rozdělení Pravděpodobnostní rozdělení populace a výběru Výběrová chyba a Chyby nezpůsobené výběrem Střední hodnota a směrodatná odchylka ¯x Tvar výběrového rozdělení ¯x Výběr z populace, která má normální rozdělení Výběr z populace, která nemá normální rozdělení Aplikace výběrového rozdělení ¯x Podíly populace a vzorku Výběrové rozdělení podílu ˆp Střední hodnota s směrodatná odchylka ˆp Tvar výběrového rozdělení ˆp Aplikace výběrového rozdělení ˆp ·Výběrové rozdělení · 33 / 66 Aplikace výběrového rozdělení ¯x Aplikace výběrového rozdělení ¯x 1. Pokud z populace vezmeme všechny možné vzorky stejné velikosti a vypočteme průměr pro každý z těchto vzorků, pak bude asi 68.26 % průměrů v rozmezí jedné směrodatné odchylky od střední hodnoty (průměru) populace. 2. Pokud z populace vezmeme všechny možné vzorky stejné velikosti a vypočteme průměr pro každý z těchto vzorků, pak bude asi 95.44 % průměrů v rozmezí dvou směrodatných odchylek od střední hodnoty (průměru) populace. 3. Pokud z populace vezmeme všechny možné vzorky stejné velikosti a vypočteme průměr pro každý z těchto vzorků, pak bude asi 99.74 % průměrů v rozmezí tří směrodatných odchylek od střední hodnoty (průměru) populace. ·Výběrové rozdělení · 34 / 66 Aplikace výběrového rozdělení ¯x Aplikace výběrového rozdělení ¯x µ ± 1 · σ µ ± 2 · σ µ ± 3 · σ ·Výběrové rozdělení · 35 / 66 Aplikace výběrového rozdělení ¯x Příklad 5 Zadání: Předpokládejme, že hmotnosti všech balení určité značky sušenek jsou normálně rozdělené se střední hodnotou 32 unce a směrodatnou odchylkou 0.3 unce. Určete pravděpodobnost, že průměrná hmotnost ¯x náhodně vybraného vzorku 20 balení těchto sušenek bude mezi 31.8 a 31.9 unce. Řešení: µ¯x = µ = 32 unce σ¯x = σ √ n = .3 √ 20 ≈ 0.06708204 unce !!! Pro výpočet pravděpodobnosti je nutné definovat příslušné z-skóre! ·Výběrové rozdělení · 36 / 66 Aplikace výběrového rozdělení ¯x Z-skóre pro hodnotu ¯x Z-skóre pro hodnotu ¯x se vypočítá jako Z = ¯x − µ σ¯x ·Výběrové rozdělení · 37 / 66 Aplikace výběrového rozdělení ¯x Příklad 5: Řešení Pro ¯x = 31.8: z = 31.8−32 .06708204 = −2.98 Pro ¯x = 31.9: z = 31.9−32 .06708204 = −1.49 P(31.8 < ¯x < 31.9) = P(−2.98 < Z < −1.49) = P(Z < −1.49) − P(Z < −2.98) = .0681 − .0014 = .0667 ·Výběrové rozdělení · 38 / 66 Aplikace výběrového rozdělení ¯x Příklad 6 Zadání: Podle společnosti Moebs Services Inc. stojí individuální běžný účet u amerických bank ročně mezi 350 a 450 dolary. Předpokládejme, že současná střední hodnota ročního nákladu na všechny běžné účty u amerických bank je 400 dolarů s odchylkou 30 dolarů. Nechť ¯x je současný průměrný roční náklad na náhodně vybraný vzorek 225 individuálních běžných účtů těchto bank. (a) Jaká je pravděpodobnost, že průměrný roční náklad na běžné účty v tomto vzorku je do 4 dolarů od střední hodnoty populace? (b) Jaká je pravděpodobnost, že průměrný roční náklad na běžné účty v tomto vzorku je minimálně o 2.70 dolaru menší než střední hodnota populace? ·Výběrové rozdělení · 39 / 66 Aplikace výběrového rozdělení ¯x Příklad 6: Řešení Střední hodnota µ je 400 dolarů a směrodatná odchylka σ je 30 dolarů. Tvar rozdělení pravděpodobnosti populace je neznámý. Nicméně, rozdělení vzorku ¯x je přibližně normální, protože velikost vzorku je dostatečně velká (n > 30). µ¯x = µ = $400 σ¯x = σ √ n = $30 √ 225 = $2.00 ·Výběrové rozdělení · 40 / 66 Aplikace výběrového rozdělení ¯x Příklad 6: Řešení Graficky Řešení (a): Řešení (b): ·Výběrové rozdělení · 41 / 66 Aplikace výběrového rozdělení ¯x Příklad 6: Řešení výpočtem Řešení (a) Pro ¯x = 396 z = ¯x−µ σ¯x = 396−400 2.00 = −2.00 Pro ¯x = 404 z = ¯x−µ σ¯x = 404−400 2.00 = 2.00 P(396 ≤ ¯x ≤ 404) = P(−2.00 ≤ z ≤ 2.00) = .9772 − .0228 = .9544 Pst, že průměrný roční náklad 225 běžných účtů v tomto vzorku je v rozmezí 4 dolarů od střední hodnoty populace, je .9544. Řešení (b) Pro ¯x = 397.30 z = ¯x−µ σ¯x = 397.30−400 2.00 = −1.35 P(¯x ≤ $397.50) = P(z ≤ −1.35) = .0885 Pst, že průměrný roční náklad na běžné účty ve vzorku je minimálně o 2.70 dolarů nižší než střední hodnota populace, je .0885. ·Výběrové rozdělení · 42 / 66 Podíly populace a vzorku Obsah Výběrové rozdělení Pravděpodobnostní rozdělení populace a výběru Výběrová chyba a Chyby nezpůsobené výběrem Střední hodnota a směrodatná odchylka ¯x Tvar výběrového rozdělení ¯x Výběr z populace, která má normální rozdělení Výběr z populace, která nemá normální rozdělení Aplikace výběrového rozdělení ¯x Podíly populace a vzorku Výběrové rozdělení podílu ˆp Střední hodnota s směrodatná odchylka ˆp Tvar výběrového rozdělení ˆp Aplikace výběrového rozdělení ˆp ·Výběrové rozdělení · 43 / 66 Podíly populace a vzorku Podíly populace a vzorku Podíly populace a vzorku, označované jako p a ˆp, se vypočítají jako p = X N a ˆp = x n , kde N = celkový počet prvků v populaci, n = celkový počet prvků ve vzorku, X = počet prvků v populaci, které vykazují určitou charakteristiku, x = počet prvků ve vzorku, které vykazují určitou charakteristiku. ·Výběrové rozdělení · 44 / 66 Podíly populace a vzorku Příklad 7 Zadání: Předpokládejme, že ve městě žije celkem 789 654 rodin a 563 282 z nich vlastní domy. Z tohoto města je vybrán vzorek 240 rodin a 158 z nich vlastní domy. Určete v populaci a ve vzorku podíly rodin, které vlastní domy. Řešení: p = X N = 563 282 789 654 = .71 ˆp = x n = 158 240 = .66 ·Výběrové rozdělení · 45 / 66 Podíly populace a vzorku Výběrové rozdělení podílu ˆp Výběrové rozdělení podílu ˆp Pravděpodobnostní rozdělení podílu ˆp získaného ze vzorku, se nazývá výběrové rozdělení podílu. Rozdělení poskytuje různé hodnoty, které může ˆp nabývat, a jejich příslušné pravděpodobnosti. ·Výběrové rozdělení · 46 / 66 Podíly populace a vzorku Výběrové rozdělení podílu ˆp Příklad 8 Zadání: Společnost Boe Consultant Associates má pět zaměstnanců. Tabulka uvádí jména těchto pěti zaměstnanců a informace týkající se jejich znalosti statistiky. ·Výběrové rozdělení · 47 / 66 Podíly populace a vzorku Výběrové rozdělení podílu ˆp Příklad 8: Řešení Pokud definujeme podíl populace p jako podíl zaměstnanců, kteří rozumí statistice, pak platí: p = 3 5 = 0.60. Nyní předpokládejme, že vyberme všechny možné vzorky tří zaměstnanců a pro každý vzorek vypočítáme podíl zaměstnanců, kteří rozumí statistice. Celkový počet vzorků = C5 3 = 5! 3!(5−3)! = 5·4·3·2·1 3·2·1·2·1 = 10. ·Výběrové rozdělení · 48 / 66 Podíly populace a vzorku Výběrové rozdělení podílu ˆp Příklad 8: Řešení Všechny možné vzorky o velikosti 3 a hodnota ˆp pro každý vzorek. ·Výběrové rozdělení · 49 / 66 Podíly populace a vzorku Výběrové rozdělení podílu ˆp Příklad 7-8 Řešení Četnost výběru a relativní četnostní rozdělení ˆp (vlevo) a pravděpodobnostní rozdělení ˆp (vpravo) ·Výběrové rozdělení · 50 / 66 Podíly populace a vzorku Střední hodnota s směrodatná odchylka ˆp Střední hodnota s směrodatná odchylka ˆp Střední hodnota výběrového rozdělení podílu ˆp, je označena µˆp a je rovna podílu populace p. Tudíž, µˆp = p Směrodatná odchylka výběrového rozdělení podílu ˆp, je označena σˆp a je dána vzorcem σˆp = pq n kde p je podíl populace, q = 1 − p, a n je velikost vzorku. Tento vzorec se používá, když n/N ≤ .05, kde N je velikost populace. ·Výběrové rozdělení · 51 / 66 Podíly populace a vzorku Střední hodnota s směrodatná odchylka ˆp Vsuvka Pokud n/N > 0.05, pak se směrodatná odchylka ˆp vypočítá jako: σˆp = pq n N − n N − 1 kde faktor N−n N−1 nazýváme korekční faktor konečné populace. ·Výběrové rozdělení · 52 / 66 Podíly populace a vzorku Tvar výběrového rozdělení ˆp Centrální limitní věta pro výběrové rozdělení podílu Centrální limitní věta pro výběrové rozdělení podílu Podle centrální limitní věty je výběrové rozdělení ˆp pro dostatečně velký vzorek přibližně normální. V případě podílu se velikost vzorku považuje za dostatečně velkou, pokud jsou np a nq obě větší než 5 to znamená, pokud np > 5 a nq > 5. ·Výběrové rozdělení · 53 / 66 Podíly populace a vzorku Tvar výběrového rozdělení ˆp Příklad 9 Zadání: Podle průzkumu New York Times/CBS News 55 % dospělých uvedlo, že vlastnictví domu je velmi důležitou součástí amerického snu. Předpokládejme, že tento výsledek platí pro současnou populaci amerických dospělých. Nechť ˆp je podíl amerických dospělých v náhodném vzorku 2000 osob, kteří řeknou, že vlastnictví domu je velmi důležitou součástí amerického snu. Určete průměr a směrodatnou odchylku ˆp a popište tvar jeho výběrového rozdělení. ·Výběrové rozdělení · 54 / 66 Podíly populace a vzorku Tvar výběrového rozdělení ˆp Příklad 9: Řešení p = .55, ⇒ q = 1 − p = 1 − .55 = .45, n = 2000, µˆp = p = .55, σˆp = pq n = (.55)(.45) 2000 = .0111, np = 2000(.55) = 1100 a nq = 2000(.45) = 900. Výběrové rozdělení ˆp je přibližně normální (podle centrální limitní věty – np a nq jsou oba větší než 5) s průměrem .55 a směrodatnou odchylkou .0111. ·Výběrové rozdělení · 55 / 66 Aplikace výběrového rozdělení ˆp Obsah Výběrové rozdělení Pravděpodobnostní rozdělení populace a výběru Výběrová chyba a Chyby nezpůsobené výběrem Střední hodnota a směrodatná odchylka ¯x Tvar výběrového rozdělení ¯x Výběr z populace, která má normální rozdělení Výběr z populace, která nemá normální rozdělení Aplikace výběrového rozdělení ¯x Podíly populace a vzorku Výběrové rozdělení podílu ˆp Střední hodnota s směrodatná odchylka ˆp Tvar výběrového rozdělení ˆp Aplikace výběrového rozdělení ˆp ·Výběrové rozdělení · 56 / 66 Aplikace výběrového rozdělení ˆp Aplikace výběrového rozdělení ˆp Když provádíme studii, obvykle z populace odebíráme pouze jeden vzorek a všechna rozhodnutí nebo závěry činíme na základě výsledků tohoto jednoho vzorku. K určení pravděpodobnosti, že hodnota ˆp vypočítaná z jednoho vzorku spadne do daného intervalu, používáme koncepty průměru, směrodatné odchylky a výběrového rozdělení ˆp . ·Výběrové rozdělení · 57 / 66 Aplikace výběrového rozdělení ˆp Příklad 10 Zadání: V nedávném celoamerickém telefonním průzkumu 75 % dospělých uvedlo, že vysokoškolské vzdělání je nyní pro většinu lidí příliš drahé. Předpokládejme, že tento výsledek odpovídá současné situaci mezi americkými dospělými. Nechť ˆp je podíl v náhodně vybraném vzorku 1400 dospělých Američanů, kteří sdílejí tento názor. Určete pravděpodobnost, že podíl dospělých v tomto vzorku, kteří budou tento názor zastávat je mezi mezi 76.5 % až 78 %. ·Výběrové rozdělení · 58 / 66 Aplikace výběrového rozdělení ˆp Příklad 10: Řešení p = .75, ⇒ q = 1 − p = 1 − .75 = .25, n = 1400, µˆp = p = .75, σˆp = pq n = (0.75)(0.25) 1400 = 0.01157275, np = 1400(0.75) = 1050 a nq = 1400(0.25) = 350. Výběrové rozdělení ˆp je přibližně normální (podle centrální limitní věty – np a nq jsou oba větší než 5) s průměrem .75 a směrodatnou odchylkou .0115. ·Výběrové rozdělení · 59 / 66 Aplikace výběrového rozdělení ˆp Z skóre pro hodnotu ˆp Z-skóre pro hodnotu ˆp se vypočítá jako z = ˆp − p σˆp ·Výběrové rozdělení · 60 / 66 Aplikace výběrového rozdělení ˆp Příklad 10: Řešení ˆp = .765 z = .765−.75 .01157275 = 1.30 ˆp = .780 z = .78−.75 .01157275 = 2.59 P(.765 < ˆp < .78) = P(1.30 < z < 2.59) = .9952 − .9032 = .0920 Pravděpodobnost, že 76.5 % až 78 % amerických dospělých z náhodného vzorku 1400 osob řekne, že vysokoškolské vzdělání se stalo pro většinu lidí příliš drahým, je 0.0920. ·Výběrové rozdělení · 61 / 66 Aplikace výběrového rozdělení ˆp Příklad 11 Zadání: Zastánkyně práv obyvatel Pravdová, která kandiduje na post primátora ve velkém městě, tvrdí, že ji podporuje 53 % všech oprávněných voličů toho města. Předpokládejme, že toto tvrzení je pravdivé. Jaká je pravděpodobnost, že v náhodném vzorku 400 registrovaných voličů z tohoto města bude Pravdovou podporovat méně než 49 %? ·Výběrové rozdělení · 62 / 66 Aplikace výběrového rozdělení ˆp Příklad 11: Řešení Máme n = 400, p = .53, a q = 1 − p = 1 − .53 = .47. Střední hodnota a směrodatná odchylka jsou µˆp = .53 σˆp = pq n = (.53)(.47) 400 = .02495496 Určíme z-skóre z = 0.49 − 0.53 0.02495496 = −1.60 Dopočítáme pravděpodobnost P(ˆp < .49) = P(z < −1.60) = .0548 Pravděpodobnost, že v náhodném vzorku 400 osob bude Pravdovou preferovat méně než 49 % voličů, je .0548. ·Výběrové rozdělení · 63 / 66 Aplikace výběrového rozdělení ˆp Shrnutí přednášky: Výběrové rozdělení Pravděpodobnostní rozdělení populace a výběru Výběrová chyba a Chyby nezpůsobené výběrem Střední hodnota a směrodatná odchylka ¯x Tvar výběrového rozdělení ¯x Výběr z populace, která má normální rozdělení Výběr z populace, která nemá normální rozdělení Aplikace výběrového rozdělení ¯x Podíly populace a vzorku Výběrové rozdělení podílu ˆp Střední hodnota s směrodatná odchylka ˆp Tvar výběrového rozdělení ˆp Aplikace výběrového rozdělení ˆp ·Výběrové rozdělení · 64 / 66 Aplikace výběrového rozdělení ˆp Co si nastudovat na příští týden? Příprava na cvičení: Leaflet 08 Koncepty a procedury, cv. 08, kap. 07 Povinná literatura: Mann (2016), Kapitola 8 ·Výběrové rozdělení · 65 / 66 Aplikace výběrového rozdělení ˆp Děkuji za pozornost! Source: Casey Dunn & Creature Cast ·Výběrové rozdělení · 66 / 66