χ2 chí-kvadrát test Povinná literatura: Mann (2016), Kapitola 11 Z čeho studovat desátou lekci? Povinná literatura: Mann (2016), kap. 11 Příprava na cvičení: Leaflet 12 Koncepty a procedury, cv. 12, kap. 11 Příprava na zkoušku: Mann (2016), kap. 11 Leaflet 12 Sbírka úloh, kap. 11 Koncepty a procedury, cv. 12, kap. 11 ·χ2 chí-kvadrát test · 2 / 59 Proč je χ2 rozdělení důležité pro ekonomy? Testy dobré shody Chcete ověřit, zda vaše data odpovídají předpokladům trhu? χ2 test to zvládne. Příklad: Sleduje spotřebitelské preference, které mají odpovídat teoretickému modelu. Test nezávislosti a test homogenity Odhaluje vazby mezi kategoriemi, jako je vzdělání vs. pohlaví. Pomáhá zodpovědět otázky typu: „Ovlivňuje místo pobytu naše příjmy?“ Testy o populačním rozptylu Nezbytné pro měření rizik: Volatilita na akciovém trhu, fluktuace cen nemovitostí. ·χ2 chí-kvadrát test · 3 / 59 Obsah χ2 rozdělení Testy dobré shody Test nezávislosti, test homogenity Testy o populačním rozptylu ·χ2 chí-kvadrát test · 4 / 59 χ2 rozdělení Rozdělení chí-kvadrát Rozdělení chí-kvadrát má pouze jeden parametr nazývaný stupně volnosti. Tvar křivky rozdělení chí-kvadrát je pro malé stupně volnosti zešikmené doprava a pro velké stupně volnosti se stává symetrickým. Celá křivka rozdělení chí-kvadrát leží napravo od vertikální osy. Rozdělení chí-kvadrát předpokládá pouze nezáporné hodnoty, které jsou označeny symbolem χ2 (čteno jako “chí-kvadrát”). ·χ2 chí-kvadrát test · 5 / 59 χ2 rozdělení Příklad 1 Zadání: Najděte hodnotu χ2 pro 7 stupňů volnosti a plochu 0.10 v pravém ocase křivky rozdělení chí-kvadrát. Řešení: ·χ2 chí-kvadrát test · 6 / 59 χ2 rozdělení Příklad 1: Řešení ·χ2 chí-kvadrát test · 7 / 59 χ2 rozdělení Příklad 2 Zadání: Najděte hodnotu χ2 pro 12 stupňů volnosti a plochu 0.05 v levém ocase křivky rozdělení chí-kvadrát. Řešení: Plocha v pravém ocase = 1 - plocha v levém ocase = 1 - 0.05 = 0.95 ·χ2 chí-kvadrát test · 8 / 59 χ2 rozdělení Příklad 2: Řešení ·χ2 chí-kvadrát test · 9 / 59 Testy dobré shody Obsah χ2 rozdělení Testy dobré shody Test nezávislosti, test homogenity Testy o populačním rozptylu ·χ2 chí-kvadrát test · 10 / 59 Testy dobré shody Testy dobré shody Experiment s následujícími charakteristikami se nazývá multinomický experiment. 1. Experiment se skládá z n identických pokusů (opakování). 2. Každý pokus má jeden z k možných výsledků (nebo kategorií), kde k > 2. 3. Pokusy jsou nezávislé. 4. Pravděpodobnosti různých výsledků zůstávají pro každý pokus konstantní. ·χ2 chí-kvadrát test · 11 / 59 Testy dobré shody Pozorované a očekávané frekvence Frekvence získané z provedení experimentu se nazývají pozorované frekvence a jsou označeny jako O. Očekávané frekvence, označené jako E, jsou frekvence, které očekáváme, že získáme, pokud platí nulová hypotéza. Očekávaná frekvence pro kategorii se vypočítá jako E = np kde n je velikost vzorku a p je pravděpodobnost, že prvek patří do této kategorie, pokud platí nulová hypotéza. ·χ2 chí-kvadrát test · 12 / 59 Testy dobré shody Stupně volnosti pro testy dobré shody V testu dobré shody jsou stupně volnosti definovány jako df = k − 1 kde k označuje počet možných výsledků (nebo kategorií) experimentu. ·χ2 chí-kvadrát test · 13 / 59 Testy dobré shody Testová statistika pro testy dobré shody Testová statistika pro test dobré shody je označována χ2 a její hodnota je spočítána jako χ2 = (O − E)2 E kde O = pozorovaná frekvence pro kategorii E = očekávaná frekvence pro kategorii = np Poznámka: Pamatujte, že test dobré shody pomocí χ2 je vždy jednostranný test. ·χ2 chí-kvadrát test · 14 / 59 Testy dobré shody Příklad 3 Zadání: V jedné bance je umístěn bankomat, který je zákazníkům dostupný pouze v pracovní dny od pondělí do pátku od 7:00 do 18:00. Manažerka banky chtěla zjistit, zda je procento transakcí provedených na tomto bankomatu stejné pro každý z 5 pracovních dnů v týdnu. Náhodně vybrala jeden týden a spočítala počet transakcí provedených na tomto bankomatu každý den během tohoto týdne. Informace, které získala, jsou uvedeny v následující tabulce, kde počet uživatelů představuje počet transakcí na tomto bankomatu v jednotlivých dnech. Pro jednoduchost budeme tyto transakce označovat jako „lidé“ nebo „uživatelé“. ·χ2 chí-kvadrát test · 15 / 59 Testy dobré shody Příklad 3 Zadání: Můžeme, na hladině významnosti 1 %, zamítnout nulovou hypotézu, že počet lidí, kteří využívají tento bankomat, je stejný pro každý z 5 dnů v týdnu? Předpokládejme, že tento týden je reprezentativní pro všechny týdny, pokud jde o využívání tohoto bankomatu. ·χ2 chí-kvadrát test · 16 / 59 Testy dobré shody Příklad 3: Řešení Krok 1 H0 : p1 = p2 = p3 = p4 = p5 = 0.20 H1 : Alespoň dva z pěti poměrů nejsou rovny 0.20 Krok 2 Existuje 5 kategorií - 5 dnů, ve kterých je bankomat používán (multinomický experiment), pro test používáme rozdělení χ2. Krok 3 α = 0.01 k = počet kategorií = 5 df = k − 1 = 5 − 1 = 4 Kritická hodnota χ2 = 13.277 ·χ2 chí-kvadrát test · 17 / 59 Testy dobré shody Příklad 3: Řešení Krok 4 Všechny potřebné výpočty k určení hodnoty testové statistiky χ2 jsou uvedeny v tabulce: χ2 = (O − E)2 E = 23.184 ·χ2 chí-kvadrát test · 18 / 59 Testy dobré shody Příklad 3: Řešení Krok 5 Hodnota testové statistiky χ2 = 23.184 je větší než kritická hodnota χ2 = 13.277, tedy spadá do oblasti zamítnutí. Proto zamítáme nulovou hypotézu. Tvrdíme, že počet osob, které používají tento bankomat, se v průběhu 5 dnů v týdnu liší. ·χ2 chí-kvadrát test · 19 / 59 Testy dobré shody Příklad 4 Zadání: V průzkumu provedeném 3.–6. dubna 2023 byli dotazováni občané Evropy ve věku 18 a více let, zda si myslí, že lidé s vyššími příjmy „platí svůj spravedlivý podíl na daních, platí příliš mnoho nebo platí příliš málo.“ Z respondentů 61 % uvedlo, že platí příliš málo, 24 % uvedlo spravedlivý podíl, 13 % uvedlo příliš mnoho a 2 % nemělo názor. Předpokládejme, že tato procenta odrážejí názor populace Evropanů ve věku 18 a více let v roce 2023. Nedávno bylo na stejnou otázkou dotázáno 1000 náhodně vybraných Evropanů ve věku 18 a více let. Následující tabulka uvádí počet Evropanů v tomto vzorku, kteří patřili do každé kategorie odpovědí. ·χ2 chí-kvadrát test · 20 / 59 Testy dobré shody Příklad 4 Zadání: Na hladině významnosti 2.5 % testujte, zda se současné rozložení názorů od roku 2023 liší. ·χ2 chí-kvadrát test · 21 / 59 Testy dobré shody Příklad 4: Řešení Krok 1 H0 : Současné procentní rozložení názorů je stejné jako v 2023. H1 : Současné procentní rozložení názorů je rozdílné oproti 2023. Krok 2 Existují 4 kategorie - multinomický experiment; pro test používáme rozdělení χ2. Krok 3 α = 0.025 k = počet kategorií = 4 df = k − 1 = 4 − 1 = 3 Kritická hodnota χ2 = 9.348 ·χ2 chí-kvadrát test · 22 / 59 Testy dobré shody Příklad 4: Řešení Krok 4 Všechny potřebné výpočty k určení hodnoty testové statistiky χ2 jsou uvedeny v tabulce: χ2 = (O − E)2 E = 4.188 ·χ2 chí-kvadrát test · 23 / 59 Testy dobré shody Příklad 4: Řešení Krok 5 Hodnota testové statistiky χ2 = 4.188 je menší než kritická hodnota χ2 = 9.348, tedy spadá do oblasti nezamítnutí. Proto nezamítáme nulovou hypotézu. Tvrdíme, že současné procentuální rozložení názorů se neliší od rozložení v roce 2023. ·χ2 chí-kvadrát test · 24 / 59 Test nezávislosti, test homogenity Obsah χ2 rozdělení Testy dobré shody Test nezávislosti, test homogenity Testy o populačním rozptylu ·χ2 chí-kvadrát test · 25 / 59 Test nezávislosti, test homogenity Test nezávislosti, test homogenity Často máme informace o více než jedné proměnné pro každý prvek. Takové informace mohou být shrnuty a prezentovány pomocí tabulky dvojrozměrné klasifikace, která se nazývá kontingenční tabulka nebo křížová tabulka. ·χ2 chí-kvadrát test · 26 / 59 Test nezávislosti, test homogenity Test nezávislosti Test nezávislosti zahrnuje test nulové hypotézy, že dva atributy populace nejsou vzájemně závislé. Hodnota testové statistiky χ2 pro test nezávislosti je vypočítána jako χ2 = (O − E)2 E kde O a E jsou pozorované a očekávané frekvence pro danou buňku. Stupně volnosti pro test nezávislosti jsou df = (R − 1)(C − 1) kde R a C jsou počet řádků a počet sloupců v dané kontingenční tabulce. ·χ2 chí-kvadrát test · 27 / 59 Test nezávislosti, test homogenity Příklad 5 Zadání: Nedostatek kázně se stal hlavním problémem ve školách v USA. Byl vybrán náhodný vzorek 300 dospělých, kteří byli dotázáni, zda podporují větší svobodu pro učitele při trestání studentů za nedostatek kázně. Dvojrozměrná klasifikace odpovědí těchto dospělých je uvedena v následující tabulce. Spočítejte očekávané frekvence pro tuto tabulku za předpokladu, že tyto dva atributy, pohlaví a názory na danou otázku, jsou nezávislé. ·χ2 chí-kvadrát test · 28 / 59 Test nezávislosti, test homogenity Příklad 5: Řešení Očekávaná frekvence E pro buňku = (počet v řádku)(počet v sloupci) velikost vzorku ·χ2 chí-kvadrát test · 29 / 59 Test nezávislosti, test homogenity Příklad 6 Zadání: Znovu zvažte klasifikační tabulku uvedenou v příkladu 11-5. V tomto příkladu byla náhodně vybrána skupina 300 dospělých, kteří odpovídali, zda podporují poskytnutí větší svobody učitelům k trestání studentů za nedisciplinovanost. Na základě výsledků průzkumu byla připravena a prezentována klasifikační tabulka v příkladu 11-5. Poskytuje vzorek dostatečné informace k závěru, že tyto dva atributy, pohlaví a názory dospělých, jsou závislé? Při testování použijte hladinu významnosti 1 %. ·χ2 chí-kvadrát test · 30 / 59 Test nezávislosti, test homogenity Příklad 6: Řešení Krok 1 H0 : Pohlaví a názory dospělých jsou nezávislé. H1 : Pohlaví a názory dospělých jsou závislé. Krok 2 Pro provedení testu nezávislosti pro kontingenční tabulku používáme rozdělení χ2. Krok 3 α = 0.01 df = (R − 1)(C − 1) = (2 − 1)(3 − 1) = 2 Kritická hodnota χ2 = 9.210 ·χ2 chí-kvadrát test · 31 / 59 Test nezávislosti, test homogenity Příklad 6: Řešení Krok 4 Všechny potřebné výpočty k určení hodnoty testové statistiky χ2 jsou uvedeny v Tabulce: χ2 = (O − E)2 E = (93 − 105)2 105 + (70 − 59.5)2 59.5 + (12 − 10.5)2 10.5 + + (87 − 75)2 75 + (32 − 42.5)2 42.5 + (6 − 7.5)2 7.5 = = 1.371 + 1.853 + 0.214 + 1.92 + 2.594 + 0.3 = = 8.252 ·χ2 chí-kvadrát test · 32 / 59 Test nezávislosti, test homogenity Příklad 6: Řešení Krok 5 Hodnota testové statistiky χ2 = 8.252 je menší než kritická hodnota χ2 = 9.210, a proto spadá do oblasti nezamítnutí. Proto nemůžeme zamítnout nulovou hypotézu. Tvrdíme, že z dostupného vzorku nemáme dostatečný důkaz pro závěr, že pohlaví a názory dospělých jsou pro tuto otázku závislé. ·χ2 chí-kvadrát test · 33 / 59 Test nezávislosti, test homogenity Příklad 7 Zadání: Výzkumník chtěl studovat vztah mezi pohlavím a vlastnictvím smartphone v dospělé populaci, která vlastní mobilní telefony. Vzal vzorek 2000 dospělých a získal informace uvedené v následující tabulce. Own Smart Phones Do Not Own Smart Phones Men 640 450 Women 440 470 Můžete na hladině významnosti 5 % dospět k závěru, že pohlaví a vlastnictví chytrého telefonu jsou u všech dospělých provázané? ·χ2 chí-kvadrát test · 34 / 59 Test nezávislosti, test homogenity Příklad 7: Řešení Krok 1 H0 : Pohlaví a vlastnictví chytrého telefonu nejsou závislé. H1 : Pohlaví a vlastnictví chytrého telefonu jsou závislé. Krok 2 Provádíme test nezávislosti. Používáme rozdělení χ2 k provedení tohoto testu. Krok 3 α = 0.05 df = (R − 1)(C − 1) = (2 − 1)(2 − 1) = 1 Kritická hodnota χ2 = 3.841 ·χ2 chí-kvadrát test · 35 / 59 Test nezávislosti, test homogenity Příklad 7: Řešení Krok 4 Hodnoty k určení testové statistiky χ2 jsou uvedeny v Tabulce: Own Do Not Own Smart Phones (Y) Smart Phones (N) Row Totals Men (M) 640 (588.60) 450 (501.40) 1090 Women (W) 440 (491.40) 470 (418.60) 910 Column Totals 1080 920 2000 χ2 = (O − E)2 E = (640 − 588.60)2 588.60 + (450 − 501.40)2 501.40 + + (440 − 491.40)2 491.40 + (470 − 418.60)2 481.60 = = 4.489 + 5.269 + 5.376 + 6.311 = 21.445 ·χ2 chí-kvadrát test · 36 / 59 Test nezávislosti, test homogenity Příklad 7: Řešení Krok 5 Hodnota testové statistiky χ2 = 21.445 je větší než kritická hodnota χ2 = 3.841, a proto spadá do oblasti zamítnutí. Proto zamítáme nulovou hypotézu. Tvrdíme, že vzorek poskytuje silný důkaz pro závěr, že pohlaví a vlastnictví chytrých telefonů jsou u všech dospělých provázané. ·χ2 chí-kvadrát test · 37 / 59 Test nezávislosti, test homogenity Test homogenity Test homogenity zahrnuje testování nulové hypotézy, že podíly prvků s určitými charakteristikami ve dvou nebo více různých populacích jsou stejné, oproti alternativní hypotéze, že tyto podíly nejsou stejné. ·χ2 chí-kvadrát test · 38 / 59 Test nezávislosti, test homogenity Příklad 8 Zadání: Zvažte data o rozdělení příjmů domácností v Kalifornii a Wisconsinu uvedená v Tabulce. Na hladině významnosti 2.5 % otestujte, zda se rozdělení domácností s ohledem na úrovně příjmů mezi těmito dvěma státy liší (není homogenní). ·χ2 chí-kvadrát test · 39 / 59 Test nezávislosti, test homogenity Příklad 8: Řešení Krok 1 H0 : Podíly domácností, které patří do různých příjmových skupin, jsou v obou státech stejné. H1 : Podíly domácností, které patří do různých příjmových skupin, nejsou v obou státech stejné. Krok 2 Používáme χ2 rozdělení k provedení testu homogenity. Krok 3 α = 0.025 df = (R − 1)(C − 1) = (3 − 1)(2 − 1) = 2 Kritická hodnota χ2 = 7.378 ·χ2 chí-kvadrát test · 40 / 59 Test nezávislosti, test homogenity Příklad 8: Řešení χ2 = (O − E)2 E = (70 − 65)2 65 + (34 − 39)2 39 + (80 − 75)2 75 + (40 − 45)2 45 + (100 − 110)2 110 + (76 − 66)2 66 = 0.385 + 0.641 + 0.333 + 0.566 + 0.909 + 1.515 = 4.339 ·χ2 chí-kvadrát test · 41 / 59 Test nezávislosti, test homogenity Příklad 8: Řešení Krok 4 Hodnota testové statistiky χ2 = 4.339 je menší než kritická hodnota χ2 = 7.378, a proto nespadá do oblasti zamítnutí. Proto nezamítáme nulovou hypotézu. Tvrdíme, že neexistuje důkaz, že se rozdělení domácností na základě příjmů mezi Kalifornií a Wisconsinem liší. ·χ2 chí-kvadrát test · 42 / 59 Testy o populačním rozptylu Obsah χ2 rozdělení Testy dobré shody Test nezávislosti, test homogenity Testy o populačním rozptylu ·χ2 chí-kvadrát test · 43 / 59 Testy o populačním rozptylu Testy o populačním rozptylu Odhad rozptylu populace Testování hypotéz o rozptylu populace ·χ2 chí-kvadrát test · 44 / 59 Testy o populačním rozptylu Výběrové rozdělení (n − 1)s2 /σ2 Pokud je populace, ze které byl vzorek vybrán, (přibližně) normálně rozdělená, pak statistika (n − 1)s2 σ2 má chí-kvadrát rozdělení s n − 1 stupni volnosti. ·χ2 chí-kvadrát test · 45 / 59 Testy o populačním rozptylu Odhad populačního rozptylu Interval spolehlivosti pro rozptyl populace σ2 Za předpokladu, že populace, ze které byl vzorek získán, má (přibližně) normální rozdělení, můžeme získat (1 − α)100% interval spolehlivosti pro rozptyl populace σ2 jako (n − 1)s2 χ2 α/2 až (n − 1)s2 χ2 1−α/2 kde χ2 α/2 a χ2 1−α/2 jsou hodnoty získané z chí-kvadrát rozdělení pro plochy α/2 a 1 − α/2 v pravém chvostu křivky chí-kvadrát rozdělení při n − 1 stupních volnosti. Interval spolehlivosti pro směrodatnou odchylku populace lze získat jako druhé odmocniny obou hranic intervalu spolehlivosti pro rozptyl populace. ·χ2 chí-kvadrát test · 46 / 59 Testy o populačním rozptylu Odhad populačního rozptylu Příklad 9 Zadání: Jedním z typů sušenek vyráběných společností Danovy čočkové sušenky jsou kakaové sušenky. Stroj, který plní balení sušenek, je nastaven tak, aby průměrná čistá hmotnost balení byla 32 uncí s rozptylem 0.015 čtvereční unce. Kontrolor kvality občas vybere vzorek několika balení, vypočítá rozptyl jejich čisté hmotnosti a sestaví 95% interval spolehlivosti pro rozptyl populace. Pokud se jeden nebo oba konce tohoto intervalu nacházejí mimo rozmezí 0.008 až 0.030, je stroj zastaven a znovu nastaven. Nedávno byl náhodným výběrem odebrán vzorek 25 balení z výrobní linky, u kterého byl zjištěn výběrový rozptyl 0.029 čtvereční unce. Myslíte, na základě těchto informací, že stroj potřebuje úpravu? Předpokládejte, že čistá hmotnost sušenek ve všech baleních má normální rozdělení. ·χ2 chí-kvadrát test · 47 / 59 Testy o populačním rozptylu Odhad populačního rozptylu Příklad 9: Řešení Krok 1 n = 25 a s2 = 0.029 Krok 2 α = 1 − 0.95 = 0.05 α/2 = 0.05/2 = 0.025 1 − α/2 = 1 − 0.025 = 0.975 df = n − 1 = 25 − 1 = 24 Kritická hodnota χ2 pro 24 stupňů volnosti a plochu 0.025 v pravém chvostu = 39.364 Kritická hodnota χ2 pro 24 stupňů volnosti a plochu 0.975 v pravém chvostu = 12.401 ·χ2 chí-kvadrát test · 48 / 59 Testy o populačním rozptylu Odhad populačního rozptylu Příklad 9: Řešení Krok 3 (n − 1)s2 χ2 α/2 až (n − 1)s2 χ2 1−α/2 (25 − 1)(0.029) 39.364 až (25 − 1)(0.029) 12.401 0.0177 až 0.0561 S 95% spolehlivostí tvrdíme, že rozptyl všech balení kakaových sušenek leží mezi 0.0177 a 0.0561 čtvereční unce. Interval spolehlivosti pro směrodatnou odchylku populace σ můžeme získat jako kladné druhé odmocniny obou hranic výše uvedeného intervalu spolehlivosti pro rozptyl populace. Tedy 95% interval spolehlivosti pro směrodatnou odchylku populace je 0.133 až 0.237. ·χ2 chí-kvadrát test · 49 / 59 Testy o populačním rozptylu Testování hypotéz o rozptylu populace Testová statistika pro test hypotézy o σ2 Hodnota testové statistiky χ2 se vypočítá jako χ2 = (n − 1)s2 σ2 kde s2 je výběrový rozptyl, σ2 je předpokládaná hodnota rozptylu populace a n − 1 představuje počet stupňů volnosti. Populace, ze které byl výběr proveden, se předpokládá jako (přibližně) normálně rozdělená. ·χ2 chí-kvadrát test · 50 / 59 Testy o populačním rozptylu Testování hypotéz o rozptylu populace Příklad 10 Zadání: Jedním z typů sušenek vyráběných společností Haddad Food Company jsou kakaové sušenky. Stroj, který plní balení těchto sušenek, je nastaven tak, aby průměrná čistá hmotnost balení byla 32 uncí s rozptylem 0.015 čtvereční unce. Kontrolor kvality občas vybere vzorek několika těchto balení, vypočítá rozptyl jejich čisté hmotnosti a provede test hypotézy o rozptylu populace. Vždy používá hladinu významnosti α = 0.01. Přijatelná hodnota rozptylu populace je 0.015 čtvereční unce nebo méně. Pokud závěr testu ukazuje, že rozptyl populace není v rámci přijatelných hodnot, je stroj zastaven a upraven. Nedávný náhodný vzorek 25 balení z výrobní linky ukázal výběrový rozptyl 0.029 čtvereční unce. Myslíte si, na základě těchto informací, že je potřeba stroj upravit? Předpokládejte, že čistá hmotnost sušenek ve všech baleních má normální rozdělení. ·χ2 chí-kvadrát test · 51 / 59 Testy o populačním rozptylu Testování hypotéz o rozptylu populace Příklad 10: Řešení Krok 1 H0 : σ2 ≤ 0.015 (Rozptyl populace je v rámci přijatelné hodnoty) H1 : σ2 > 0.015 (Rozptyl pop. překračuje přijatelnou hodnotu) Krok 2 Používáme χ2 rozdělení k provedení testu rozptylu σ2. Krok 3 α = 0.01 df = n − 1 = 25 − 1 = 24 Kritická hodnota χ2 = 42.980 ·χ2 chí-kvadrát test · 52 / 59 Testy o populačním rozptylu Testování hypotéz o rozptylu populace Příklad 10: Řešení Krok 4 χ2 = (n − 1)s2 σ2 = (25 − 1)(0.029) 0.015 = 46.400 Krok 5 Hodnota testové statistiky χ2 = 46.400 je větší než kritická hodnota χ2 = 42.980, a proto spadá do oblasti zamítnutí. Proto zamítáme nulovou hypotézu. Docházíme k závěru, že by stroj měl být zastaven a upraven, protože rozptyl populace není v přijatelných hodnotách. ·χ2 chí-kvadrát test · 53 / 59 Testy o populačním rozptylu Testování hypotéz o rozptylu populace Příklad 11 Zadání: Je známo, že rozptyl známek všech studentů na velké univerzitě byl v roce 2014 roven 0.24. Profesorka chce zjistit, zda se rozptyl známek současných studentů na této univerzitě liší od hodnoty 0.24. Odebrala náhodný vzorek 20 studentů a zjistila, že rozptyl jejich známek je 0.27. Můžeme na hladině významnosti 5 % dojít k závěru, že současný rozptyl známek studentů na této univerzitě je jiný než 0.24? Předpokládejte, že rozptyl známek všech současných studentů na této univerzitě má (přibližně) normální rozdělení. ·χ2 chí-kvadrát test · 54 / 59 Testy o populačním rozptylu Testování hypotéz o rozptylu populace Příklad 11: Řešení Krok 1 H0 : σ2 = 0.24 (Rozptyl populace není rozdílný od 0.24) H1 : σ2 ̸= 0.24 (Rozptyl populace je rozdílný od 0.24) Krok 2 Používáme χ2 rozdělení k provedení testu rozptylu σ2. Krok 3 α = 0.05 Plocha v chvostech = 0.025 df = n − 1 = 20 − 1 = 19 Kritické hodnoty: χ2 = 32.852 a χ2 = 8.907 ·χ2 chí-kvadrát test · 55 / 59 Testy o populačním rozptylu Testování hypotéz o rozptylu populace Příklad 11: Řešení Krok 4 χ2 = (n − 1)s2 σ2 = (20 − 1)(0.27) 0.24 = 21.375 Krok 5 Hodnota testové statistiky χ2 = 21.375 leží mezi kritickými hodnotami χ2 = 8.907 a χ2 = 32.852, a proto spadá do oblasti nezamítnutí. Proto nezamítáme nulovou hypotézu. Docházíme k závěru, že rozptyl populace současných známek studentů na této univerzitě se zřejmě neliší od hodnoty 0.24. ·χ2 chí-kvadrát test · 56 / 59 Testy o populačním rozptylu Testování hypotéz o rozptylu populace Shrnutí přednášky: χ2 rozdělení Testy dobré shody Test nezávislosti, test homogenity Testy o populačním rozptylu ·χ2 chí-kvadrát test · 57 / 59 Testy o populačním rozptylu Testování hypotéz o rozptylu populace Co si nastudovat na příští týden? Příprava na cvičení: Leaflet 12 Koncepty a procedury, cv. 12, kap. 11 Povinná literatura: Mann (2016), Kapitola 12 ·χ2 chí-kvadrát test · 58 / 59 Testy o populačním rozptylu Testování hypotéz o rozptylu populace Děkuji za pozornost! X ·χ2 chí-kvadrát test · 59 / 59