Základní pojmy matematické statistiky Matematická statistika je věda, která analyzuje a interpretuje data především za účelem získání předpovědi a zlepšení rozhodování v různých oborech lidské činnosti. Přitom se řídí principem statistické indukce, tj. na základě znalostí o náhodném výběru z určitého rozložení pravděpodobností se snaží učinit závěry o vlastnostech tohoto rozložení. Ústředním pojmem matematické statistiky je tedy pojem náhodného výběru. Definice náhodného výběru: a) Nechť Xi, Xn jsou stochasticky nezávislé náhodné veličiny, které mají všechny stejné rozložení L(3). Řekneme, že Xi, Xn je náhodný výběr rozsahu n z rozložení L(3). (Číselné realizace xi, xn náhodného výběru Xi, Xn uspořádané do sloupcového vektoru odpovídají datovému souboru zavedenému v popisné statistice.) b) Nechť (Xi,Yi), (Xn,Yn) jsou stochasticky nezávislé dvourozměrné náhodné vektory, které mají všechny stejné dvourozměrné rozložení L2(&). Řekneme, že (Xi,Yi), (Xn,Yn) je dvourozměrný náhodný výběr rozsahu n z dvourozměrného rozložení L2(3). (Číselné realizace (xi,yi), (xn,yn) náhodného výběru (Xi,Yi), (Xn,Yn) uspořádané do matice typu 2xn odpovídají dvourozměrnému datovému souboru zavedenému v popisné statistice.) c) Analogicky lze definovat p-rozměrný náhodný výběr rozsahu n z p-rozměrného rozložení Lp(ô). Definice statistiky: Libovolná funkce T = T(X1? Xn) náhodného výběru X1? Xn (resp. T = T(Xi,Yi, Xn,Yn) náhodného výběru (Xi,Yi), (Xn,Yn)) se nazývá (výběrová) statistika. Definice důležitých statistik: a) Nechť Xi,Xn je náhodný výběr, n > 2. 1 11 2 1 n I- Onačme M = - Yxi ... výběrový průměr, S =-T!(Xi ~M)2 ••• výběrový rozptyl, S = vS2 ... výběrová směrodatná odchylka Pro libovolné, ale pevně dané reálné číslo x je statistikou též hodnota výběrové distribuční funkce Fn(x) = -card{i;X; < x} n b) Nechť je dáno r > 2 stochasticky nezávislých náhodných výběrů o rozsazích ni > 2, ..., nr > 2. r Celkový rozsah je n = ^rij. Označme Ml5 ..., Mr výběrové průměry a Si2, ..., Sr2 výběrové rozptyly jednotlivých výběrů. Nechť Ci, ..., cr jsou reálné konstanty, aspoň jedna nenulová. ^ Eh-*/ ZjCj^j ... 1 í kombinace výběrových pri lěrů, S«2 = —-... vážený pri lěr výběrových rozptylů. j=i n"r c) Nechť (XuYi), (Xn,Yn) je náhodný výběr z dvourozměrného rozložení o rozsahu n. ^ n 1 11 1 11 1 11 Označme M, = — YX;, M2 = —Y Y; výběrové průměry, s/ =-Yfe ~ Miľ ' S22 =-T!(Yi ~ M2)2 výběrové rozptyly. 'S, 1 S12 =-yi(Xi -mi)(Yí -M2)... výběrová kovariance, ri2 = ' n-ltr '12 proSjSj ^0 SiS2 ... výběrový koeficient korelace. 0 jinak ^2 2 Upozornění: Číselné realizace statistik M, S , S, Si2, R12 odpovídají číselným charakteristikám m, s , s, Si2, r12 zavedeným v popisné statistice, ale u rozptylu, směrodatné odchylky, kovariance a koeficientu korelace je multiplikativní konstanta —í—, nikoliv —, jak tomu bylo v popisné statistice. Jak uvidíme později, uvedené číselné realizace mohou být považovány n-1 n za odhady číselných realizací náhodných veličin zavedených v počtu pravděpodobnosti. Charakteristika vlastnosti Počet pravděpodobnosti Matematická statistika Popisná statistika poloha E(X) = ]i M m variabilita D(X) = o2 S2 n-1 , -s n variabilita Vd(x) = g S n-1 v n společná variabilita C(Xi, X2) = G12 S12 n-1 S12 n těsnost vztahu r(Xi, X2) = p R12 ri2 rozložení O(x) F„(x) F(x) Příklad (výpočet realizací výběrového průměru, výběrového rozptylu a hodnot výběrové distribuční funkce): Desetkrát nezávisle na sobě byla změřena jistá konstanta li. Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru Xb X10. Vypočtěte realizaci m výběrového průměru M, realizaci s2 výběrového rozptylu S2, realizaci s výběrové směrodatné odchylky S a hodnoty výběrové distribuční funkce Fio(x). v Řešení: m :lýx ±(2 + l,8 + ... + 2,2) = 2,06y Y(x^ ntí 10 n-ltŕ n-l^tľ J 9 s = VšT = A/0,0404 =0,2011 Pro usnadnění výpočtu hodnot výběrové distribuční funkce F10(x) uspořádáme měření podle velikosti: 1,8 1,8 1,9 2 2 2,1 2,1 2,2 2,3 2,4. x < 1,8: F10(x) = 0 l,82,4:F10(x) = l Bodové a intervalové odhady parametru a parametrických funkcí Vycházíme z náhodného výběru Xi, Xn z rozložení L(S ), které závisí na parametru S . Množinu všech přípustných hodnot tohoto parametru označíme H. Tato množina se nazývá parametrický prostor. Např. je-li Xi, Xn náhodný výběr z rozložení N(fi,c2), pak ô = (^,a2) a v tomto případě parametrický prostor H = (— 00,00) x ^0,00) _ Parametr S neznáme a chceme ho odhadnout pomoci daného náhodného výběru (případně chceme odhadnout nějakou parametrickou funkci h(S)). Bodovým odhadem parametrické funkce h(S) je statistika Tn = T(Xi, Xn), která nabývá hodnot blízkých h(S ), ať je hodnota parametru S jakákoliv. Existují různé metody, jak konstruovat bodové odhady (např. metoda momentů či metoda maximální věrohodnosti, ale těmi se zde zabývat nebudeme) a také různé typy bodových odhadů. Omezíme se na odhady nestranné, asymptoticky nestranné a konzistentní. Intervalovým odhadem parametrické funkce h(S) rozumíme interval (D, H), jehož meze jsou statistiky D = D(Xi, Xn), H = H(Xi, Xn) a který s dostatečně velkou pravděpodobností pokrývá h(S), ať je hodnota parametru S jakákoliv. Typy bodových odhadů Nechť Xi, Xn je náhodný výběr z rozložení L(3), h(3) je parametrická funkce, T, Ti, T2, ... jsou statistiky. a) Řekneme, že statistika T je nestranným odhadem parametrické funkce h(3), jestliže V3eS: E(T) = h(S). (Význam nestrannosti spočívá v tom, že odhad T nesmí parametrickou funkci h( ô) systematicky nadhodnocovat ani podhodnocovat. Není-li tato podmínka splněna, jde o vychýlený odhad.) b) Jsou-li Ti, T2 nestranné odhady téže parametrické funkce h(3), pak řekneme, že Ti je lepší odhad než T2, jestliže g S: D(Ti) < D(T2). c) Posloupnost {Tn se nazývá posloupnost asymptoticky nestranných odhadů parametrické funkce h(3), jestliže VôeS:limE(Tn) = h(ô). n—>oo (Význam asymptotické nestrannosti spočívá v tom, že s rostoucím rozsahem výběru klesá vychýlení odhadu.) d) Posloupnost {Tn se nazývá posloupnost konzistentních odhadů parametrické funkce h(ô), jestliže Vô g SVe > 0: Um PÚTn - h(ô)| > e)= 0. (Význam konzistence spočívá v tom, že s rostoucím rozsahem výběru klesá pravděpodobnost, že odhad se bude realizovat „daleko" od parametrické funkce h(3).) Lze dokázat, že z nestrannosti odhadu vyplývá jeho asymptotická nestrannost a z asymptotické nestrannosti vyplývá konzistence, pokud posloupnost rozptylů odhadu konverguje k nule. Vlastnosti důležitých statistik a) Případ jednoho náhodného výběru: Nechť Xi,Xnje náhodný výběr z rozložení se střední hodnotou \i, rozptylem a2 a distribuční funkcí 2. Označme Mn výběrový průměr, Sn2 výběrový rozptyl a pro libovolné, ale pevně dané x e R označme Fn(x) hodnotu výběrové distribuční funkce. Pak pro libovolné hodnoty parametrů (i, o2 a libovolné, ale pevně dané reálné číslo x platí: E(Mn) = ju, D(Mn)=^, E(Sn2) = a2, D(Sn2) = Ii--^-Í2—^, kde y4 je 4. centrální moment, n n(n -1) E(F„(x)) = 4>(x), D(Pj(x))=ftH[i-<■>»] n Znamená to, že Mn je nestranným odhadem ji, Sn je nestranným odhadem a , pro libovolné, ale pevně dané x g R je výběrová distribuční funkce Fn(x) nestranným odhadem 2 stochasticky nezávislých náhodných výběrů: Nechť Xu,...,Xln , Xrl,...,Xm je r stochasticky nezávislých náhodných výběrů o rozsazích ni > 2, nr > 2 z rozložení se středními hodnotami \iu \iTa. rozptylem o . Celkový rozsah r je n = ^iij. Nechť Ci,cr jsou reálné konstanty, aspoň jedna nenulová. Pak pro libovolné hodnoty parametrů u-i, ..., (ir a o platí: f r 'N r E(S*2) = o2. 3=1 Znamená to, že lineární kombinace výběrových průměrů 2]cjmj Je nestranným odhadem lineární kombinace středních hod- .. Ž(»,-i)sr not z^i0)^) a vážený průměr výběrových rozptylů S*2 = —-je nestranným odhadem rozptylu o j=i n-r 2 c) Případ jednoho náhodného výběru z dvourozměrného rozložení: Nechť (Xi,Yi),(Xn,Yn) je náhodný výběr z dvourozměrného rozložení s kovariancí gí2 a koeficientem korelace p. Pak pro libovolné hodnoty parametrů Oi2a p platí: E(Si2) = Oi2, E(R12) ~ p (shoda je vyhovující pro n > 30). Znamená to, že výběrová kovariance Si2 je nestranným odhadem kovariance gí2, avšak výběrový koeficient korelace Ri2 je vychýleným odhadem koeficientu korelace p. Pojem intervalu spolehlivosti Nechť Xi,Xn je náhodný výběr z rozložení L(s), h(ô) je parametrická funkce, 1-a. b) Interval (D, qo) se nazývá 100(l-a)% levostranný interval spolehlivosti pro parametrickou funkci h(s), jestliže:vôeS:P(D 1-a. c) Interval (-00, H) se nazývá 100(l-a)% pravostranný interval spolehlivosti pro parametrickou funkci h(s), jestliže: vôeS:P(h(ô) < H) > 1-a. Číslo a se nazývá riziko (zpravidla a = 0,05, méně často 0,1 či 0,01), číslo 1 - a se nazývá spolehlivost. Postup při konstrukci intervalu spolehlivosti a) Vyjdeme ze statistiky V, která je nestranným bodovým odhadem parametrické funkce h(3). b) Najdeme tzv. pivotovou statistiku W, která vznikne transformací statistiky V, je monotónní funkcí h( ô) a přitom její rozložení je známé a na h(3) nezávisí. Pomocí známého rozložení pivotové statistiky W najdeme kvantily w^, wi-o/2, takže platí: V-S e E: P(Wo/2 < W < wi.^) > 1 - a. c) Nerovnost < W < Wi.^ převedeme ekvivalentními úpravami na nerovnost D < h(3) < H. d) Statistiky D, H nahradíme jejich číselnými realizacemi d, h a získáme tak 100(1-a)% empirický interval spolehlivosti, o němž prohlásíme, že pokrývá h(3) s pravděpodobností aspoň 1 - a. (Tvrzení, že (d,h) pokrývá h(3) s pravděpodobností aspoň 1 - a je třeba chápat takto: jestliže mnohonásobně nezávisle získáme realizace xl5xn náhodného výběru Xb Xn z rozložení L(3) a pomocí každé této realizace sestrojíme 100(l-a)% empirický interval spolehlivosti pro h(3), pak podíl počtu těch intervalů, které pokrývají h(3) k počtu všech sestrojených intervalů bude přibližně 1 - a.) Ilustrace: Jestliže lOOx nezávisle na sobě uskutečníme náhodný výběr z rozložení se střední hodnotou \i a pokaždé sestrojíme 95% empirický interval spolehlivosti pro \i, pak přibližně v 95-ti případech bude ležet parametr fi v intervalech spolehlivosti a asi v 5-ti případech interval spolehlivosti li nepokryje. Volba oboustranného, levostranného, nebo pravostranného intervalu závisí na konkrétní situaci. Např. oboustranný interval spolehlivosti použije konstruktér, kterého zajímá dolní i horní hranice pro skutečnou délku \i nějaké součástky. Levostranný interval spolehlivosti použije výkupčí drahých kovů, který potřebuje znát dolní mez pro skutečný obsah zlata \i v kupovaném slitku. Pravostranný interval spolehlivosti použije chemik, který potřebuje znát horní mez pro obsah nečistot li v analyzovaném vzorku. 2 2 Příklad: Nechť X1?Xn je náhodný výběr z rozložení N(li,o ), kde n > 2 a rozptyl o známe. Sestrojte 100(l-a)% interval spolehlivosti pro neznámou střední hodnotu u, v Řešení: V tomto případě parametrická funkce h(3) = u, Nestranným odhadem střední hodnoty je výběrový průměr M = 1 n —Tx. . Protože M je lineární kombinací normálně rozložených náhodných veličin, bude mít také normální rozložení se n i=i střední hodnotou E(M) = fi a rozptylem D(M) = —. Pivotovou statistikou W bude standardizovaná náhodná veličina n u=M-u_ ^N(0?1)_ Kvantil Wo/2 = uaJ2 = -Ui.aJ2, Wi.aJ2 = Ui.aJ2. V»gS: l-a M--^=u! a,oo a pravostranný je -oo,M + -=u!_a Vn J y Vn Dosadíme-li do vzorců pro dolní a horní mez číselnou realizaci m výběrového průměru M, dostaneme 100(l-a)% empirický interval spolehlivosti. Postup si ukážeme na následujícím numerickém příkladu. Příklad: 10 krát nezávisle na sobě byla změřena jistá konstanta \i. Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2 2 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru X1? X10 z rozložení N(li, o ), kde \i neznáme a o = 0,04. Najděte 95% empirický interval spolehlivosti pro li, a to a) oboustranný, b) levostranný, c) pravostranný. v Řešení: Vypočteme realizaci výběrového průměru: m = 2,06. Riziko a je 0,05. V tabulkách najdeme kvantil u0,975 = 1,96 pro oboustranný interval spolehlivosti a kvantil u0,95 = 1,64 pro jednostranné intervaly spolehlivosti. ad a) d = m - m.^ = 2,06 - -^L 1,96 = 1,94 Vn VlO h = m + Ui-a/2 = 2,06 + 1.96 = 2,18 V n VlO 1,94 < ji < 2,18 s pravděpodobností aspoň 0,95. ad b) d = m - m_a = 2,06 - ^= 1,64 = 1,96 Vn VlO 1,96 < fi s pravděpodobností aspoň 0,95. ad c) h = m + m_a = 2,06 + ^= 1,64 = 2,16 Vn VlO \i < 2,16 s pravděpodobností aspoň 0,95. v Šířka intervalu spolehlivosti Nechť (d, h) je 100(l-a)% empirický interval spolehlivosti pro h($) zkonstruovaný pomocí číselných realizací xi, xn náhodného výběru Xi, Xn z rozložení L($). a) Při konstantním riziku klesá šířka h-d s rostoucím rozsahem náhodného výběru. b) Při konstantním rozsahu náhodného výběru klesá šířka h-d s rostoucím rizikem. Ilustrace ad a) Grafické znázornění závislosti dolních a horních meze 95% empirických intervalů spolehlivosti pro střední hodnotu normálního rozložení při známém rozptylu na rozsahu náhodného výběru: Šířka intervalu spolehlivosti klesá se zvětšujícím se rozsahem náhodného výběru, zprvu rychle a pak stále pomaleji, ad b) Grafické znázornění závislosti dolních a horních mezí 100(l-a)% empirických intervalů spolehlivosti pro střední hodnotu normálního rozložení při známém rozptylu a konstantním rozsahu výběru na riziku: Vidíme, že šířka intervalu spolehlivosti s rostoucím rizikem klesá. Příklad: (stanovení minimálního rozsahu výběru z normálního rozložení) 2 2 Nechť Xi, Xn je náhodný výběr z N((i, o ), kde o známe. Jaký musí být minimální rozsah výběru n, aby šířka 100(l-a)% empirického intervalu spolehlivosti pro střední hodnotu \i nepřesáhla číslo A? v o- o" 2cr Řešení: Požadujeme, aby A > h - d = m + -^=Uj a/2 -(m-^u,_a/2) = -=Uj_a/2. Z této podmínky dostaneme, že Vn vn vn ^ 4a2u1_a/22 n - ~^ . Za rozsah výběru zvolíme nejmenší přirozené číslo vyhovující této podmínce. Příklad: Hloubka moře se měří přístrojem, jehož systematická chyba je nulová a náhodné chyby měření mají normální rozložení se směrodatnou odchylkou o = 1 m. Kolik měření je nutno provést, aby se hloubka stanovila s chybou nejvýše ± 0,25 m při spolehlivosti 0,95? v Řešení: Hledáme rozsah výběru tak, aby šířka 95% intervalu spolehlivosti pro střední hodnotu (i nepřesáhla 0,5 m. Přitom o 4a2Ul_a/22 4-l,962 známe. Z předešlého příkladu vyplývá, že n >---=--— = 61,4656. Nejmenší počet měření je tedy 62. Uvod do testování hypotéz Motivace: Častým úkolem statistika je na základě dat ověřit předpoklady o parametrech nebo typu rozložení, z něhož pochází náhodný výběr. Takovému předpokladu se říká nulová hypotéza. Nulová hypotéza vyjadřuje nějaký teoretický předpoklad, často skeptického rázu a uživatel ji musí stanovit předem, bez přihlédnutí k datovému souboru. Proti nulové hypotéze stavíme alternativní hypotézu, která říká, co platí, když neplatí nulová hypotéza. Alternativní hypotéza je formulována tak, aby mohla platit jenom jedna z těchto dvou hypotéz. Pravdivost alternativní hypotézy by znamenala objevení nějakých nových skutečností, nebo zásadnější změnu v dosavadních představách. Např. výzkumník by chtěl na základě dat prověřit tezi (nový objev), že pasivní kouření škodí zdraví. Jako nulovou hypotézu tedy položí tvrzení, že pasivní kouření neškodí zdraví a proti nulové hypotéze postaví alternativní, že pasivní kouření škodí zdraví. Testováním hypotéz se myslí rozhodovací postup, který je založen na daném náhodném výběru a s jehož pomocí rozhodneme o zamítnutí či nezamítnutí nulové hypotézy. Nulová a alternativní hypotéza Nechť Xi, Xn je náhodný výběr z rozložení L(3), kde parametr 3 e E neznáme. Nechť h(3) je parametrická funkce a c daná reálná konstanta. a) Oboustranná alternativa: Tvrzení H0: h(3) = c se nazývá jednoduchá nulová hypotéza. Proti nulové hypotéze postavíme složenou oboustrannou alternativní hypotézu Hi: h(3) * c. b) Levostranná alternativa: Tvrzení H0: h(3) > c se nazývá složená pravostranná nulová hypotéza. Proti jednoduché nebo složené pravostranné nulové hypotéze postavíme složenou levostrannou alternativní hypotézu Hi: h(3) < c. c) Pravostranná alternativa: Tvrzení H0: h(3) < c se nazývá složená levostranná nulová hypotéza. Proti jednoduché nebo složené levostranné nulové hypotéze postavíme složenou pravostrannou alternativní hypotézu Hi: h(3) > c. Testováním H0 proti Hi rozumíme rozhodovací postup založený na náhodném výběru Xi, Xn, s jehož pomocí zamítneme či nezamítneme platnost nulové hypotézy. Chyba 1. a 2. druhu Při testování H0 proti H! se můžeme dopustit jedné ze dvou chyb: chyba 1. druhu spočívá v tom, že H0 zamítneme, ač ve skutečnosti platí a chyba 2. druhu spočívá v tom, že H0 nezamítneme, ač ve skutečnosti neplatí. Situaci přehledně znázorňuje tabulka: skutečnost rozhodnutí H0 nezamítáme H0 zamítáme H0 platí správné rozhodnutí chyba 1. druhu H0 neplatí chyba 2. druhu správné rozhodnutí Pravděpodobnost chyby 1. druhu se značí a a nazývá se hladina významnosti testu (většinou bývá a = 0,05, méně často 0,1 či 0,01). Pravděpodobnost chyby 2. druhu se značí p\ Číslo 1-0 se nazývá síla testu a vyjadřuje pravděpodobnost, že bude H0 zamítnuta za předpokladu, že neplatí. Obvykle se snažíme, aby síla testu byla aspoň 0,8. Obě hodnoty, a i 1-0, závisí na velikosti efektu, který se snažíme detekovat. Čím drobnější efekt, tím musí být větší rozsah náhodného výběru. skutečnost rozhodnutí zdravý nemocný jsem zdravý zdravý a neléčený zdravý a léčený jsem nemocný nemocný a neléčený nemocný a léčený Testování pomocí kritického oboru Najdeme statistiku T0 = T0(X1? Xn), kterou nazveme testovým kritériem. Množina všech hodnot, jichž může testové kritérium nabýt, se rozpadá na obor nezamítnutí nulové hypotézy (značí se V) a obor zamítnutí nulové hypotézy (značí se W a nazývá se též kritický obor). Tyto dva obory jsou odděleny kritickými hodnotami (pro danou hladinu významnosti a je lze najít ve statistických tabulkách). Jestliže číselná realizace t0 testového kritéria T0 padne do kritického oboru W, pak nulovou hypotézu zamítáme na hladině významnosti a a znamená to skutečné vyvrácení testované hypotézy. Jestliže t0 padne do oboru nezamítnutí V, pak jde o pouhé mlčení, které platnost nulové hypotézy jenom připouští. Pravděpodobnosti chyb 1. a 2. druhu nyní zapíšeme takto: P(T0 g W/H0 platí) = a, P(T0 e V /Hi platí) = |3. Stanovení kritického oboru pro danou hladinu významnosti a: Označme t^ (resp. tmax) nejmenší (resp. nej větší) hodnotu testového kritéria. Kritický obor v případě oboustranné alternativy má tvar W = (tmin,Ka/2(T))^(K1_a/2(T),tmax), kde Ko^CT) a K^^CO jsou kvantily rozložení, jímž se řídí testové kritérium T0, je-li nulová hypotéza pravdivá. Kritický obor v případě levo stranně alternativy má tvar: W= (tran,Ka(T)). Kritický obor v případě pravostranné alternativy má tvar: w = (k^ctxO. Testování pomocí intervalu spolehlivosti Sestrojíme 100(l-a)% empirický interval spolehlivosti pro parametrickou funkci h(3). Pokryje-li tento interval hodnotu ( pak H0 nezamítáme na hladině významnosti a, v opačném případě H0 zamítáme na hladině významnosti a. Pro test H0 proti oboustranné alternativě sestrojíme oboustranný interval spolehlivosti. H0 Ý\em«LMuxt Pro test H0 proti levostranné alternativě sestrojíme pravostranný interval spolehlivosti. ---A ■i Ho WŕäUu'älWŕ Pro test H0 proti pravostranné alternativě sestrojíme levostranný interval spolehlivosti. Testování pomocí p-hodnoty p-hodnota udává nejnižší možnou hladinu významnosti pro zamítnutí nulové hypotézy. Je to riziko, že bude zamítnuta H0 za předpokladu, že platí (riziko planého poplachu). Jestliže p-hodnota < a, pak H0 zamítáme na hladině významnosti a, je-li p-hodnota > a, pak H0 nezamítáme na hladině významnosti a. Způsob výpočtu p-hodnoty: Pro oboustrannou alternativu p = 2 min{P(T0 < t0), P(T0 > to)}. Pro levostrannou alternativu p = P(T0 < t0). Pro pravostrannou alternativu p = P(T0 > t0). Ilustrace významu p-hodnoty pro test nulové hypotézy proti oboustranné, levostranné a pravostranné alternativě: p-hodnota p-hodnota (Zvonovitá křivka reprezentuje hustotu rozložení, kterým se řídí testové kritérium, je-li nulová hypotéza pravdivá.) p-hodnota vyjadřuje pravděpodobnost, s jakou číselné realizace xl5xn náhodného výběru Xl5Xn podporují H0, je-li pravdivá. Statistické programové systémy poskytují ve svých výstupech p-hodnotu. Její výpočet vyžaduje znalost distribuční funkce rozložení, kterým se řídí testové kritérium T0, je-li H0 pravdivá. Doporučený postup při testování hypotéz 1. Stanovíme nulovou hypotézu a alternativní hypotézu. Přitom je vhodné zvolit jako alternativní hypotézu ten předpoklad, jehož přijetí znamená závažné opatření a mělo by k němu dojít jen s malým rizikem omylu. 2. Zvolíme hladinu významnosti a. Zpravidla volíme a = 0,05, méně často 0,1 nebo 0,01. 3. Najdeme vhodné testové kritérium a na základě zjištěných dat vypočítáme jeho realizaci. 4. a) Testujeme-li pomocí kritického oboru, pak ho stanovíme. Jestliže realizace testového kritéria padla do kritického oboru, nulovou hypotézu zamítáme na hladině významnosti a a přijímáme alternativní hypotézu. V opačném případě nulovou hypotézu nezamítáme na hladině významnosti a. b) Testujeme-li pomocí intervalu spolehlivosti, vypočteme empirický 100(1-a)% interval spolehlivosti pro parametrickou funkci h(3). Pokud číslo c padne do tohoto intervalu, nulovou hypotézu nezamítáme na hladině významnosti a. V opačném případě nulovou hypotézu zamítáme na hladině významnosti a a přijímáme alternativní hypotézu. c) Testujeme-li pomocí p-hodnoty, vypočteme ji a porovnáme ji s hladinou významnosti a. Jestliže p < a, pak nulovou hypotézu zamítáme na hladině významnosti a a přijímáme alternativní hypotézu. Je-li p > a, pak nulovou hypotézu nezamítáme na hladině významnosti a. 5. Na základě rozhodnutí, které jsme učinili o nulové hypotéze, provedeme nějaké konkrétní opatření, např. seřídíme obráběcí stroj. (Při testování hypotéz musíme mít k dispozici odpovídající nástroje, nejlépe vhodný statistický software. Nemáme-li ho k dispozici, musíme znát příslušné vzorce. Dále potřebujeme statistické tabulky a kalkulačku.) Příklad: 10 x nezávisle na sobě byla změřena jistá konstanta \i. Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru X1?X10 z rozložení N(u., 0,04). Nějaká teorie tvrdí, že (i = 1,95. 1. Oboustranná alternativa Proti nulové hypotéze H0: (i = 1,95 postavíme oboustrannou alternativu Hi: [i * 1,95. Na hladině významnosti 0,05 testujte H0 proti Hi všemi třemi popsanými způsoby. v Řešení: m= ^(2+ ... + 2,2) =2,06, a2 = 0,04, n = 10, a = 0,05, c = 1,95 a) Test provedeme pomocí kritického oboru. Pro úlohy o střední hodnotě normálního rozložení při známém rozptylu používáme pivotovou statistiku U = ^ ~ N(0, 1). Vn Testové kritérium tedy bude T0 = M~c a bude mít rozložení N(0, 1), pokud je nulová hypotéza pravdivá. Vypočítáme realizaci testového kritéria: t0 = (7 Vn 2,06-1,95 0,2 =1,74. Stanovíme kritický obor: VÍČ) W = (t^K^CT))^^ a/2(T),0 = (-oo,ua/2>^(Ul_a/2,oo) = (-00,-^2)^(11^2,00) = (-Qo,-ua975)^(u0>975,oo) = (-00-1,96) u (1,96,00). Protože 1,74 g W, H0 nezamítáme na hladině významnosti 0,05. b) Test provedeme pomocí intervalu spolehlivosti. Meze 100(l-a)% empirického intervalu spolehlivosti pro střední hodnotu při známém rozptylu a2 jsou: (d, h) = (m - -^L ui-a/2, m + ui.^). Vn Vn V našem případě dostáváme: d = 2,06 - 2jĹ uo 975 = 2,06- -^£.1,96 = 1,936, Vio ' Vio h = 2,06 + u0 975 = 2,06+ 1,96 = 2,184. VIO ' vio Protože 1,95 g (1,936; 2,184), H0 nezamítáme na hladině významnosti 0,05. c) Test provedeme pomocí p-hodnoty. Protože proti nulové hypotéze stavíme oboustrannou alternativu, použijeme vzorec p = 2 min{P(T0 < t0), P(T0 > t0)} = 2 min {P(T0 < 1,74), P(T0 > 1,74)} = = 2 min { 0,05, nulovou hypotézu nezamítáme na hladině významnosti 0,05. Ilustrace významu p-hodnoty pro oboustranný test 0,45 0 40 0,35 0,30 0,25 0,20 0,15 0,10 0,05 0,00 -0,05 186 0,08 i 1.74 1,74' -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 2. Levostranná alternativa Proti nulové hypotéze H0: u, = 1,95 postavíme levostrannou alternativu Hi: (i < 1,95. Na hladině významnosti 0,05 testujte H0 proti Hi všemi třemi popsanými způsoby. v Řešení: a) Test provedeme pomocí kritického oboru. Na rozdíl od oboustranné alternativy bude mít kritický obor tvar W = (- oo, ua) = (- oo, u 0 05) = (- oo-l,645). Protože 1,74 g W, H0 nezamítáme na hladině významnosti 0,05. b) Test provedeme pomocí intervalu spolehlivosti. Meze 100(l-a)% empirického pravostranného intervalu spolehlivosti pro střední hodnotu (i při známém rozptylu o2 jsou: (-oo, h) = (-oo, m + Ui_a). Vn 0 2 0 2 V našem případě dostáváme: h = 2,06 + —}= U095 = 2,06 + —j= .1,645 = 2,164. Víô ' ' Vio Protože 1,95 e (-00; 2,164), H0 nezamítáme na hladině významnosti 0,05. c) Test provedeme pomocí p-hodnoty. Protože proti nulové hypotéze stavíme levostrannou alternativu, použijeme vzorec p = P(T0 < t0) = 0(1,74) = 0,95907. Jelikož 0,95907 > 0,05, nulovou hypotézu nezamítáme na hladině významnosti 0,05. Ilustrace významu p-hodnoty pro levostranný test 3. Pravostranná alternatíva Proti nulové hypotéze H0: u. = 1,95 postavíme pravostrannou alternativu Hi: (i > 1,95. Na hladině významnosti 0,05 testujte H0 proti Hi všemi třemi popsanými způsoby. v Řešení: a) Test provedeme pomocí kritického oboru. Na rozdíl od oboustranné alternativy bude mít kritický obor tvar W= (u^,«>) = (ii0i9S,«>) = (1,645, co). Protože 1,74 e W, H0 zamítáme na hladině významnosti 0,05 ve prospěch pravostranné alternativy. b) Test provedeme pomocí intervalu spolehlivosti. Meze 100(l-a)% empirického levostranného intervalu spolehlivosti pro střední hodnotu \i při známém rozptylu o jsou: (d, oo) = (m - ui_a, oo). vn 0 2 0 2 V našem případě dostáváme: d = 2,06 - -^u095 = 2,06 - .1,645 = 1,956. V10 ' V10 Protože 1,95 £ (1,956, oo), H0 zamítáme na hladině významnosti 0,05 ve prospěch pravostranné alternativy. c) Test provedeme pomocí p-hodnoty. Protože proti nulové hypotéze stavíme pravostrannou alternativu, použijeme vzorec p = P(T0 > t0) = 1 - 0(1,74) = 1 - 0,95907 = 0,04093. Jelikož 0,04093 < 0,05, nulovou hypotézu zamítáme na hladině významnosti 0,05 ve prospěch pravostranné alternativy. Ilustrace významu p-hodnoty pro pravostranný test 0.45 0,40 0.35 0.30 0.25 0,20 0.15 0.10 0.05 0,00 0,040! 3 1,74 -0 u 5 -3,0 -2,5 -2,0 -1,5 -1,0 -0,5 0,0 0,5 1,0 1,5 2,0 2,5 3,0 Základní typy uspořádání pokusů Metody matematické statistiky často slouží k vyhodnocování výsledků pokusů. Aby mohl být pokus správně vyhodnocen, musí být dobře naplánován. Uvedeme zde nejjednodušší typy uspořádání pokusů Předpokládejme například, že sledujeme hmotnostní přírůstky selat téhož plemene při různých výkrmných dietách. a) Jednoduché pozorování: Náhodná veličina X je pozorována za týchž podmínek. Situace je charakterizována jedním náhodným výběrem Xi, Xn. Náhodně vylosujeme n selat téhož plemene, podrobíme je jediné výkrmné dietě a zjistíme u každého selete hmotnostní přírůstek. Tím dostaneme realizaci jednoho náhodného výběru. b) Dvojné pozorování: Náhodná veličina X je pozorována za dvojích různých podmínek. Existují dvě odlišná uspořádání tohoto pokusu. Dvouvýběrové porovnávání: situace je charakterizována dvěma nezávislými náhodnými výběry Xn,..., Xlni a X21,...,X2n2. Náhodně vylosujeme ni a n2 selat téhož plemene, náhodně je rozdělíme na dva soubory o ni a n2 jedincích, první podrobíme výkrmné dietě č. 1 a druhý výkrmné dietě číslo 2. Tak dostaneme realizace dvou nezávislých náhodných výběrů. ':. situace je charakterizována jedním náhodným výběrem (Xx l, X12 ),..., (Xnl, Xn2) z dvourozměrného rozložení. Přejdeme k rozdílovému náhodnému výběru Z[ = Xn - Xi2, i = 1, ..., n a tím dostaneme jednoduché pozorování. Náhodně vylosujeme n vrhů stejně starých selat téhož plemene, z každého odebereme dva sourozence a náhodně jim přiřadíme první a druhou výkrmnou dietu. Tak dostaneme realizaci jednoho dvourozměrného náhodného výběru, kde první složka odpovídá první dietě a druhá složka druhé dietě. (Párové porovnávání je efektivnější, protože skutečný rozdíl v účinnosti obou diet je překrýván pouze náhodnými vlivy při samotném krmení a trvání, kdežto vliv různých dědičných vloh, který byl losováním znárodněn, je u sourozeneckého páru selat částečně vyloučen.) c) Mnohonásobné pozorování: Náhodná veličina X je pozorována za r > 3 různých podmínek. Existují dvě odlišná uspořádání tohoto pokusu. Mnohovýběrové porovnávání: situace je charakterizována r nezávislými náhodnými výběry Xn,..., Xlni až Xrl,..., Xm . Náhodně vylosujeme n!, n2, ..., nr selat téhož plemene, náhodně je rozdělíme na r souborů o n!, n2, ..., nr jedincích, první podrobíme výkrmné dietě č. 1, druhý výkrmné dietě číslo 2 atd. až r-tý podrobíme výkrmné dietě číslo r. Tak dostaneme realizace r nezávislých náhodných výběrů. Blokové porovnávání: situace je charakterizována jedním náhodným výběrem (Xx v..., Xlr),..., (Xnl,..., Xnr) z r-rozměrného rozložení. Náhodně vylosujeme n vrhů stejně starých selat téhož plemene, z každého odebereme r sourozenců a náhodně jim přiřadíme první až r-tou výkrmnou dietu. Tak dostaneme realizaci jednoho r-rozměrného náhodného výběru, kde první složka odpovídá první dietě , druhá složka druhé dietě atd. až r-tá složka odpovídá r-té dietě. Diagnostické grafy Diagnostické grafy slouží k tomu, aby nám pomohly orientačně posoudit povahu dat a určit směr další statistické analýzy. Při zpracování dat se často předpokládá splnění určitých podmínek. V případě jednoho náhodného výběru je to především normalita (posuzujeme ji pomocí N-P plotu, Q-Q plotu, histogramu) a nepřítomnost vybočujících hodnot (odhalí je krabicový diagram). U dvou či více nezávislých náhodných výběrů sledujeme kromě normality též shodu středních hodnot nebo shodu rozptylů -homoskedasticitu (porovnáváme vzhled krabicových diagramů). V případě jednoho dvourozměrného náhodného výběru často posuzujeme dvourozměrnou normalitu dat (použijeme dvourozměrný tečkový diagram s proloženou 100(l-a)% elipsou konstantní hustoty pravděpodobnosti). Krabicový diagram Umožňuje posoudit symetrii a variabilitu datového souboru a existenci odlehlých či extrémních hodnot. Způsob konstrukce je zřejmý z obrázku: o odlehlá hodnota i - horní vnitřní hradba nebo max. hodnota horní kvartil medián JZZ dolní kvartil dolní vnitřní hradba nebo min. hodnota extrémní hodnota Odlehlá hodnota leží mezi vnějšími a vnitřními hradbami, tj. v intervalu (x0,75 + l,5q, x0,75 + 3q) či v intervalu (x0,25 - 3q, x0,25 - l,5q). Extrémní hodnota leží za vnějšími hradbami, tj. v intervalu (x0j5 + 3q, oo) či v intervalu (-00, x0,25 - 3q). Příklad U 30 domácností byl zjišťován počet členů. Počet členů 1 2 3 4 5 6 Počet domácností 2 6 4 10 5 3 Pro tyto údaje sestrojte krabicový diagram. v Řešení: Vytvoříme nový datový soubor se dvěma proměnnými Počet členů, Počet domácností a o 6 případech. Vytvoření krabicového diagramu: Grafy - 2D Grafy - Krabicové grafy. Abychom systému STATISTICA sdělili, že pracujeme s údaji, pro které známe absolutní četnosti, klikneme myší na tlačítko s obrázkem závaží. V okénku Váhy případů pro analýzu/graf zaškrtneme Status Zapnuto a zadáme Proměnná vah Počet domácností, OK. Na panelu 2D Krabicové grafy zadáme Proměnné - Závisle proměnné Počet členů, OK. Dostaneme krabicový diagram Z obrázku lze vyčíst, že medián je 4 (aspoň polovina domácností má aspoň 4 členy), dolní kvartil 2 (aspoň čtvrtina domácností má aspoň 2 členy), horní kvartil 5 (aspoň tři čtvrtiny domácností mají aspoň 5 členů), minimum 1, maximum 6. Kvarti-lová odchylka je 5-2 = 3. Datový soubor vykazuje určitou nesymetrii - medián je posunut směrem k hornímu kvartilu, soubor je tedy záporně zešikmen. Odlehlé ani extrémní hodnoty se nevyskytují. Normální pravděpodobnostní graf (N-P plot) Před popisem tohoto grafu se musíme seznámit s pojmem pořadí čísla v posloupnosti čísel: Nechť xi, ..., xn je posloupnost reálných čísel. a) Jsou-li čísla navzájem různá, pak pořadím Ri čísla Xj rozumíme počet těch čísel xi, ..., xn, která jsou menší nebo rovna číslu Xi. b) Vyskytují-li se mezi danými čísly skupinky stejných čísel, pak každé takové skupince přiřadíme průměrné pořadí. Příklad a) Jsou dána čísla 9, 4, 5, 7, 3, 1. b) Jsou dána čísla 6, 7, 7, 9, 6, 10, 8, 6, 6, 9. Stanovte pořadí těchto čísel. v Řešení ad a) usp. čísla 1 3 4 5 7 9 pořadí 1 2 3 4 5 6 adb) usp. čísla 6 6 6 6 7 7 8 9 9 10 pořadí 1 2 3 4 5 6 7 8 9 10 prům. pořadí 2,5 2,5 2,5 2,5 5,5 5,5 7 8,5 8,5 10 N-P plot umožňuje graficky posoudit, zda data pocházejí z normálního rozložení. Způsob konstrukce: na vodorovnou osu vynášíme uspořádané hodnoty xa) < ... < x(n), na svislou osu kvantily ua , kde a, = ——- , přičemž j je pořadí j-té uspořádané hodnoty (jsou-li některé hodnoty stejné, pak J 3n +1 za j bereme průměrné pořadí odpovídající takové skupince). Pocházejí-li data z normálního rozložení, pak všechny dvojice (x(j),ua ) budou ležet na přímce. Pro data z rozložení s kladnou šikmostí se dvojice (x(j),ua ) budou řadit do konvexní křivky, zatímco pro data z rozložení se zápornou šikmostí se dvojice (x(j),ua ) budou řadit do konkávni křivky. Rozložení s kladnou šikmostí Normálni rozložení Rozložení se zápornou šikmostí Histogram Histogram Histogram 1 1 MT—n—, ,-, Příklad Desetkrát nezávisle na sobě byla změřena jistá konstanta. Výsledky měření: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Pomocí normálního pravděpodobnostního grafu posuďte, zda se tato data řídí normálním rozložením. Řešení Po zapsání dat do proměnné nazvané Měření zvolíme Grafy - 2D Grafy - Normální pravděpodobnostní grafy - Proměnné Měření, OK. 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 I Pozorovaná hodnota Protože dvojice (x(j),ua ) téměř leží na přímce, lze usoudit, že data pocházejí z normálního rozložení. Kvantil-kvantilový graf (Q-Q plot) Umožňuje graficky posoudit, zda data pocházejí z nějakého známého rozložení (např. systém STATISTICA nabízí 8 typů rozložení: beta, exponenciální, Gumbelovo, gamma, log-normální, normální, Rayleighovo a Weibulovo). Pro nás je nej důležitější právě normální rozložení. Způsob konstrukce: na svislou osu vynášíme uspořádané hodnoty xa) < ... < x(n) a na vodorovnou osu kvantily Ka (X) vybraného rozložení, kde ocj =-—, přičemž racy a nacy jsou korigující faktory < 0,5, implicitně racy = 0,375 a nacy = 0,25. n + nadj (Jsou-li některé hodnoty xa) < ... < x(n) stejné, pak za j bereme průměrné pořadí odpovídající takové skupince.) Pokud vybrané rozložení závisí na nějakých parametrech, pak se tyto parametry odhadnou z dat nebo je může zadat uživatel. Body (Ka (X),x(j)j se metodou nejmenších čtverců proloží přímka. Čím méně se body odchylují od této přímky, tím je lepší soulad mezi empirickým a teoretickým rozložením. Příklad: Pro data z příkladu o měření konstanty posuďte pomocí kvantil - kvantilového grafu, zda pocházejí z normálního rozložení. v Řešení:Zvolíme Grafy - 2D Grafy - Grafy typu Q-Q - ponecháme implicitní nastavení na normální rozložení (pokud bychom chtěli změnit nastavení na jiný typ rozložení, zvolili bychom ho na záložce Detaily) - Proměnné Měření, OK. Q-QgrafMěření(1v*10c) Rozdělenr.Normální Mňřsní- 2.058+0.21 98*x 2,3 | 2,2 <5 2:1 ° 2,0 Vzhled grafu nasvědčuje tomu, že data pocházejí z normálního rozložení. Histogram Umožňuje porovnat tvar hustoty četnosti s tvarem hustoty pravděpodobnosti vybraného teoretického rozložení. (Ve STATISTICE je pojem histogramu širší, skrývá se za ním i sloupkový diagram.) Způsob konstrukce ve STATISTICE: na vodorovnou osu se vynášejí třídicí intervaly (implicitně 10, jejich počet lze změnit, stejně tak i meze třídicích intervalů) či varianty znaku a na svislou osu absolutní nebo relativní četnosti třídicích intervalů či variant. Do histogramu se může zakreslit tvar hustoty (či pravděpodobnostní funkce) vybraného teoretického rozložení. Kromě osmi typů rozložení uvedených u Q-Q plotu umožňuje STATISTICA použít ještě další čtyři rozložení: Laplaceovo, logistické, geometrické, Poissonovo. Příklad: U 70 domácností byly zjišťovány týdenní výdaje na nealkoholické nápoje (v Kč). Výdaje (35,65) (65,95) (95,125) (125,155) (155,185) (185,215) Počet dom. 7 16 27 14 4 2 Nakreslete histogram Řešení: Vytvoříme nový datový soubor s dvěma proměnnými Výdaje a Počet domácností. Do proměnné Výdaje zapíšeme středy třídicích intervalů, do proměnné Počet domácností odpovídající absolutní četnosti třídicích intervalů. V menu zvolíme Grafy - Histogramy - pomocí tlačítka s obrázkem závaží zadáme proměnnou vah Počet domácností - OK, Proměnná Výdaje - zapneme volbu Všechny hodnoty - OK. Dostaneme histogram: Histogram (2v* 6c) ■ é m Vidíme, že tvar histogramu není symetrický. Malé hodnoty jsou četnější než velké - datový soubor je kladně zešikmen. Dvourozměrný tečkový diagram Máme dvourozměrný datový soubor (xi, yi), ... , (xn, yn), který je realizací dvourozměrného náhodného výběru (Xi, Yi), ... , (Xn, Yn) z dvourozměrného rozložení. Na vodorovnou osu vyneseme hodnoty Xj, na svislou hodnoty yk a do příslušných průsečíků nakreslíme tolik teček, jaká je absolutní četnost dvojice (xJ5 yk). Jedná-li se o náhodný výběr z dvourozměrného normálního rozložení, měly by tečky zhruba rovnoměrně vyplnit vnitřek elipsovitého obrazce. Vrstevnice hustoty dvourozměrného normálního rozložení jsou totiž elipsy - viz následující obrázek. 2 2 Graf hustoty a vrstevnice dvourozměrného normálního rozložení s parametry fii = 0, \i2 = 0, Oi = 1, o2 = 1, p = -0,75: Do dvourozměrného tečkového diagramu můžeme ještě zakreslit 100(l-a)% elipsu konstantní hustoty pravděpodobnosti. Bude-li více než 100a % teček ležet vně této elipsy, svědčí to o porušení dvourozměrné normality. Bude-li mít hlavní osa elipsy kladnou resp. zápornou směrnici, znamená to, že mezi veličinami X a Y existuje určitý stupeň přímé resp. nepřímé lineární závislosti. Příklad: Máme k dispozici výsledky testů ze dvou předmětů zjištěné u osmi náhodně vybraných studentů určitého oboru Číslo studenta 1 2 3 4 5 6 7 8 Počet bodů v 1. testu 80 50 36 58 42 60 56 68 Počet bodů ve 2. testu 65 60 35 39 48 44 48 61 Pomocí dvourozměrného tečkového diagramu se zakreslenou 95% elipsou konstantní hustoty pravděpodobnosti a histogramy pro počty bodů v 1. a 2. testu posuďte, zda tato data lze považovat za realizace náhodného výběru z dvourozměrného normálního rozložení. v Řešení:Vytvoříme nový datový soubor se dvěma proměnnými Testi a Test2 a osmi případy. Nyní nakreslíme dvourozměrný tečkový diagram: Grafy - 2D Grafy - Bodové grafy s histogramy. V typu proložení pro bodový graf vypneme lineární proložení. Proměnné - X - Testi, Y - Test2 - OK. Dostaneme dvourozměrný tečkový diagram pro vektorovou proměnnou (Testi, Test2) a histogramy pro Testi a Test2. Nyní do diagramu zakreslíme 95% elipsu konstantní hustoty pravděpodobnosti: 2x klikneme na pozadí grafu a otevře se okno s názvem Vš. možnosti. Vybereme Graf: Elipsa, zvolíme Přidat novou elipsu. Po vykreslení elipsy změníme měřítko: na vodorovné ose bude minimum 0, maximum 120, na svislé ose bude minimum 0, maximum 100. (Stačí 2x kliknout na číselný popis osy a na záložce Měřítka vybrat manuální mód.) Obrázek svědčí o tom, že předpoklad dvourozměrné normality je oprávněný a že mezi počty bodů z 1. a 2. testu bude existovat určitý stupeň přímé lineární závislosti, tzn., že u studentů, kteří měli vysoký resp. nízký počet bodů v 1. testu, lze očekávat vysoký resp. nízký počet bodů ve 2. testu. Testy normality dat K ověřování normality dat slouží celá řada testů, které jsou podrobně popsány ve statistické literatuře. Zde se omezíme na dva testy, které jsou implementovány v systému STATISTICA, a to Kolmogorovův - Smirnovův test a jeho Lilieforsovu variantu a Shapirův - Wilksův test. K závěrům těchto testů však přistupujeme s určitou opatrností. Máme-li k dispozici rozsáhlejší datový soubor (orientačně n > 30) a test zamítne na obvyklé hladině významnosti 0,01 nebo 0,05 hypotézu o normalitě, i když vzhled diagnostických grafů svědčí jenom o lehkém porušení normality, nedopustíme se závažné chyby, pokud použijeme statistickou metodu založenou na normalitě dat. Kolmogorovův - Smirnovův test a jeho Lilieforsova varianta Testujeme hypotézu, která tvrdí, že náhodný výběr Xi, Xn pochází z normálního rozložení s parametry fi a o . Distribuční funkci tohoto rozložení označme
Dn(a), kde Dn(a) je tabelovaná kritická hodnota. n 2 Pro n > 30 lze Dn(a) aproximovat výrazem —ln— . v 2n a V případě, že neznáme parametry li a o normálního rozložení, musíme je odhadnout z dat (střední hodnotu odhadneme pomocí m a rozptyl pomocí s ). Tím se změní rozložení testové statistiky Dn. Příslušné modifikované kvantily byly určeny pomocí simulačních studií. V této situaci používáme Lilieforsovu variantu Kolmogorovova - Smirnovova testu. Shapirův - Wilksův test normality dat Testujeme hypotézu, která tvrdí, že náhodný výběr Xi, Xn pochází z normálního rozložení N(li, o ). Testová statistika má tvar: Žai(n)[X(n-i+l) _X(i)]2 w = ^-, Z(X;-M)2 í=i kde m = n/2 pro n sudé a m = (n-l)/2 pro n liché. Koeficienty a/n) jsou tabelovány. Na testovou statistiku W lze pohlížet jako na korelační koeficient mezi uspořádanými pozorováními a jim odpovídajícími kvantily standardizovaného normálního rozložení. V případě, že data vykazují perfektní shodu s normálním rozložením, bude mít W hodnotu 1. Hypotézu o normalitě tedy zamítneme na hladině významnosti a, když se na této hladině neprokáže korelace mezi daty a jim odpovídajícími kvantily rozložení N(0,1). Lze také říci, že S - W test je založen na zjištění, zda body v Q-Q grafu jsou významně odlišné od regresní přímky proložené těmito body. (S-W test se používá především pro výběry menších rozsahů, n < 50, ale v systému STATISTICA je implementováno jeho rozšíření i na výběry velkých rozsahů, kolem 2000.) Shapirův - Wilksův test normality dat Testujeme hypotézu, která tvrdí, že náhodný výběr Xi, Xn pochází z normálního rozložení N((i, o ). Testová statistika má tvar: Žai(n)[X(n-i+l) _X(i)]2 w = ^-, Z(X;-M)2 í=i kde m = n/2 pro n sudé a m = (n-l)/2 pro n liché. Koeficienty a/n) jsou tabelovány. Na testovou statistiku W lze pohlížet jako na korelační koeficient mezi uspořádanými pozorováními a jim odpovídajícími kvantily standardizovaného normálního rozložení. V případě, že data vykazují perfektní shodu s normálním rozložením, bude mít W hodnotu 1. Hypotézu o normalitě tedy zamítneme na hladině významnosti a, když se na této hladině neprokáže korelace mezi daty a jim odpovídajícími kvantily rozložení N(0,1). Lze také říci, že S - W test je založen na zjištění, zda body v Q-Q grafu jsou významně odlišné od regresní přímky proložené těmito body. (S-W test se používá především pro výběry menších rozsahů, n < 50, ale v systému STATISTICA je implementováno jeho rozšíření i na výběry velkých rozsahů, kolem 2000.) Příklad: Jsou dány hodnoty 10, 12, 8, 9, 16. Pomocí K- S testu a S - W testu zjistěte na hladině významnosti 0,05, zda tato data pocházejí z normálního rozložení. v Řešení: Vytvoříme nový datový soubor o jedné proměnné nazvané X a pěti případech. Do proměnné X zapíšeme uvedené hodnoty. V menu vybereme Statistika - Základní statistiky/tabulky - Tabulky četností - OK, Proměnné X - OK. Na záložce zvolíme Normalita a zaškrtneme Lilieforsův test a Shapiro - Wilksův W test - Testy normality. Proměnná Testy normality (Tabulkal) N 1 max D Lilliefors P W P X 5 0,22408 p > .2C 0,91240 0,48215 Vidíme, že testová statistika K-S testuje d = 0,22409, odpovídající Lilieforsova p-hodnota je větší než 0,2, tedy hypotézu o normalitě nezamítáme na hladině významnosti 0,05. Testová statistika S-W testuje W = 0,9124, odpovídající p-hodnota je 0,48215, tedy hypotézu o normalitě nezamítáme na hladině významnosti 0,05. Parametrické úlohy o jednom náhodném výběru z normálního rozložení Mnoho náhodných veličin, s nimiž se setkáváme ve výzkumu i praxi, se řídí normálním rozložením. Za jistých předpokladů obsažených v centrální limitní větě se dá rozložení jiných náhodných veličin aproximovat normálním rozložením. Proto je zapotřebí věnovat velkou pozornost právě náhodným výběrům z normálního rozložení. Rozložení statistik odvozených z výběrového průměru a rozptylu Nechť Xi, Xn je náhodný výběr z rozložení N((i, o ). Pak platí a) M~N(u, — ),tedyU = M-n ~ N(0, 1). n a (Pivotová statistika K slouží k řešení úloh o o , když fi neznáme.) n I^-n)2 c) ^--2--jftn). Vysvětlení ad a) Výběrový průměr M je lineární kombinace náhodných veličin s normálním rozložením, má tedy normální rozložení s parametry E(M) = \i, D(M) = o /n. Statistika U se získá standardizací M. ad b) Vhodnou úpravou výběrového rozptylu S , kde použijeme obrat Xi - M = (Xi - u) - (M - u), lze statistiku K vyjádřit jako součet kvadrátů n - 1 stochasticky nezávislých náhodných veličin se standardizovaným normálním rozložením. Tento součet se řídí rozložením % (n-1). ad c) Tato statistika je součet kvadrátů n stochasticky nezávislých náhodných veličin se standardizovaným normálním rozložením, řídí se tedy rozložením % (n). 2 2 ad d) U ~ N(0, 1), K ~ % (n-1) jsou stochasticky nezávislé, protože M a S jsou stochasticky nezávislé, tudíž statistika T U M-u. ~ t(n-l). Příklad: Hmotnost balíčku krystalového cukru baleného na automatické lince se řídí normálním rozložením se střední hodnotou 1002 g a směrodatnou odchylkou 8 g. Kontrolor náhodně vybírá 9 balíčků z jedné série a zjišťuje, zda jejich průměrná hmotnost je alespoň 999 g. Pokud ne, podnik musí zaplatit pokutu 20 000 Kč. Jaká je pravděpodobnost, že podnik bude muset zaplatit pokutu? v Řešení: X ~ N(1002, 64), m ~ N^1002,yj f P(M<999) = P M 1002 999-1002 - < - P[ U < - -j| j = oí 1 = 1-oí ^1 = 1- 0(l,125) = 1 - 0,87076 = 0,12924 Pravděpodobnost, že podnik bude platit pokutuje asi 12,9%. v Řešení pomocí systému STATISTICA: Využijeme toho, že STATISTICA pomocí funkce INormal(x;mu;sigma) umí vypočítat hodnotu distribuční funkce normálního rozložení se střední hodnotou mu a směrodatnou odchylkou sigma. Tedy p(m < 999)= 0(999), kde Oje distribuční funkce rozložení N(1002, 64/9). Otevřeme nový datový soubor o jedné proměnné a jednom případu. Dvakrát klikneme na název proměnné Proml. Do Dlouhého jména této proměnné napíšeme = INormal(999;1002;8/3). V proměnné Proml se objeví hodnota 0,130295. o 2 Vzorce pro meze 100(l-a)% empirických intervalů spolehlivosti pro \i a o a) Interval spolehlivosti pro li, když o známe (využití pivotové statistiky U) Oboustranný: (d, h) = (m - -^L Ui.^, m + -^L ui.^) vn vn Levostranný: (d, oo) = (m --^L ui_a, oo) vn Pravostranný: (-00, h) = (-00, m +-^= ui.a) Vn b) Interval spolehlivosti pro li, když o neznáme (využití pivotové statistiky T) Oboustranný: (d, h) = (m - -j= ti_a,2(n-l), m + ti^n-l)) vn Vn Levostranný: (d, 00) = (m - —j= ti.a(n-l), 00) Vn Pravostranný: (-00, h) = (-00, m + -= ti_a(n-l)) vn neznáme (využití pivotové statistiky K) Oboustranný: (d, h) = Levostranný: (d, oo) = Pravostranný: (-00, h) (n-l)s2 (n-l)s2 ^ vX2i-a/2(n-l)'x2a/2(n-l) f (n-l)s2 \1 í-a(n-l) ,00 2 "\ ■00. (n-l)s X2«(n-1) d) Interval spolehlivosti pro o , když fi známe (využití pivotové statistiky — Oboustranný: (d, h) f n n > ^(Xl-^2 ^(Xl-^2 i=l i=l Levostranný: (d, 00) X2i-a/2(n) x2«/2(n) f n i=l X í-ot(n) ,00 Pravostranný: (-00, h) ■ 00. i=l X «(n) Příklad: 10 krát nezávisle na sobě byla změřena jistá konstanta \i. Výsledky měření byly: 2 1,8 2,1 2,4 1,9 2,1 2 1,8 2,3 2,2. Tyto výsledky považujeme za číselné realizace náhodného výběru Xl5Xi0 z rozložení N(u, a2), kde parametry jr, a2 neznáme. Najděte 95% empirický interval spolehlivosti jak pro \i, tak pro a2 a to a) oboustranný, b) levostranný, c) pravostranný. Řešení: m = 2,06, s2 = 0,0404, s = 0,2011, a = 0,05, ta975(9) = 2,2622, t0,95(9) = 1,8331, XW9) = 19,023, XW9) = 2,7, X2o,95(9) = 16,919, x2o,o5(9) = 3,325 ad a) Oboustranný interval spolehlivosti pro střední hodnotu \i d = m. * t^Cn-l) = 2,06 - ^EĽ 2,2622 = 1,92 vn VlO h = m + 4- ti-o/2(n-l) = 2,06 + 2,2622 = 2,20 vn vlO 1,92 < (i < 2,20 s pravděpodobností aspoň 0,95. Oboustranný interval spolehlivosti pro rozptyl o (n-iy 9^0404 X2i-a/2(n-l) 19,023 (n-iy 9^0404 X2a/2(n-l) 2,7 0,0191 < o2 < 0,1347 s pravděpodobností aspoň 0,95. ad b) Levostranný interval spolehlivosti pro střední hodnotu li d = m - 4= ti_a(n-l) = 2,06 - 1,8331 = 1,94 Vn VlO 1,94 < fi s pravděpodobností aspoň 0,95. Levostranný interval spolehlivosti pro rozptyl o , (n-l>2 9-0,0404 d = —j1—r =-= 0,0215 X2i-a(n-l) 16,919 o > 0,0215 s pravděpodobností aspoň 0,95. ad c) Pravostranný interval spolehlivosti pro střední hodnotu li h = m + 4- ti_a(n-l) = 2,06 + 1,8331 = 2,18 Vn V10 ji < 2,18 s pravděpodobností aspoň 0,95. Pravostranný interval spolehlivosti pro rozptyl o h=(n-lV 9-0.0404 r»(n-l) 3,325 o < 0,1094 s pravděpodobností aspoň 0,95. Řešení pomocí systému STATISTICA: Vytvoříme nový datový soubor o jedné proměnné X a 10 případech. Do proměnné X napíšeme dané hodnoty. Statistika - Základní statistiky a tabulky - Popisné statistiky - OK - Proměnné X - OK - Detailní výsledky - zaškrtneme Meze spolehl, prům. a Meze sp. směr. odch. (ostatní volby zrušíme) - pro oboustranný 95% interval spolehlivosti ponecháme implicitní hodnotu pro Interval 95,00, pro jednostranné intervaly změníme hodnotu na 90,00. Výsledky pro oboustranné 95% intervaly spolehlivosti pro střední hodnotu \i, pro směrodatnou odchylku o a rozptyl o : Proměnná Int. spolehl. -95,000% Int. spolehl. 95,000 Spolehlivost Srn.Odch. -95,000% Spolehlivost Srn.Odch. +95,000% NProml =v3A2 NProm2 =v4A2 X 1,91613i 2,20386. 0,13832! 0,36714: 0,01913: 0,13479! Vidíme, že 1,92 < ji < 2,20 s pravděpodobností aspoň 0,95, 0,1383 < o < 0,3671 s pravděpodobností aspoň 0,95. 0,0191 < o2 < 0,1348 s pravděpodobností aspoň 0,95. Výsledky pro jednostranné 95% intervaly spolehlivosti pro střední hodnotu li, pro směrodatnou odchylku o a rozptyl o : Proměnná Int. spolehl. -90,000% Int. spolehl. 90,000 Spolehlivost Sm.Odch. -90,000% Spolehlivost Sm.Odch. +90,000% NProml =v3A2 NProm2 =v4A2 X 1,94342 2,17657! 0,146671 0,33086; 0,02151. 0,1094" Vidíme, že (i > 1,94 s pravděpodobností aspoň 0,95, (i < 2,20 s pravděpodobností aspoň 0,95, o > 0,1467 s pravděpodobností aspoň 0,95, o < 0,3309 s pravděpodobností aspoň 0,95, o > 0,0215 s pravděpodobností aspoň 0,95, o < 0,1095 s pravděpodobností aspoň 0,95, Jednotlivé typy testů pro parametry normálního rozložení 2 2 a) Nechť Xi,Xn je náhodný výběr N(li, o ), kde o známe. Nechť n > 2 a c je konstanta. Test H0: \i = c proti Hi: li * c se nazývá jednovýběrový z-test. 2 2 b) Nechť Xi,Xn je náhodný výběr N(li, o ), kde o neznáme. Nechť n > 2 a c je konstanta. Test H0: \i = c proti Hi: li ^ c se nazývá jednovýběrový t-test. 2 2 2 c) Nechť Xi,Xn je náhodný výběr N((x, o ), kde li neznáme. Nechť n > 2 a c je konstanta. Test H0: o = c proti o ^ c se nazývá test o rozptylu. Provedení testů o parametrech li, o2 pomocí kritického oboru a) Provedení jedno výběrového z-testu m-c Vypočteme realizaci testového kritéria *o ~ ~ . Stanovíme kritický obor W. Pokud t0 e W, H0 zamítáme na hladině Vň významnosti a a přijímáme Hi. Oboustranný test: Testujeme H0: Li = cprotiHi: li ^c. Kritický obor má tvar: W = (-00,-u1_a/2)> c. Kritický obor má tvar: W = (u^, oo). b) Provedení j ednovýběrového t-testu m-c Vypočteme realizaci testového kritéria *o _ ~ . Stanovíme kritický obor W. Pokud t0 e W, H0 zamítáme na hladině Vň významnosti a a přijímáme Hi. Oboustranný test: Testujeme H0: [i = c proti Hi: fi ^ c. Kritický obor má tvar: W = (- oo,-(n -1)) (t^^(n -1),oo). Levostranný test: Testujeme H0: [i = c proti Hi: fi < c. Kritický obor má tvar: W = (- oo, - tj_a (n -1)). Pravostranný test: Testujeme H0: \i = c proti fi > c. Kritický obor má tvar: W = (^.„(n - l),°o). c) Provedení testu o rozptylu _(n-l>2 Vypočteme realizaci testového kritéria t0--. Stanovíme kritický obor W. Pokud t0 e W, H0 zamítáme na hladine C významnosti a a přijímáme Hi. Oboustranný test: Testujeme H0: a2 = c proti Hi: a2^ c. Kritický obor má tvar:. W = (O, x2a/2 (n -1)) u (x2i-a/2 (n -1), oo) Levostranný test: Testujeme H0: a2 = c proti Hi: o2 < c. Kritický obor má tvar: W = ^0,x2a(n -l)^. Pravostranný test: Testujeme H0: a2 = c proti a2 > c. Kritický obor má tvar: W = (x2i-a (n -1), °°). Příklad: Podle údajů na obalu čokolády by její čistá hmotnost měla být 125 g. Výrobce dostal několik stížností od kupujících, ve kterých tvrdili, že hmotnost čokolád je nižší než deklarovaných 125 g. Z tohoto důvodu oddělení kontroly náhodně vybralo 50 čokolád a zjistilo, že jejich průměrná hmotnost je 122 g a směrodatná odchylka 8,6 g. Za předpokladu, že hmotnost čokolád se řídí normálním rozložením, můžeme na hladině významnosti 0,01 považovat stížnosti kupujících za oprávněné? v 2 Řešení: Xi, X50 je náhodný výběr z N(li, o ). Testujeme hypotézu H0: (i = 125 proti levostranné alternativě Hi: li < 125. Protože neznáme rozptyl o , použijeme jednovýběrový t-test. m-c _ 122-125 _ Testové kritérium - - - -2,4667 Kritický obor W = (- oo, -1^ (n -1)) = (-«>,-10 99(49)) = (-«>,- 2,4049). Jelikož testové kritérium se realizuje v kritickém oboru, zamítáme nulovou hypotézu na hladině významnosti 0,01. Stížnosti kupujících tedy lze považovat za oprávněné. Výpočet pomocí systému STATISTICA: Statistiky - Základní statistiky a tabulky - Testy rozdílů: r, %, průměry - OK - vybereme Rozdíl mezi dvěma průměry (normální rozdělení) - zaškrtneme Výběrový průměr vs. Střední hodnota a zvolíme jednostr. - do políčka Prl napíšeme 122, do políčka SmOdl napíšeme 8,6, do políčka NI napíšeme 50, do políčka Pr2 napíšeme 125 - Výpočet. Dostaneme p-hodnotu 0,0086, tedy zamítáme nulovou hypotézu na hladině významnosti 0,01 Náhodný výběr z dvourozměrného rozložení Nechť ÍX1] f x ^ n ? • • • ? Y V n y je náhodný výběr z dvourozměrného rozložení, přičemž n > 2. Označíme fi = fii - fi2 a zavedeme rozdílový náhodný výběr Zi = Xi - Yi, ..., Zn = Xn-Yn, o němž předpokládáme, že se řídí normálním rozložením. Vypočteme M = - j^zi, S2 = -J](zi "M)2 • i=l i=l Vzorec pro meze 100(l-a)% empirického intervalu spolehlivosti pro střední hodnotu rozdílového náhodného výběru Oboustranný: (d, h) = (m - -)L ti-^Oi-l), m + ti.a/2(n-l)) vn vn Levostranný: (d, oo) = (m - -= ti_a(n-l), oo) Vn Pravostranný: (-00, h) = (-00, m + —= ti.a(n-l)) vn Příklad: Dvěma rozdílnými laboratorními metodami se zjišťoval obsah chemické látky v roztoku (v procentech). Bylo vybráno 5 vzorků a proměřeno oběma metodami. Výsledky měření jsou obsaženy v tabulce: číslo vzorku 1 2 3 4 5 1. metoda 2,3 1,9 2,1 2,4 2,6 2. metoda 2,4 2,0 2,0 2,3 2,5 Za předpokladu, že data mají normální rozložení, sestrojte 90% empirický interval spolehlivosti pro rozdíl středních hodnot výsledků obou metod. v Řešení: Přejdeme k rozdílovému náhodnému výběru, jehož realizace jsou:-0,1 -0,1 0,1 0,1 0,1. Vypočteme m = 0,02, s =0,012, s = 0,109545. Předpokládáme, že tato data pocházejí z normálního rozložení N((i, o ). Vypočteme meze 90% oboustranného intervalu spolehlivosti pro fi při neznámém o: s / v nM 0,109545 ... 0,109545 ..... d = m —= t t_a, 2 (n -1) = 0,02 ——=— 10 95 (4) = 0,02 ——=— 2,1318 = -0,0844 Vn V 5 ' V5 h = m + -)L tt_a/2 (n -1) = 0,02 + °^45 tQ 95(4) = 0,02 + Q,1Q^.545 2,1318 = 0,1244 Vn V5 ' -v/5 -0,0844 < fi < 0,1244 s pravděpodobností aspoň 0,9. Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor o 3 proměnných a 5 případech. Do 1. proměnné X napíšeme hodnoty pro 1. metodu, do 2. proměnné Y hodnoty pro 2. metodu a do 3. proměnné Z rozdíly mezi X a Y. Statistiky - Základní statistiky a tabulky - Popisné statistiky, OK - Proměnné Z, Detailní výsledky - zaškrtneme Meze spolehl. Prům. - Interval 90% - Výpočet. Dostaneme tabulku: Proměnná Popisné statistiky (chemická latkj Int. spolehl. 1 Int. spolehl. -90,000% 90,000 Z -0,08443: 0,12443: Vidíme tedy, že -0,0844 < fi < 0,1244 s pravděpodobností aspoň 0,9. Párový t-test Nechť f x } n Y V n y je náhodný výběr z rozložení N: (fu \ f- 2 VCT12 a2 J J , přičemž n > 2. Testujeme H0: lxi - (x2 = c (tj. jx = c) proti Hi: (Xi - \i2 í c (tj. jx^ c) nebo testujeme nulovou hypotézu proti jedné z jednostranných alternativ. Tento test se nazývá párový t-test. Provedení párového t-testu Vypočteme realizaci testového kritéria t0 významnosti a a přijímáme Hi. m-c s Vn . Stanovíme kritický obor W. Pokud t0 e W, H0 zamítáme na hladině Oboustranný test: Testujeme H0: (x = c proti Hi: (x ^c. Kritický obor má tvar: W = (-oo,-t1^x/2(n-l))u(t1^x/2(n-l),oo). Levostranný test: Testujeme H0: (x = c proti Hi: (x < c. Kritický obor má tvar: W = (-oo,-tj a(n-l)). Pravostranný test: Testujeme H0: (x = c proti Hi: lx > c. Kritický obor má tvar: W = (t1_a(n-l),oo). Příklad: V následující tabulce jsou údaje o výnosnosti dosažené 12 náhodně vybranými firmami při investování do mezinárodního podnikání (veličina X) a do domácího podnikání (veličina Y): č. firmy 1 2 3 4 5 6 7 8 9 10 11 12 X 10 12 14 12 12 17 9 15 9 11 7 15 Y 11 14 15 11 13 16 10 13 11 17 9 19 (Výnosnost je vyjádřena v procentech a představuje podíl na zisku vložených investic za rok.) Za předpokladu, že data pocházejí z dvourozměrného rozložení a jejich rozdíl se řídí normálním rozložením, na hladině významnosti 0,1 testujte hypotézu, že neexistuje rozdíl mezi střední hodnotou výnosnosti investic do mezinárodního a domácího podnikání proti oboustranné alternativě. Testování proveďte a) pomocí intervalu spolehlivosti, b) pomocí kritického oboru. (Pro úsporu času známe realizace výběrového průměru m = -1,3 a výběrového rozptylu s2 = 4,78 rozdílového náhodného výběru Z; = X; - Yi; i = 1, 12.) v Řešení: Testujeme H0: \i = 0 proti H4: (i ^ 0 ad a) 90% interval spolehlivosti pro střední hodnotu \i při neznámém rozptylu o má meze: d = m —^= t0 95(n -1) = -1,3 - ^2-1,7959 = -2,4677 Vn ' V12 h = m + 4= 10 95 (n -1) = -1,3 + Ě]*. 1,7959 = -0,1989 Vn ' V12 Protože číslo c = 0 neleží v intervalu (-2,4677; -0,1989), H0 zamítáme na hladině významnosti 0,1. m c 13 ad b) Vypočítáme realizaci testové statistiky t0 =-= = -2,11085 -1_ V4,78 ^ VÍ2 Stanovíme kritický obor W = (-oo,-t095(ll))^(t095(ll),oo)=(-oo,-i,7959)^(l,7959,oo) Protože testová statistika se realizuje v kritickém oboru, H0 zamítáme na hladině významnosti 0,1. Výpočet pomocí systému STATISTICA: Vytvoříme nový datový soubor o 2 proměnných a 12 případech. Do 1. proměnné X napíšeme hodnoty pro mezinárodní podnikání, do 2. proměnné hodnoty pro domácí podnikání. Statistiky - Základní statistiky a tabulky - t-test pro závislé vzorky, OK - Proměnné X, Y - OK - Výpočet. Dostaneme tabulku: Proměnná t-test pro závislé vzorky (investováni) Označ, rozdíly jsou významné na hlad. p < ,05000 Průměr ISm.odch. N Rozdíl Sm.odch. rozdílu t sv P X 11,91 66 I 2,93748i Y 13,2500i 3,04884: 12 -1,3333: 2,18812; -2,1108! 11 0,05849i Vypočtenou p-hodnotu 0,05849 porovnáme se zvolenou hladinou významnosti a = 0,1. Protože p < a, zamítáme nulovou hypotézu na hladině významnosti 0,1. Úlohy o parametru ô alternativního rozložení S náhodným výběrem rozsahu n z alternativního rozložení se setkáváme v situaci, kdy provádíme n opakovaných nezávislých pokusů a v každém z těchto pokusů sledujeme nastoupení úspěchu. Pravděpodobnost úspěchu je pro všechny pokusy stejná. Náhodná veličina Xt nabude hodnoty 1, pokud v i-tém pokusu nastal úspěch a hodnoty 0, pokud v i-tém pokusu úspěch nenastal, i = 1, 2, ..., n. Realizací náhodného výběru X1; ..., Xn je tedy posloupnost 0 a 1. Opakování: Alternativní rozložení: Náhodná veličina X udává počet úspěchů v jednom pokusu, přičemž pravděpodobnost úspěchu je S. Píšeme X~ A( ô). Binomické rozložení: Náhodná veličina X udává počet úspěchů v posloupnosti n nezávislých opakovaných pokusů, přičemž pravděpodobnost úspěchu je v každém pokusu ô. Píšeme X ~ Bi(n,3). r Í9x(l-Ô)n"x prox = 0,...,n 7l(x)= lxJ 0 jinak E(X) = n3,D(X) = n3 (1-3) (Alternativní rozložení je speciálním případem binomického rozložení pro n = 1. n Jsou-li Xi, Xn stochasticky nezávislé náhodné veličiny, Xi ~ A(3), i = 1, n, pak X = ~ Bi(n, 3).) Centrální limitní věta: Jsou-li náhodné veličiny Xi, ..., Xn stochasticky nezávislé a všechny mají stejné rozložení se střední hodnotou \i a rozptylem 2 n 2 o , pak pro velká n (n > 30) lze rozložení součtu aproximovat normálním rozložením N(nfi, no ). Zkráceně píšeme i=l VX. -nu n , v n i r ^X; « N(n(i,nc2). Pokud součet Y^X; standardizujeme, tj. vytvoříme náhodnou veličinu Un = ——j=—, pak rozložení této í=i i=i cWn náhodné veličiny lze aproximovat standardizovaným normálním rozložením. Zkráceně píšeme Un ~ N(0,1) Věta: Asymptotické rozložení statistiky odvozené z výběrového průměru. Nechť Xi, Xn je náhodný výběr z rozložení A(3) a nechť je splněna podmínka n$(l -§)> 9. Pak statistika U M a konverguje v distribuci k náhodné veličině se standardizovaným normálním rozložením. (Říkáme, že U má asymptoticky rozložení N(0,1) a píšeme U ~ N(0,1).) Důkaz: n Protože Xi, Xn je náhodný výběr z rozložení A(3), bude mít statistika Yn = ^Xt (výběrový úhrn) rozložení Bi(n, ô). Yn i=l má střední hodnotu E(Yn) = n9 a rozptyl D(Yn) = n$(l-$). Podle centrální limitní věty se standardizovaná statistika Y — nS U = . " , asymptoticky řídí standardizovaným normálním rozložením N(0,1). Pokud čitatele i jmenovatele podělíme n, ^/nô(l — ô) n M — 9* dostaneme vyjádření: U = , n, = /=' = , . «N(o,l) nS(l-S) S(l-S) S(l-S) Věta: Vzorec pro meze 100(l-a)% asymptotického empirického intervalu spolehlivosti pro parametr ô Meze 100(l-a)% asymptotického empirického intervalu spolehlivosti pro parametr ô jsou: d = m Důkaz: I m(l - m) Ul-a/2>h = m + m(l - m) ll-a/2 ' Pokud rozptyl d(m)=^ ^ nahradíme odhadem M^ M^, konvergence náhodné veličiny U k veličině s rozložením N(0,1) se neporuší. Tedy V&eE:l-a

9: parametr d neznáme, musíme ho nahradit výběrovým průměrem. Pak 100.0,34.0,66 = 22,44 > 9. d = 0,34- /Q34(l-Q34) = = 1034(1-0,34) = v 100 v 100 S pravděpodobností přibližně 0,95 tedy 0,2472 < $ < 0,4328. Znamená to, že s pravděpodobností přibližně 95% je v uvažované populaci nejméně 24,7% a nejvíce 43,3% osob, které nakupují v internetových obchodech. Výpočet pomocí systému STATISTIC A: a) Přesný způsob Otevřeme nový datový soubor se dvěma proměnnými a jednom případu. První proměnnou nazveme d a do jejího Dlouhého jména napíšeme =0,34-sqrt(0,34*0,66/100)*VNormal(0,975;0;l) Druhou proměnnou nazveme h a do jejího Dlouhého jména napíšeme =0,34+sqrt(0,34*0,66/100)*VNormal(0,975;0;l) Dostaneme výsledek:_ d 2 h 1 0,24715: 0,43284: Vidíme, že s pravděpodobností aspoň 0,95 se pravděpodobnost nákupu v inetrnetových obchodech bude pohybovat v mezích 0,2471 až 0,4328. b) Přibližný způsob, použitelný pro dostatečně velký rozsah výběru Do nového datového souboru o jedné proměnné X a 100 případech uložíme 34 jedniček (nakupování v internetových obchodech) a 66 nul. Statistika - Základní statistiky a tabulky - Popisné statistiky - OK - Proměnné X - OK - Detailní výsledky - zaškrtneme Meze spolehl, prům. - ponecháme implicitní hodnotu pro Interval 95,00 - Výpočet. Dostaneme tabulku: Proměnná Popisné sta istiky (Tabulka3) N platných Průměr I I Int. spolehl. I Int. spolehl. -95,000% 95,000 X 10C 0,34000l| 0,24553: 0,43446: Dospěli jsme k výsledku, že s pravděpodobností aspoň 0,95 se pravděpodobnost nákupu v inetrnetových obchodech bude pohybovat v mezích 0,2455 až 0,4345. Testování hypotézy o parametru ô Nechť Xi, ..., Xn j e náhodný výběr z rozložení A( ô) a nechť j e splněna podmínka n3(l - a) > 9. Na asymptotické hladině významnosti a testujeme hypotézu H0: ô = c proti alternativě Hi: 3 ^ c (resp. Hi: ô < c resp. Hi: ô > c). Testovým kritériem je statistika T0 = M c -, která v případě platnosti nulové hypotézy má asymptoticky rozložení N(0,1). c(l-c) V n Kritický obor má tvar W = (-oo,-Ul a/2)^(Ul a/2,oo) (resp. w = (-oo,-Ul a) resp. W = (Ul a,oo)). (Testování hypotézy o parametru ô lze samozřejmě provést i pomocí 100(1-a)% asymptotického intervalu spolehlivosti nebo pomocí p-hodnoty.) Příklad: Podíl zmetků při výrobě určité součástky činí & = 0,01. Bylo náhodně vybráno 1000 výrobků a zjistilo se, že mezi nimi je 16 zmetků. Na asymptotické hladině významnosti 0,05 testujte hypotézu H0: ô = 0,01 proti oboustranné alternativě Hi: ô ^0,01. Řešení: Zavedeme náhodné veličiny Xi, Xiooo, přičemž X; = 1, když i-tý výrobek byl zmetek a X = 0 jinak, i = 1, 1000. Tyto náhodné veličiny tvoří náhodný výběr z rozložení A(S<). Testujeme hypotézu H0: & = 0,01 proti alternativě Hi: & ^ 0,01. Známe: n = 1000, m = 7~~~ = 0,016 , c = 0,01, a = 0,05, ui-a/2 = u0,975 = 1,96 Ověření podmínky nd(l-»)> 9 : 1000.0,01.0,99 = 9,9 > 9. a) Testování pomocí kritického oboru: Realizace testového kritéria: ,0 = -7J^ = ^=££ = 1.907. c-(l-c) 0,01-0,99 v n v 1000 Kritický obor: W = (-°°,-u0975) lj(u0975,oo)= (-oo,-l,96)o>(l,96,oo). Protože 1,907 € W, H0 nezamítáme na asymptotické hladině významnosti 0,05. b) Testování pomocí intervalu spolehlivosti m(l-m) 0,016 • 0,984 in<; v—ň—u' ~a'2 = ~ v—ÍÔÔÔ— = m(l-m) nni, 0,016-0,9841 n, nn„Q h = m + J—--u, = 0,016+ J—---1,96 = 0,0238 v n l~a/2 v 1000 Protože číslo c = 0,01 leží v intervalu 0,0082 až 0,0238, H0 nezamítáme na asymptotické hladině významnosti 0,05. c) Testování pomocí p-hodnoty Protože testujeme nulovou hypotézu proti oboustranné alternativě, vypočteme p-hodnotu podle vzorce: p = 2 min{ 0(1,907), 1-0(1,907) } = 2 min { 0,97104, 1 - 0,97104 } = 0,05792. Protože vypočtená p-hodnota je větší než hladina významnosti 0,05, H0 nezamítáme na asymptotické hladině významnosti 0,05. Výpočet pomocí systému STATISTICA (pouze přibližný): Statistiky - Základní statistiky a tabulky - Testy rozdílů: r, %, průměry - OK - vybereme Rozdíl mezi dvěma poměry - do políčka P 1 napíšeme 0,016, do políčka NI napíšeme 1000, do políčka P 2 napíšeme 0,01, do políčka N2 napíšeme 32767 (větší hodnotu systém neumožní) - Výpočet. Dostaneme p-hodnotu 0,0626, tedy nezamítáme nulovou hypotézu na hladině významnosti 0,05. Testy rozdílů: r, %, průměry: Tabulka3 I Poslat/tisknout výsledky každ. výpočtu do okna protokolu ■Rozdíl mezi dvěma korelačními koeficienty— rl: r2: 0,00 0,00 N1: N 2: 10 I 10 p: 1,0000 C Jednostr. í* Oboustr. ?l-|x| Storno Výpočet - Rozdíl mezi dvěma průměry (normální rozdělení) ~~ ^SmOdl ^ N1:|10 f|] p: 1,0000 Pr2: [Ô gSm0d2:fT g N2J10 g C Jednostr. i j/L ľ____y. ___■>.__y ____ __i._y i___i___l_ ^* Výpočet |~~ Výběrový průměr vs. střední hodnota □ boustr. -Rozdíl mezi dvěma poměry - Pí: |,01600 g N1:|1000 g P 2: |,01000 g N2:132767 g p: ,0626 C" Jednostr. (* Oboustr. Vypočet "| Parametrické úlohy o dvou nezávislých náhodných výběrech z normálních rozložení Motivace: V této situaci je naším úkolem porovnat střední hodnoty či rozptyly dvou normálních rozložení na základě znalosti dvou nezávislých náhodných výberu pořízených z těchto rozložení. Zpravidla konstruujeme intervaly spolehlivosti pro rozdíl středních hodnot respektive hodnotíme shodu středních hodnot pomocí dvouvýběrového t-testu či dvouvýběrového z-testu a shodu rozptylů pomocí F-testu. Rozložení statistik odvozených z výběrových průměrů a výběrových rozptylů Máme dva nezávislé náhodné výběry, první pochází z rozložení N(ui, oi2) a má rozsah m > 2, druhý pochází z rozložení N(u2, 022) a má rozsah n2 > 2. Označme Mi, M2 výběrové průměry, Si2, S22 výběrové rozptyly aS„ = —■-■---— vážený průměr výběrových rozptylů. ni +n2 "2 Pak platí: s « • w o 2 (n,-1)S,2 +(n,-1)S,2 . , ., , .,, a) Statistiky Mi - M2 a S* = —------— jsou stochasticky nezávisle. nj + n2 - 2 b) U = —^2) ^2) _ N(0, 1). (Pivotová statistika U slouží k řešení úloh o ui- U2, když oi2 a G22známe.) ni n2 2 2 2 (^"1 2 2 c) Nechť 01 = 02 =: o , pak K =----% (ni + n2 - 2). (Pivotová statistika K slouží k řešení úloh o neznámém rozptylu o .) g d) Jestliže oi2 = 022 =: o2, pak T = ^—!—^2) t-0 + n2_ 2). (Pivotová statistika T slouží k řešení úloh o ui- U2, když oi2 a G22 sj—+ — neznáme, ale víme, že jsou shodné.) S 2 /S 2 e) F = —2—~ F(ni - 1, n2 - 1). (Pivotová statistika F slouží k řešení úloh o oi2/ g22.) ol /g2 Vysvětlení: ad b) M1-M2 je lineární kombinace náhodných veličin s normálním rozložením, má tedy normální rozložení s parametry E(Mi-M2) = ui- M-2, D(Mi-M2) = ai 2/n:+ o2 2/n2 U se získá standardizací Mi-M2. ad c) Ki = ——j—^— x2(ni_l) a K2 = ——j-^— x2(n2-l) jsou stochasticky nezávislé náhodné veličiny, tedy K = Ki+K2 a a X2(m + n2 - 2). (Mt-Mj-fct-m) (ni+n2-2)S,2 ad d) U = /—;-j- ~ N(0, 1), K =-2-~ % (ni + n2 - 2) jsou stochasticky nezávislé, protože Mi - a a a ■ + — , -i 1 T- (Mi-M2)-fri-lO , M2 a S* jsou stochasticky nezávisle. 1 ~ j-—-~ -— ~ t(ni + n2- 2). S.J—+ ■ n1 + n2 - 2 A| nx n2 (rM-DS,2 (n2-l)S22 ad e) Ki = 2 ~ X (ni_i) a K2 = 2 ~ X (n2-l) jsou stochasticky nezávislé náhodné veličiny, tedy Příklad: Nechť jsou dány dva nezávislé náhodné výběry, první pochází z rozložení N(0,28; 0,09) a má rozsah 16, druhý pochází z rozložení N(0,25; 0,04) a má rozsah 25. Jaká je pravděpodobnost, že výběrový průměr 1. výběru bude větší než výběrový průměr 2. výběru? Řešení: r \ p(m, >m2)=p(m, -m2 >o)=i-p(m, -m2 (-0,35) = 0(0,35) = 0,63683 S pravděpodobností přibližně 63,7% je výběrový průměr 1. výběru větší než výběrový průměr 2. výběru. Výpočet pomocí systému STATISTICA: 2 2 Statistika M, - M2 se podle bodu (a) řídí rozložením N(|Xi - |x2,--1--), kde n, - H2 = 0,28 - 0,25 = 0,03. — + - 0,09 0,04 n ^nnc : — + —= 0,007225, tj. statistika M, - M2 ~ N(0,03 ;0,007225). n, n2 Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do Dlouhého jména této proměnné napíšeme = 1 -INormal(0;0,03; sqrt(0,007225)). V proměnné Proml se objeví hodnota 0,637934. 2 2 Intervaly spolehlivosti pro parametrické funkce ui-fi2, oi /o2 Uvedeme přehled vzorců pro meze 100(l-a)% empirických intervalů spolehlivosti pro parametrické funkce ui - (i2 , 01 / o2 . 2 2 a) Interval spolehlivosti pro Ui-(i2, když cu , a2 známe (využití pivotové statistiky U) Oboustranný: (d, h) = (mi - m2 - p~ + ^- ui-o/2, mi - m2 + M- + -2- ui_o/2) V ni n2 V ni n2 12 2 Levostranný: (d, 00) = (nu - m2 - I— + —2- ui_a, 00) V ni n2 2 2 Pravostranný: (-00, h) = (-oo,mi - m2 + M- + —2- ui_a) ni n2 b) Interval spolehlivosti pro ui-u-2, když ci2 o22 neznáme, ale víme, že jsou shodné (využití pivotové statistiky T) Oboustranný: (d, h) = (nu - m2 -s. J— + — ti.a/2(ni+n2-2), nu - m2 + s J—+ — ti_o/2(ni+n2-2)) Vn, n, Vn, n9 Levostranný: (d, 00) = (nu - m2 -s. I— + — ti.a(ni+n2-2), 00) Pravostranný: (-00, h) = (-00, nu - m2 + s* í— + — ti_a(ni+n2-2)) n, n. c) Interval spolehlivosti pro společný neznámý rozptyl o (využití pivotové statistiky K) Oboustranný: (d, h) = Levostranný: (d, oo) = ^ (n1+n2-2)s*2 (n1+n2-2)s*2 ^ vX2i-a/2(n1 +n2 -2) x2cc/2(n1 +n2 -2) ^ (rij +n2 -2)s*2 X í-aK +n2 -2) .00 Pravostranný: (-oo, h) = J 2 "\ -00, (rij +n2 -2)s* X2a(n! +n2 -2) d) Interval spolehlivosti pro podíl rozptylů (využití pivotové statistiky F) Oboustranný: (d, h) Levostranný: (d, oo) = 2 / 2 Sj /s2 2 / 2 Sj /s2 Fl-a/2 (nl - L n2 - 1) Fa/2 (nl ~ L n2 ~ 1) 2 , 2 Si /s2 Fl-a(ni -!'n2 "D .oo Pravostranný: (-00, h) = ■ 00. 2,2 ^ Fa(ni "l.n2 -1) Upozornění: Není-li v bodě (b) splněn předpoklad o shodě rozptylů, lze sestrojit aspoň přibližný 100(l-a)% interval spolehlivosti pro U4-U2. ' 2 (s 2 / n + s 2 / n ) V tomto případě má statistika T přibližně rozložení t( v), kde počet stupňů volnosti v = —^--—--^ (sl2/Hl)2 , (s22/n2)2 rij-1 n2-l Není-li v celé číslo, použijeme v tabulkách kvantilů Studentova rozložení lineární interpolaci. Příklad: Ve dvou nádržích se zkoumal obsah chlóru (v g/l). Z první nádrže bylo odebráno 25 vzorků, z druhé nádrže 10 2 2 vzorků. Byly vypočteny realizace výběrových průměrů a rozptylů: mi = 34,48, m2 = 35,59, Si = 1,7482, s2 = 1,7121. Hodnoty zjištěné z odebraných vzorků považujeme za realizace dvou nezávislých náhodných výběrů z rozložení N(ui, o2) a N(jx2, a2). Sestrojte 95% empirický interval spolehlivosti pro rozdíl středních hodnot ui - jx2. v Řešení: Úloha vede na vzorec z bodu (b). Vypočteme vážený průměr výběrových rozptylů a najdeme odpovídající kvantily Studentova rozložení: s>J = (n,-W+(n2-l)s/ _ 24.1,7482 + 9.1,7121 = ^_ |^) _ ^ lij +n2 —2 33 Dosadíme do vzorců pro dolní a horní mez intervalu spolehlivosti: d = mi-m2-s* I— + — ti.a/2(ni+n2-2) = vni n2 = 34,48-35,59 - VÍJ384 •./— + —■ 2,035 = -2,114 y v 25 10 h = mi-m2+ s — + — ti.a/2(ni+n2-2) = Vn, n, = 34,48-35,59 + VÍ7384 ■]— + —■ 2,035 = -0,106 y v 25 10 -2,114 g/l < (Xi - (i2 < -0,106 g/l s pravděpodobností aspoň 0,95. Výpočet pomocí systému STATISTICA: Otevřeme nový datový soubor o dvou proměnných d a h a jednom případu Do Dlouhého jména proměnné d napíšeme |=34,48-35,59-sqrt((24*lJ482+9*lJ121)/33)*sqrt((l/25)+(l/10))*VStudent(0,975;33)| Do Dlouhého jména proměnné h napíšeme =34,48-35,59+ I _ I 1 -2,1136l| -0,1063:| l| -2,1136! -0,1063:| S pravděpodobností aspoň 0,95 tedy -2,114 g/l < ui - \i2 < -0,106 g/l, Příklad: V předešlém příkladě nyní předpokládáme, že dané dva náhodné výběry pocházejí z rozložení N(jlíi, oi ) a N(|Li2, o22). Sestrojte 95% empirický interval spolehlivosti pro podíl rozptylů. Řešení: Úloha vede na vzorec z bodu (d). 1,7482/1,7121 1,7482/1,7121 2 , 2 Si /s2 j__i ' J2__ x'# _ x'# = 0 28 "^(^-1,^-1) F0975(24,9) 3,6142 s^/s/ _ 1,7482/1,7121 _ 1,7482/1,7121 _ 1,7482/1,7121 h = Fa/2(ni-l,n2-l)" F0>025(24,9) " 1/F0,975(9,24) " 1/2,7027 ' 2 0,28 < —l— < 2,76 s pravděpodobností aspoň 0,95. Výpočet pomocí systému STATISTICA: Otevřeme nový datový soubor o dvou proměnných d a h a jednom případu. Do Dlouhého jména proměnné d napíšeme =( 1,7482/1,7121 )/VF(0,975 ;24;9) (Funkce VF(x;ný;omega) počítá x-kvantil Fisherova - Snedecorova rozložení F(ný, omega).) =( 1,7482/1,7121 )/VF(0,025 ;24;9) 1 d 2 h 1 0,28252 2,75969! S pravděpodobností aspoň 0,95 tedy platí: 0,28 < oi / o2 < 2,76. o 2 2 Jednotlivé typy testů o parametrických funkcích Ui-U2, oi /02 a) Nechť Xx v..., Xln je náhodný výběr z rozložení N(ui, oi2) a X21,..., X2ll2 je na něm nezávislý náhodný výběr z 2 2 2 rozložení N(u2, 02 ), přičemž ni > 2, n2 > 2 a 01 ,02 známe. Nechť c je konstanta. Test H0: ui - U2 - c proti Hi: ui - fi2 ^ c se nazývá dvouvýběrový z-test. b) Nechť Xn,..., Xlnj je náhodný výběr z rozložení N(ui, o2) a X21,..., X2ll2 je na něm nezávislý náhodný výběr rozložení 2 2 N(u2, cj ), přičemž ni>2an2>2ao neznáme. Nechť c je konstanta. Test H0: ui - \i2 - c proti Hi: \i\ - \i2 * c se nazývá dvouvýběrový t-test. c) Nechť Xj j,..., Xlnj je náhodný výběr z rozložení N(ui, oi2) a X21,..., X2ll2 je na něm nezávislý náhodný výběr 2 2 rozložení N(u2, 022), přičemž ni > 2 a n2 > 2. Test H0: -^y = 1 proti Hi: —^-j * 1 se nazývá F-test. C>2 °2 Provedení testů o parametrických funkcích Ui-u-2, cji2/o2 2 pomocí kritického oboru a) Provedení dvouvýběrového z-testu Vvpočteme realizaci testového kritéria tn = ("^ ji. Stanovíme kritický obor W. Pokud t0 e W, H0 zamítáme na hladině významnosti a a přijímáme Hi. Oboustranný test: Testujeme H0: Ui - \i2 = c proti Hi: ui - \i2 *c. Kritický obor má tvar: W Levostranný test: Testujeme H0: \i\ - \i2 = c proti - \i2 < c. Kritický obor má tvar: W Pravostranný test: Testujeme H0: Ui - \i2 = c proti Hi: ui - \i2 > c. Kritický obor má tvar: W b) Provedení dvouvýběrového t-testu _ (m, -m2)-c Vypočteme realizaci testového kritéria ^ = Stanovíme kritický obor W. Pokud t0 e W, H0 zamítáme na hladině významnosti a a přijímáme Hi. Oboustranný test: Testujeme H0: u,i - jlx2 = c proti Hi: jlxi - jlx2 * c. Kritický obor má tvar: W = (-c»,-t1^/2(n1+n2-2))u(t1^/2(n1+n2-2),c»). Levostranný test: Testujeme H0: u,i - u,2 = c proti Hi: jlxi - jli2 < c. Kritický obor má tvar: W = (-oo,-t1_0[(n1 +n2 -2)). Pravostranný test: Testujeme H0: u,i - u,2 = c proti Hi: jlxi - jli2 > c. Kritický obor má tvar: W = (t1_0[(n1 +n2 -2),oo). c) Provedení F-testu 2 Vypočteme realizaci testového kritéria t0=-LJ. s2 Stanovíme kritický obor W. Pokud t0 e W, H0 zamítáme na hladině významnosti a a přijím „ . „ i. 2 2 Oboustranný test: Testujeme H0: = 1 proti Hi: * 1- Kritický obor má tvar: CT2 °2 W = (O, Fa/2 (ni - L n2 -1)> u (F^/2 (n, -1, n2 -1), oo). Levostranný test: Testujeme H0: = 1 proti Hi: < 1. Kritický obor má tvar: W = (0,Fa(ni-U2-l)>. CT2 CT2 2 2 Pravostranný test: Testujeme H0: -^y = 1 proti Ffi: -^y > 1. Kritický obor má tvar: W = (F^^ -l,n2 -l),oo), Příklad: V restauraci "U bílého koníčka" měřili ve 20 případech čas obsluhy zákazníka. Výsledky v minutách: 6, 8, 11,4, 7, 6, 10, 6, 9, 8, 5, 12, 13, 10, 9, 8, 7, 11, 10, 5. V restauraci "Zlatý lev" bylo dané pozorování uskutečněno v 15 případech s těmito výsledky: 9, 11, 10, 7, 6, 4, 8, 13, 5, 15, 8, 5, 6, 8 ,7. Za předpokladu, že uvedené hodnoty pocházejí ze dvou normálních rozložení, na hladině významnosti 0,05 testujte hypotézu, že střední hodnoty doby obsluhy jsou v obou restauracích stejné. Řešení: Na hladině významnosti 0,05 testujeme nulovou hypotézu Ho: ui - U2 = 0 proti oboustranné alternativě Hi: ui - U2 *■ 0. Je to úloha na dvouvýbě-rový t-test. Před provedením tohoto testuje však nutné pomocí F-testu ověřit shodu rozptylů. Na hladině významnosti 0,05 tedy testujeme H0: —*Y = 1 proti Hi: ž 1. Nejprve vypočteme mi = 8,25, m2 = 8,13, si2 = 6,307, s22 = 9,41, a2 a2 2 (n,-l)s,2 +(n2-l)s22 19-6,307 + 14-9,41 _ ,„ _ „ . , . ,. . 4 , . .. s» = -Lj---—-— =-= 7,623. Podle vzorce z bodu (c) vypočteme realizaci testové statistiky: nt + n2 - 2 33 tn = ■—= = 0,6702. Stanovíme kritický obor: ° s22 9,41 W = (0,Fa/2(n, -l,n2 -l))u(Fj_a/2(n, -l,n2 -1),qo) = ^0,F0025(19,14)^u^F0975(19,14),qo) = = (0,l/F0 975(l4,19))u(F0 975(l9,14),oo) = (0,1/2,6469) u (2,8607,^) = (0;0,3778) u (2,8607, co) Protože se testová statistika nerealizuje v kritickém oboru, nulovou hypotézu nezamítáme na hladině významnosti 0,05. Rozptyly tedy můžeme považovat za shodné. Nyní se vrátíme k dvouvýběrovému t-testu. Podle vzorce z bodu (b) vypočteme realizaci testové statistiky: _m-m2-c_ 8,25-8,13 _n„, s. - + — Jlfi23l- + -|n, n2 V v 20 15 Stanovíme kritický obor: W = (-oo,-t1_a/2(n1 +n2 -2))u(t,_a/2(n1 +n2 -2),oo) = (-oo,-t0 975(33))^(t0975(33),Qo) = = (-oo,-2,035) (2,035, oo) Protože testová statistika se nerealizuje v kritickém oboru, nulovou hypotézu nezamítáme na hladině významnosti 0,05. Výpočet pomocí systému STATISTICA: Otevřeme nový datový soubor o dvou proměnných a 35 případech. První proměnnou nazveme OBSLUHA, druhou ID. Do proměnné OBSLUHA napíšeme nejprve doby obsluhy v první restauraci a poté doby obsluhy ve druhé restauraci. Do proměnné ID, která slouží k rozlišení první a druhé restaurace, napíšeme 20 krát jedničku a 15 krát dvojku. Provedeme dvouvýběrový t-test současně s testem o shodě rozptylů: Statistika - Základní statistiky a tabulky - t-test, nezávislé, dle skupin - OK, Proměnné -Závislé proměnné OBSLUHA, Grupovací proměnná ID - OK. Po kliknutí na tlačítko Souhrn dostaneme tabulku Proměnná t-testy; grupováno: ID (restaurace) Skup. 1: 1 Skup. 2: 2 Průměr 1 Průměr 2 t SV P Poč.plat 1 Poč.plat. 2 Sm.odch. 1 Sm.odch. 2 F-poměr rozptyly P rozptyly OBSLUHA 8,25000i 8,13333: 0,12373i 33 0,90227' 20 15 2,51050' 3,06749; 1,49295; 0,41044i Vidíme, že testová statistika pro test shody rozptylu se realizuje hodnotou 1,492952 (je to převrácená hodnota k číslu 0,6702, které jsme vypočítali při ručním postupu), odpovídající p-hodnota je 0,41044, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě rozptylu. (Upozornění: v případě zamítnutí hypotézy o shodě rozptyluje zapotřebí v tabulce t-testu pro nezávislé vzorky dle skupin zaškrtnout volbu Test se samostatnými odhady rozptylu.) Dále z tabulky plyne, že testová statistika pro test shody středních hodnot se realizuje hodnotou 0,12373, počet stupňů volnosti je 33, odpovídající p-hodnota 0,902279, tedy hypotézu o shodě středních hodnot nezamítáme na hladině významnosti 0,05. Znamená to, že s rizikem omylu nejvýše 5% se neprokázal rozdíl ve středních hodnotách dob obsluhy v restauracích "U bílého koníčka" a „Zlatý lev". Tabulku ještě doplníme krabicovými diagramy. Na záložce Detaily zaškrtneme krabicový graf a vybereme volbu Průměr/SmOdch/Min-Max. □ Prii měr±SmOd cti I Min-Max Z grafu je vidět, že průměrná doba obsluhy v první restauraci je nepatrně delší a má menší variabilitu než ve druhé restauraci. Extrémní ani odlehlé hodnoty se zde nevyskytují.