6. Parametrické úlohy o dvou nezávislých náhodných výběrech z normálních a alternativních rozložení


Motivace: Máme-li k dispozici dva nezávislé náhodné výběry z normálních rozložení, je naším úkolem
porovnat střední hodnoty či rozptyly těchto rozložení. Zpravidla konstruujeme intervaly
spolehlivosti pro rozdíl středních hodnot respektive hodnotíme shodu středních hodnot pomocí
dvouvýběrového t-testu či dvouvýběrového z-testu a shodu rozptylů pomocí F-testu. V situaci, kdy
máme dva nezávislé náhodné výběry z alternativních rozložení, porovnáváme parametry těchto dvou
rozložení.


Věta: Rozložení statistik odvozených z výběrových průměrů a výběrových rozptylů

Nechť  je náhodný výběr z rozložení N(μ[1], σ[1]^2) a  je na něm nezávislý náhodný výběr z
rozložení N(μ[2], σ[2]^2), přičemž n[1] ≥ 2 a n[2] ≥ 2. Označme M[1], M[2] výběrové průměry,
S[1]^2, S[2]^2 výběrové rozptyly a =  vážený průměr výběrových rozptylů. Pak platí:

a)  Statistiky M[1] – M[2] a =  jsou stochasticky nezávislé.


b)  U =  ~ N(0, 1).

(Pivotová statistika U slouží k řešení úloh o μ[1]- μ[2], když σ[1]^2 a  σ[2]^2známe.)


c)  Jestliže σ[1]^2 = σ[2]^2 =: σ^2, pak K =  ~ χ^2(n[1 ]+ n[2 ]- 2).

     (Pivotová statistika K slouží k řešení úloh o neznámém společném rozptylu σ^2.)


d)  Jestliže σ[1]^2 = σ[2]^2 =: σ^2, pak T =  ~ t(n[1 ]+ n[2 ]– 2).

(Pivotová statistika T slouží k řešení úloh o μ[1]- μ[2], když σ[1]^2 a  σ[2]^2 neznáme, ale víme,
že jsou shodné.)


e)  F =  ~ F(n[1] – 1, n[2] – 1).

(Pivotová statistika F slouží k řešení úloh o σ[1]^2/ σ[2]^2.)


Důkaz:

ad a) Nebudeme provádět.

ad b) M[1]-M[2] je lineární kombinace náhodných veličin s normálním rozložením, má tedy normální
rozložení s parametry

E(M[1]-M[2]) = μ[1]- μ[2],

D(M[1]-M[2]) = σ[1] ^2/n[1]+ σ[2] ^2/n[2].

U se získá standardizací M[1]-M[2].

ad c) K[1] = ~ χ^2(n[1]-1) a K[2] = ~ χ^2(n[2]-1) jsou stochasticky nezávislé náhodné veličiny,
tedy K = K[1] + K[2] ~ χ^2(n[1 ]+ n[2 ]- 2).


ad d) U =  ~ N(0, 1), K =  ~ χ^2(n[1 ]+ n[2 ]- 2) jsou stochasticky nezávislé, protože M[1] – M[2]
a jsou stochasticky nezávislé.   ~ t(n[1 ]+ n[2 ]– 2).

ad e) K[1] = ~ χ^2(n[1]-1) a K[2] = ~ χ^2(n[2]-1) jsou stochasticky nezávislé náhodné veličiny,
tedy = ~ F(n[1] – 1, n[2] – 1).


Příklad: Nechť jsou dány dva nezávislé náhodné výběry, první pochází z rozložení N(0,28; 0,09) a má
rozsah 16, druhý pochází z rozložení

N(0,25; 0,04) a má rozsah 25. Jaká je pravděpodobnost, že výběrový průměr 1. výběru bude větší než
výběrový průměr 2. výběru?

Řešení:

S pravděpodobností přibližně 63,7% je výběrový průměr 1. výběru větší než výběrový průměr 2.
výběru.


Výpočet pomocí systému STATISTICA:

Statistika M[1] - M[2] se podle bodu (a) řídí rozložením N(μ[1] – μ[2], ),

kde μ[1] – μ[2] = 0,28 – 0,25 = 0,03, , tj. statistika M[1] - M[2] ~ N(0,03;0,007225).

Otevřeme nový datový soubor o jedné proměnné a jednom případu. Do Dlouhého jména této proměnné
napíšeme
= 1-INormal(0;0,03;sqrt(0,007225)).

V proměnné Prom1 se objeví hodnota 0,637934.


Věta: Intervaly spolehlivosti pro parametrické funkce μ[1]-μ[2], σ[1]^2/σ[2] ^2

Uvedeme přehled vzorců pro meze 100(1-α)% empirických intervalů spolehlivosti pro  parametrické
funkce μ[1] - μ[2] , σ[1]^2/ σ[2]^2.


a)  Interval spolehlivosti pro μ[1]-μ[2], když σ[1]^2[, ] σ[2]^2 známe (využití pivotové statistiky
U)

Oboustranný: (d, h) = (m[1] – m[2] – u[1-α/2], m[1] – m[2] + u[1-α/2])

Levostranný: (d, ∞) = (m[1] – m[2] – u[1-α], ∞)

Pravostranný: (-∞, h) = (-∞,m[1] – m[2] +  u[1-α])


b)  Interval spolehlivosti pro μ[1]-μ[2], když σ[1]^2[, ] σ[2]^2  neznáme, ale víme, že jsou shodné
(využití pivotové statistiky T)


Oboustranný:

(d, h) = (m[1] – m[2] – t[1-α/2](n[1]+n[2]-2), m[1] – m[2] + t[1-α/2](n[1]+n[2]-2))

Levostranný: (d, ∞) = (m[1] – m[2] – t[1-α](n[1]+n[2]-2), ∞)

Pravostranný: (-∞, h) = (-∞, m[1] – m[2] + t[1-α](n[1]+n[2]-2))


c)  Interval spolehlivosti pro společný neznámý rozptyl σ^2 (využití pivotové statistiky K)


Oboustranný: (d, h) =

Levostranný: (d, ∞) =

Pravostranný: (-∞, h) =

d)  Interval spolehlivosti pro podíl rozptylů  (využití pivotové statistiky F)

Oboustranný: (d, h) =

Levostranný: (d, ∞) =

Pravostranný: (-∞, h) =


Upozornění: Není-li v bodě (b) splněn předpoklad o shodě rozptylů, lze sestrojit aspoň přibližný
100(1-α)% interval spolehlivosti pro μ[1]-μ[2].

V tomto případě má statistika T přibližně rozložení t( ), kde počet stupňů volnosti  = . Není-li ν
celé číslo, použijeme v tabulkách kvantilů Studentova rozložení lineární interpolaci.


Příklad: Ve dvou nádržích se zkoumal obsah chlóru (v g/l). Z první nádrže bylo odebráno 25 vzorků,
z druhé nádrže 10 vzorků. Byly vypočteny realizace výběrových průměrů a rozptylů: m[1] = 34,48,
m[2]= 35,59, s[1]^2 = 1,7482, s[2]^2 = 1,7121. Hodnoty zjištěné z odebraných vzorků považujeme za
realizace dvou nezávislých náhodných výběrů z rozložení N(μ[1], σ^2) a N(μ[2], σ^2). Sestrojte 95%
empirický interval spolehlivosti pro rozdíl středních hodnot μ[1] - μ[2].

Řešení:

Úloha vede na vzorec (b) s využitím statistiky T. Vypočteme vážený průměr výběrových rozptylů a
najdeme odpovídající kvantily Studentova rozložení:


= , t[0,975](33) = 2,035

Dosadíme do vzorců pro dolní a horní mez intervalu spolehlivosti:

d = m[1]–m[2]– t[1-α/2](n[1]+n[2]-2) =

= 34,48–35,59 -  = -2,114

h = m[1]–m[2]+ t[1-α/2](n[1]+n[2]-2) =

= 34,48–35,59 +  = -0,106

-2,114 g/l < μ[1] - μ[2] < -0,106 g/l s pravděpodobností aspoň 0,95.


Výpočet pomocí systému STATISTICA:

Otevřeme nový datový soubor o dvou proměnných d a h a jednom případu.

Do Dlouhého jména proměnné d napíšeme

=34,48-35,59-sqrt((24*1,7482+9*1,7121)/33)*sqrt((1/25)+(1/10))*VStudent(0,975;33)

Do Dlouhého jména proměnné h napíšeme

=34,48-35,59+

sqrt((24*1,7482+9*1,7121)/33)*sqrt((1/25)+(1/10))*VStudent(0,975;33)

S pravděpodobností aspoň 0,95 tedy  -2,114 g/l < μ[1] - μ[2] < -0,106 g/l.


Příklad: V předešlém příkladě nyní předpokládáme, že dané dva náhodné výběry pocházejí z rozložení
N(μ[1], σ[1]^2) a N(μ[2], σ[2]^2). Sestrojte 95% empirický interval spolehlivosti pro podíl
rozptylů.

Řešení:

Úloha vede na vzorec (d) s využitím statistiky F.

d =

h =

0,28 <  < 2,76 s pravděpodobností aspoň 0,95.


Výpočet pomocí systému STATISTICA:

Otevřeme nový datový soubor o dvou proměnných d a h a jednom případu.

Do Dlouhého jména proměnné d napíšeme

=(1,7482/1,7121)/VF(0,975;24;9)

(Funkce VF(x;ný;omega) počítá x-kvantil Fisherova – Snedecorova rozložení F(ný, omega).)

Do Dlouhého jména proměnné h napíšeme

=(1,7482/1,7121)/VF(0,025;24;9)

S pravděpodobností aspoň 0,95 tedy platí: 0,28 < σ[1]^2/ σ[2]^2  < 2,76.


Definice: Jednotlivé typy testů o parametrických funkcích μ[1]-μ[2], σ[1]^2/σ[2] ^2

a)  Nechť  je náhodný výběr z rozložení N(μ[1], σ[1]^2) a  je na něm nezávislý náhodný výběr z
rozložení N(μ[2], σ[2]^2), přičemž n[1] ≥ 2, n[2] ≥ 2 a σ[1]^2, σ[2]^2 známe. Nechť c je konstanta.

Test H[0]: μ[1] – μ[2] = c proti H[1]: μ[1] – μ[2] c se nazývá dvouvýběrový z-test.

b)  Nechť  je náhodný výběr z rozložení N(μ[1], σ^2) a  je na něm nezávislý náhodný výběr rozložení
N(μ[2], σ^2), přičemž n[1] ≥ 2 a n[2] ≥ 2 a σ^2 neznáme. Nechť c je konstanta.

Test H[0]: μ[1] – μ[2] = c proti H[1]: μ[1] – μ[2] c se nazývá dvouvýběrový t-test.

c)  Nechť  je náhodný výběr z rozložení N(μ[1], σ[1]^2) a  je na něm nezávislý náhodný výběr
rozložení N(μ[2], σ[2]^2), přičemž n[1] ≥ 2 a n[2] ≥ 2. Test H[0]:  = 1 proti H[1]:   1 se nazývá
F-test.


Provedení testů o parametrických funkcích μ[1]-μ[2], σ[1]^2/σ[2] ^2 pomocí kritického oboru

a)   Provedení dvouvýběrového z-testu

Vypočteme realizaci testového kritéria . Stanovíme kritický obor W. Pokud t[0]  W, H[0] zamítáme na
hladině významnosti α a přijímáme H[1].


Oboustranný test: Testujeme H[0]: μ[1] - μ[2] = c proti H[1]: μ[1] - μ[2] c. Kritický obor má tvar:
.

Levostranný test: Testujeme H[0]: μ[1] - μ[2] = c proti H[1]: μ[1] - μ[2] < c. Kritický obor má
tvar: .

Pravostranný test: Testujeme H[0]: μ[1] - μ[2] = c proti H[1]: μ[1] - μ[2] > c. Kritický obor má
tvar: .

b)  Provedení dvouvýběrového t-testu

Vypočteme realizaci testového kritéria . Stanovíme kritický obor W. Pokud t[0]  W, H[0] zamítáme na
hladině významnosti α a přijímáme H[1].


Oboustranný test: Testujeme H[0]: μ[1] - μ[2] = c proti H[1]: μ[1] - μ[2] c. Kritický obor má tvar:
.

Levostranný test: Testujeme H[0]: μ[1] - μ[2] = c proti H[1]: μ[1] - μ[2] < c. Kritický obor má
tvar: .

Pravostranný test: Testujeme H[0]: μ[1] - μ[2] = c proti H[1]: μ[1] - μ[2] > c. Kritický obor má
tvar: .


c)  Provedení F-testu

Vypočteme realizaci testového kritéria . Stanovíme kritický obor W. Pokud t[0]  W, H[0] zamítáme na
hladině významnosti α a přijímáme H[1].


Oboustranný test: Testujeme H[0]:  = 1 proti H[1]:   1. Kritický obor má tvar: .

Levostranný test: Testujeme H[0]:  = 1 proti H[1]:  < 1. Kritický obor má tvar: .

Pravostranný test: Testujeme H[0]:  = 1 proti H[1]:  > 1. Kritický obor má tvar: .


Příklad: V restauraci "U bílého koníčka" měřili ve 20 případech čas obsluhy zákazníka. Výsledky v
minutách: 6, 8, 11, 4, 7, 6, 10, 6, 9, 8, 5, 12, 13, 10, 9, 8, 7, 11, 10, 5. V restauraci "Zlatý
lev" bylo dané pozorování uskutečněno v 15 případech s těmito výsledky: 9, 11, 10, 7, 6, 4, 8, 13,
5, 15, 8, 5, 6, 8 ,7. Za předpokladu, že uvedené hodnoty pocházejí ze dvou normálních rozložení, na
hladině významnosti 0,05 testujte hypotézu, že střední hodnoty doby obsluhy jsou v obou
restauracích  stejné.

Řešení:

Na hladině významnosti 0,05 testujeme nulovou hypotézu H[0]: μ[1] - μ[2] = 0 proti oboustranné
alternativě H[1]: μ[1] – μ[2] 0. Je to úloha na dvouvýběrový t-test. Před provedením tohoto testu
je však nutné pomocí F-testu ověřit shodu rozptylů. Na hladině významnosti 0,05 tedy testujeme
H[0]:  = 1 proti H[1]:   1. Nejprve vypočteme m[1] = 8,25, m[2] = 8,13, s[1]^2 = 6,307, s[2]^2 =
9,41, . Podle vzorce (c) vypočteme realizaci testové statistiky: . Stanovíme kritický obor:

Protože se testová statistika nerealizuje v kritickém oboru, nulovou hypotézu nezamítáme na hladině
významnosti 0,05. Rozptyly tedy můžeme považovat za shodné.

Nyní se vrátíme k dvouvýběrovému t-testu. Podle vzorce (b) vypočteme realizaci testové statistiky:
. Stanovíme kritický obor:

Protože testová statistika se nerealizuje v kritickém oboru, nulovou hypotézu nezamítáme na hladině
významnosti 0,05.


Výpočet pomocí systému STATISTICA:

Otevřeme nový datový soubor o dvou proměnných a 35 případech. První proměnnou nazveme OBSLUHA,
druhou ID. Do proměnné OBSLUHA napíšeme nejprve doby obsluhy v první restauraci a poté doby obsluhy
ve druhé restauraci. Do proměnné ID, která slouží k rozlišení první a druhé restaurace, napíšeme 20
krát jedničku a 15 krát dvojku.

Pomocí NP-grafu ověříme normalitu dat v obou skupinách. Grafy – 2D Grafy – Normální
pravděpodobnostní grafy – Proměnné OBSLUHA, OK, Kategorizovaný – Kategorie X, zaškrtneme Zapnuto,
Změnit proměnnou – ID, OK. Dostaneme graf

V obou případech se tečky odchylují od přímky jenom málo. Předpoklad o normálním rozložení dat
v obou skupinách je oprávněný.

Nyní provedeme dvouvýběrový t-test současně s testem o shodě rozptylů:

Statistika – Základní statistiky a tabulky – t-test, nezávislé, dle skupin – OK, Proměnné –Závislé
proměnné OBSLUHA, Grupovací proměnná ID – OK.

Po kliknutí na tlačítko Souhrn dostaneme tabulku


Vidíme, že testová statistika pro test shody rozptylů se realizuje hodnotou 1,492952 (je to
převrácená hodnota k číslu 0,6702, které jsme vypočítali při ručním postupu), odpovídající
p-hodnota je 0,41044, tedy na hladině významnosti 0,05 nezamítáme hypotézu o shodě rozptylů.
(Upozornění: v případě zamítnutí hypotézy o shodě rozptylů je zapotřebí v tabulce t-testu pro
nezávislé vzorky dle skupin zaškrtnout volbu Test se samostatnými odhady rozptylu.)

Dále z tabulky plyne, že testová statistika pro test shody středních hodnot se realizuje hodnotou
0,12373, počet stupňů volnosti je 33, odpovídající p-hodnota 0,902279, tedy hypotézu o shodě
středních hodnot nezamítáme na hladině významnosti 0,05. Znamená to, že s rizikem omylu nejvýše 5%
se neprokázal rozdíl ve středních hodnotách dob obsluhy v restauracích "U bílého koníčka" a „Zlatý
lev“.

Tabulku ještě doplníme krabicovými diagramy. Na záložce Detaily zaškrtneme krabicový graf a
vybereme volbu Průměr/SmOdch/Min-Max.


Z grafu je vidět, že průměrná doba obsluhy v první restauraci je nepatrně delší a má menší
variabilitu než ve druhé restauraci. Extrémní ani odlehlé hodnoty se zde nevyskytují.


Nepovinná část: Cohenův koeficient věcného účinku – doplnění významu dvouvýběrového t-testu:

Nechť  je náhodný výběr z rozložení N(μ[1], σ^2) a  je na něm nezávislý náhodný výběr rozložení
N(μ[2], σ^2), přičemž n[1] ≥ 2 a n[2] ≥ 2 a σ^2 neznáme. Nechť c je konstanta.

Testujeme H[0]: μ[1] – μ[2] = c proti H[1]: μ[1] – μ[2] c. Označme m[1], m[2] realizace výběrových
průměrů hodnot dané veličiny v těchto dvou skupinách, s[1]^2, s[2]^2 realizace výběrových rozptylů
a  realizaci váženého průměru výběrových rozptylů.

Cohenův koeficient d vypočteme podle vzorce: .

Tento koeficient slouží k posouzení velikosti rozdílu průměrů, který je standardizován pomocí
odmocniny z váženého průměru výběrových rozptylů. Jedná se o tzv. věcnou významnost neboli velikost
účinku skupiny na variabilitu hodnot sledované náhodné veličiny. Velikost účinku hodnotíme podle
následující tabulky:


                                    Hodnota d

                                                   účinek

                                    aspoň 0,8

                                                   velký

                                    mezi 0,5 až 0,8

                                                   střední

                                    mezi 0,2 až 0,5

                                                   malý

                                    pod 0,2

                                                   zanedbatelný


(Uvedené hodnoty nemají samozřejmě absolutní platnost, posouzení, jaký účinek považujeme za velký
či malý, závisí na kontextu.)


Je zapotřebí si uvědomit, že při dostatečně velkých rozsazích náhodných výběrů i malý rozdíl
ve výběrových průměrech způsobí zamítnutí nulové hypotézy na hladině významnosti α, i když
z věcného hlediska tak malý rozdíl nemá význam. Naopak, máme-li výběry malých rozsahů, pak i značně
velký rozdíl ve výběrových průměrech nemusí vést k zamítnutí nulové hypotézy na hladině významnosti
α.


Příklad:

Máme k dispozici údaje o celkovém IQ 856 žáků ZŠ. Zajímáme se jednak o skupinu dětí, jejichž oba
rodiče mají pouze základní vzdělání (je jich 296) a jednak o skupinu dětí, jejichž oba rodiče mají
vysokoškolské vzdělání (těch je 75). Na hladině významnosti 0,05 budeme testovat hypotézu, že
střední hodnota celkového IQ je v obou skupinách stejná a také vypočteme Cohenův koeficient věcného
účinku.

Řešení:

Normalitu dat v obou skupinách posoudíme pomocí N-P plotu:

Vzhled N- P plotů v obou skupinách podporuje domněnku o normalitě dat.

Provedeme dvouvýběrový t-test:


Hypotézu o shodě středních hodnot zamítáme na hladině významnosti 0,05, protože odpovídající
p-hodnota je velmi blízká 0 (hypotézu o shodě rozptylů nezamítáme na hladině významnosti 0,05,
p-hodnota F-testu je 0,110124, což je větší než 0,05).


Krabicový diagram:

Vidíme, že průměrné celkové IQ dětí v 1. skupině je 94,1, zatímco ve 2. skupině 110,9. Vliv skupiny
na variabilitu hodnot celkového IQ posoudíme pomocí Cohenova koeficientu.

Cohenův koeficient nabývá hodnoty 1,37, tudíž vliv skupiny na variabilitu hodnot celkového IQ lze
považovat za velký.


Věta: Asymptotické rozložení statistiky odvozené ze dvou výběrových průměrů

Nechť  je náhodný výběr z alternativního rozložení A( ) a  je na něm nezávislý náhodný výběr
alternativního rozložení A( ) a nechť jsou splněny podmínky n[1]  (1- ) > 9 a n[2]  (1- ) > 9.
Označme M[1], M[2] výběrové průměry.

Pak statistika  .

Důkaz:

Analogicky jako v případě jednoho náhodného výběru z alternativního rozložení.


Věta: Vzorec pro meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro
parametrickou funkci .

Meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro  jsou:


Důkaz:

Pokud rozptyl  nahradíme odhadem , i = 1, 2, konvergence náhodné veličiny U k veličině s rozložením
N(0,1) se neporuší. Tedy


Příklad: Management supermarketu vyhlásil týden slev a sledoval, zda toto vyhlášení má vliv na
podíl větších nákupů (nad 500 Kč). Na základě náhodného výběru 200 zákazníků v týdnu bez slev bylo
zjištěno 97 velkých nákupů, zatímco v týdnu se slevou z 300 náhodně vybraných zákazníků učinilo
velký nákup 162 zákazníků. Sestrojte 95% asymptotický interval spolehlivosti pro rozdíl
pravděpodobností uskutečnění většího nákupu v týdnu bez slevy a v týdnu se slevou.

Řešení:

Zavedeme náhodnou veličinu X[1i], která bude nabývat hodnoty 1, když v týdnu bez slevy i-tý náhodně
vybraný zákazník uskuteční větší nákup a hodnoty 0 jinak, i = 1, …, 200. Náhodné veličiny X[1,1],
…, X[1,200] tvoří náhodný výběr z rozložení . Dále zavedeme náhodnou veličinu X[2i], která bude
nabývat hodnoty 1, když v týdnu se slevou i-tý náhodně vybraný zákazník uskuteční větší nákup a
hodnoty 0 jinak, i = 1, …, 300. Náhodné veličiny X[2,1], …, X[2,300] tvoří náhodný výběr
z rozložení .

n[1] = 200, n[2] = 300, m[1] = 97/200 = 0,485, m[2] = 162/300 = 0,54.

Ověření podmínek n[1]  (1- ) > 9 a n[2]  (1- ) > 9:  Parametry  a  neznáme, nahradíme je odhady
m[1]a m[2]. 97.(1-97/200) = 49,955 > 9, 162.(1-162/300) = 74,52 > 9.

Meze 100(1-α)% asymptotického empirického intervalu spolehlivosti pro parametrickou funkci  jsou:

Zjistili jsme tedy, že s pravděpodobností přibližně 0,95: –0,1443 <  < 0,0343.


Věta: Testování hypotézy o parametrické funkci

Nechť  je náhodný výběr z alternativního rozložení A( ) a  je na něm nezávislý náhodný výběr
alternativního rozložení A( ) a nechť jsou splněny podmínky n[1]  (1- ) > 9 a n[2]  (1- ) > 9. Na
asymptotické hladině významnosti α testujeme nulovou hypotézu H[0]:  = c proti alternativě H[1]:  �
c (resp. H[1]:  < c resp. H[1]:  > c). Testovým kritériem je statistika

, která v případě platnosti nulové hypotézy má asymptoticky rozložení N(0,1). Kritický obor má tvar
(resp.  resp. ).

(Testování hypotézy o parametrické funkci  lze provést též pomocí 100(1-α)% asymptotického
intervalu spolehlivosti nebo pomocí p-hodnoty.)


Poznámka: Postup při testování hypotézy

Je-li c = 0, pak označme  vážený průměr výběrových průměrů. Jako testová statistika slouží , která
v případě platnosti nulové hypotézy má asymptoticky rozložení N(0,1). Kritický obor má tvar  (resp.
 resp. ). Testová statistika T[0] vznikne standardizací statistiky M[1] – M[2], kde neznámé
parametry ,  nahradíme společným odhadem M[*].


Příklad: Pro údaje z příkladu o slevách v supermarketu testujte na asymptotické hladině významnosti
0,05 hypotézu, že týden se slevami nezvýší pravděpodobnost uskutečnění většího nákupu.

Řešení:

Testujeme hypotézu   = 0 proti levostranné alternativě H[1]:  < 0 na asymptotické hladině
významnosti 0,05.

n[1] = 200, n[2] = 300, m[1] = 97/200, m[2] = 162/300, m[*] = (97 + 162)/500 = 0,518.

Podmínky dobré aproximace byly ověřeny v předešlém příkladu.

Testování pomocí intervalu spolehlivosti:

Pro levostrannou alternativu používáme pravostranný interval spolehlivosti:

Protože číslo c = 0 je obsaženo v intervalu , H[0] nezamítáme na asymptotické hladině významnosti
0,05.

Testování pomocí kritického oboru:

Realizace testového kritéria:

.

Kritický obor je . Protože testové kritérium nepatří do kritického oboru, H[0] nezamítáme na
asymptotické hladině významnosti 0,05.

Testování pomocí p-hodnoty:

Pro levostrannou alternativu se p-hodnota počítá podle vzorce p = P(T[0] ≤ t[0]):

Protože p-hodnota je větší než 0,05, H[0] nezamítáme na asymptotické hladině významnosti 0,05.


Výpočet pomocí systému STATISTICA:

Statistiky – Základní statistiky a tabulky – Testy rozdílů: r, %, průměry – OK – vybereme Rozdíl
mezi dvěma poměry – do políčka P 1 napíšeme 0,485, do políčka N1 napíšeme 200, do políčka P 2
napíšeme 0,54, do políčka N2 napíšeme 300 – zaškrtneme Jednostr. - Výpočet. Dostaneme p-hodnotu
0,1142, tedy nezamítáme nulovou hypotézu na hladině významnosti 0,05.