Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Matematika III – 12. týden Intervalové odhady, testování hypotéz, lineární modely Jan Slovák Masarykova univerzita Fakulta informatiky 12.12. – 16.12. 2016 Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Obsah přednášky 1 Literatura 2 Odhady 3 Testování hypotéz 4 Lineární modely 5 Vícerozměrné Nm(µ, V ) 6 Hlavní věta a použití Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Plán přednášky 1 Literatura 2 Odhady 3 Testování hypotéz 4 Lineární modely 5 Vícerozměrné Nm(µ, V ) 6 Hlavní věta a použití Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Kde je dobré číst? Karel Zvára, Josef Štěpán, Pravděpodobnost a matematická pravděpodobnost statistika, Matfyzpress, 2006, 230pp. J. Slovák, M. Panák, M. Bulant, Matematika drsně a svižně, Muni Press, Brno 2013, v+773 s., elektronická edice www.math.muni.cz/Matematika_drsne_svizne Marie Budíková, Štěpán Mikoláš, Pavel Osecký, Teorie pravděpodobnosti a matematická statistika (sbírka příkladů), Masarykova univerzita, 3. vydání, 2004, 117 stran, ISBN 80-210-3313-4. Marie Budíková, Tomáš Lerch, Štěpán Mikoláš, Základní statistické metody, Masarykova univerzita, 2005, 170 stran, ISBN 80-210-3886-1. Riley, K.F., Hobson, M.P., Bence, S.J. Mathematical Methods for Physics and Engineering, second edition, Cambridge University Press, Cambridge 2004, ISBN 0 521 89067 5, xxiii + 1232 pp. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Plán přednášky 1 Literatura 2 Odhady 3 Testování hypotéz 4 Lineární modely 5 Vícerozměrné Nm(µ, V ) 6 Hlavní věta a použití Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Odhadování parametrů může být bodové nebo intervalové. V předchozím příkladu takovými byly výběrový průměr ¯x = 139, 133 a interval spolehlivosti (135,9,142,4). Obecně postupujeme takto: Pro náhodný výběr rozsahu n X1, . . . , Xn z rozdělení, které závisí na (vektorovém) parametru θ hledáme funkci náhodných veličin (říkáme též statistiku nebo výběrovou statistiku) T(X1, . . . , Xn), která bude mít v „rozumném smyslu“ blízko ke skutečné hodnotě θ. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Odhadování parametrů může být bodové nebo intervalové. V předchozím příkladu takovými byly výběrový průměr ¯x = 139, 133 a interval spolehlivosti (135,9,142,4). Obecně postupujeme takto: Pro náhodný výběr rozsahu n X1, . . . , Xn z rozdělení, které závisí na (vektorovém) parametru θ hledáme funkci náhodných veličin (říkáme též statistiku nebo výběrovou statistiku) T(X1, . . . , Xn), která bude mít v „rozumném smyslu“ blízko ke skutečné hodnotě θ. Jakožto funkce náhodných veličin je T opět náhodnou veličinou (resp. náhodným vektorem). Konstanta (resp. konstantní vektor) b = E T − θ se nazývá vychýlení odhadu T. Nestranný (nevychýlený) je takový odhad, kdy b = 0. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Nejlepší odhad Máme-li k dispozici jistou třídu odhadů T , říkáme že T je nejlepším odhadem, má-li mezi všemi nejmenší rozptyl. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Nejlepší odhad Máme-li k dispozici jistou třídu odhadů T , říkáme že T je nejlepším odhadem, má-li mezi všemi nejmenší rozptyl. T = Tn je konzistentním odhadem, je-li pro každé > 0 lim n→∞ P(|Tn − θ| < ) = 1. Theorem Je-li limn→∞ E Tn = θ, limn→∞ var Tn = 0, pak je Tn konzistentním odhadem θ. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Plán přednášky 1 Literatura 2 Odhady 3 Testování hypotéz 4 Lineární modely 5 Vícerozměrné Nm(µ, V ) 6 Hlavní věta a použití Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Definition Hypotézou rozumíme nějaké tvrzení o rozdělení určeném sdruženou distribuční funkcí FX (x) náhodného vektoru X = (X1, . . . , Xn). Rozhodujeme mezi tzv. nulovou hypotézou H0 a alternativní hypotézou HA, která bývá negací nulové hypotézy. Možnými rozhodnutími jsou zamítnutí nebo nezamítnutí nulové hypotézy. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Definition Hypotézou rozumíme nějaké tvrzení o rozdělení určeném sdruženou distribuční funkcí FX (x) náhodného vektoru X = (X1, . . . , Xn). Rozhodujeme mezi tzv. nulovou hypotézou H0 a alternativní hypotézou HA, která bývá negací nulové hypotézy. Možnými rozhodnutími jsou zamítnutí nebo nezamítnutí nulové hypotézy. Když nulovou hypotézu zamítneme, přestože ve skutečnosti platí, nastává chyba prvního druhu, když ji nezamítneme v situaci, kdy neplatí, hovoříme o chybě druhého druhu. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Statistické rozhodování se opírá o předem určený kritický obor W , tj. předem určenou množinu výsledků pokusu, při kterých budeme nulovou hypotézu zamítat. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Statistické rozhodování se opírá o předem určený kritický obor W , tj. předem určenou množinu výsledků pokusu, při kterých budeme nulovou hypotézu zamítat. Tvar kritického oboru oboru volíme tak, abychom platnou hypotézu zamítli s pravděpodobností nejvýše α. Tj. zadáváme předem ohraničení velikosti chyby prvního druhu tzv. hladinou testu α. Zpravidla volíme α = 0, 05 nebo α = 0, 01. Výpočetní síla dnes umožňuje úkol obrátit a pro daná data se ptát, na jaké nejmenší hladině bychom ještě hypotézu zamítli. Hovoříme o dosažené hladině testu nebo také p–hodnotě (v angličtině P-value nebo Sig. level). Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Statistické rozhodování se opírá o předem určený kritický obor W , tj. předem určenou množinu výsledků pokusu, při kterých budeme nulovou hypotézu zamítat. Tvar kritického oboru oboru volíme tak, abychom platnou hypotézu zamítli s pravděpodobností nejvýše α. Tj. zadáváme předem ohraničení velikosti chyby prvního druhu tzv. hladinou testu α. Zpravidla volíme α = 0, 05 nebo α = 0, 01. Výpočetní síla dnes umožňuje úkol obrátit a pro daná data se ptát, na jaké nejmenší hladině bychom ještě hypotézu zamítli. Hovoříme o dosažené hladině testu nebo také p–hodnotě (v angličtině P-value nebo Sig. level). Mezi všemi kritickými obory na dané hladině testu ale pochopitelně přitom chceme vybrat ten, který bude minimalizovat chybu druhého druhu. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Předpokládejme, že náhodný vektor X má hustotu rozdělení f (x, θ) závislou na (vektorovém) parametru. Za nulové hypotézy je to rozdělení s hustotou f (x, θ0), za alternativní s hustotou f (x, θ1). Theorem (Neymanovo-Pearsonovo lemma) Nechť k danému α ∈ (0, 1) existuje c > 0 takové, že pro množinu Wc = {x : f (x, θ1) ≥ cf (x, θ0)} platí Wc f (x, θ0)dx = α. Pak pro každou měřitelnou množinu W takovou, že je W f (x, θ0)dx = α, platí Wc f (x, θ1)dx ≥ W f (x, θ1)dx Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití V případě intervalových odhadů můžeme problém přeformulovat jako hypotézy H0 – „střední hodnota je µ0“ a HA – „střední hodnota je µ1“. Kritický obor je pak dán požadavkem |Z| = ¯X − µ0 σ √ n ≥ z(α/2) a nezávisí na konkrétní hodnotě µ1. Example Úkol v našem předchozím příkladu o výšce desetiletých chlapců lze formulovat tak, že nulovou hypotézou je nezměněná výška populace, zatímco alternativní je, že se výška změnila (tj. náš kritický obor je symetrický). Hladinu testu pak spočteme na 6, 66%, takže je přirozené, že jsme nulovou hypotézu na úrovni 5% nezamítli. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití V případě intervalových odhadů můžeme problém přeformulovat jako hypotézy H0 – „střední hodnota je µ0“ a HA – „střední hodnota je µ1“. Kritický obor je pak dán požadavkem |Z| = ¯X − µ0 σ √ n ≥ z(α/2) a nezávisí na konkrétní hodnotě µ1. Example Úkol v našem předchozím příkladu o výšce desetiletých chlapců lze formulovat tak, že nulovou hypotézou je nezměněná výška populace, zatímco alternativní je, že se výška změnila (tj. náš kritický obor je symetrický). Hladinu testu pak spočteme na 6, 66%, takže je přirozené, že jsme nulovou hypotézu na úrovni 5% nezamítli. Když interpretujeme zadání tak, že buď se výška nezměnila, nebo vzrostla, bude náš kritický obor nesymetrický a dojdeme k hladině testu 3, 33%. Nulovou hypotézu proto na hladině 5% zamítneme. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Plán přednášky 1 Literatura 2 Odhady 3 Testování hypotéz 4 Lineární modely 5 Vícerozměrné Nm(µ, V ) 6 Hlavní věta a použití Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Uvažujme náhodný vektor Y = (Y1, . . . , Yn)T a předpokládejme, že platí Y = X · β + σZ, kde X = (xij ) je konstantní matice reálných čísel s n řádky a k < n sloupci a hodností k, β je neznámý konstantní vektor k parametrů modelu, Z je náhodný vektor, jehož n komponent má rozdělení N(0, 1), a σ > 0 je neznámý kladný parametr modelu. Hovoříme o lineárním modelu s úplnou hodností. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Uvažujme náhodný vektor Y = (Y1, . . . , Yn)T a předpokládejme, že platí Y = X · β + σZ, kde X = (xij ) je konstantní matice reálných čísel s n řádky a k < n sloupci a hodností k, β je neznámý konstantní vektor k parametrů modelu, Z je náhodný vektor, jehož n komponent má rozdělení N(0, 1), a σ > 0 je neznámý kladný parametr modelu. Hovoříme o lineárním modelu s úplnou hodností. V praktických problémech zpravidla známe veličiny xij a snažíme se odhadnout nebo predikovat hodnotu Y . Chceme přitom mít jasno o pravděpodobnostních charakteristikách těchto odhadů. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Například xij může ve vztahu Y = X · β + σZ vyjadřovat hodnocení i–tého studenta v j–tém semestru (j = 1, 2, 3) z matematiky a chceme vědět, jak tento student asi dopadne ve čtvrtém semestru. K tomu potřebujeme znát vektor β (zatímco σZ vystihuje náhodná vychýlení ve sledovaném modelu). Vektor β odhadneme na základě úplných pozorování, tj. ze znalosti hodnot Y (např. z výsledků v přechozích letech). Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Například xij může ve vztahu Y = X · β + σZ vyjadřovat hodnocení i–tého studenta v j–tém semestru (j = 1, 2, 3) z matematiky a chceme vědět, jak tento student asi dopadne ve čtvrtém semestru. K tomu potřebujeme znát vektor β (zatímco σZ vystihuje náhodná vychýlení ve sledovaném modelu). Vektor β odhadneme na základě úplných pozorování, tj. ze znalosti hodnot Y (např. z výsledků v přechozích letech). K odhadu vektoru β se často používá metoda nejmenších čtverců. To znamená, že chceme najít odhad b ∈ Rk pro vektor β tak, aby vektor ˆY = Xb minimalizoval druhou mocninu délky vektoru Y − Xβ. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Například xij může ve vztahu Y = X · β + σZ vyjadřovat hodnocení i–tého studenta v j–tém semestru (j = 1, 2, 3) z matematiky a chceme vědět, jak tento student asi dopadne ve čtvrtém semestru. K tomu potřebujeme znát vektor β (zatímco σZ vystihuje náhodná vychýlení ve sledovaném modelu). Vektor β odhadneme na základě úplných pozorování, tj. ze znalosti hodnot Y (např. z výsledků v přechozích letech). K odhadu vektoru β se často používá metoda nejmenších čtverců. To znamená, že chceme najít odhad b ∈ Rk pro vektor β tak, aby vektor ˆY = Xb minimalizoval druhou mocninu délky vektoru Y − Xβ. To je ale jednoduchá úloha lineární algebry a víme, že jde o nalezení kolmého průmětu vektoru Y do podprostoru X ⊂ Rn generovaném sloupci matice X. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Minimalizujeme přitom funkci Y − Xβ 2 = n i=1 Yi − k j=1 xij βj 2 . Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Minimalizujeme přitom funkci Y − Xβ 2 = n i=1 Yi − k j=1 xij βj 2 . Velikost Y − ˆY 2 nazýváme reziduální součet čtverců, zpravidla se značí RSS. Definujeme také reziduální rozptyl jako S2 = Y − Xb 2 n − k . Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Minimalizujeme přitom funkci Y − Xβ 2 = n i=1 Yi − k j=1 xij βj 2 . Velikost Y − ˆY 2 nazýváme reziduální součet čtverců, zpravidla se značí RSS. Definujeme také reziduální rozptyl jako S2 = Y − Xb 2 n − k . Víme, že ˆY = Xb a že, díky našemu přepokladu o maximální hodnosti X, je matice XT X invertibilní. Můžeme proto rovnou spočíst b = (XT X)−1XT ˆY . Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Theorem Nechť A je libovolná matice typu m/n nad reálnými nebo komplexními skaláry. Pak existují čtvercové unitární matice U a V dimenzí m a n, a reálná diagonální matice s nezápornými prvky D dimenze r, r ≤ min{m, n}, takové, že A = USV ∗ , S = D 0 0 0 a r je hodnost matice AA∗. Přitom je S určena jednoznačně až na pořadí prvků a prvky diagonální matice D jsou druhé odmocniny vlastních čísel di matice AA∗. Pokud je A reálná matice, pak i matice U a V jsou ortogonální. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Definition Nechť A je reálná matice typu m/n a nechť A = USV ∗ , S = D 0 0 0 je její singulární rozklad (zejména D je invertibilní). Matici A† := VS U∗ , S = D−1 0 0 0 nazýváme pseudoinverzní matice k matici A. Jak ukazuje následující věta, je pseudoinverze důležité zobecnění pojmu inverzní matice, včetně přímočarých aplikací. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Theorem Nechť A je reálná nebo komplexní matice typu m/n. Pak pro její pseudoinverzní matici platí: 1 Je-li A invertibilní (zejména tedy čtvercová), pak A† = A−1 . 2 Pro pseudoinverzi A† platí, že A†A i AA† jsou hermiteovské (v reálném případě symetrické) a AA† A = A, A† AA† = A† . 3 Pseudoinverzní matice A† je čtyřmi vlastnosti z předchozího bodu určena jednoznačně. Pokud tedy nějaká matice B typu n × m splňuje, že BA i AB jsou hermiteovské, ABA = A a BAB = B, pak B = A†. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Theorem (Pokračování) 1 Je-li A matice systému lineárních rovnic Ax = b, s pravou stranou b ∈ Km, pak vektor y = A†b ∈ Kn minimalizuje velikost Ax − b pro všechny vektory x ∈ Kn. 2 Systém lineárních rovnic Ax = b s b ∈ Km je řešitelný, právě když platí AA†b = b. V tomto případě jsou všechna řešení dána výrazem x = A† b + (E − A† A)u, kde u ∈ Kn je libovolné. Z bodu (4) předchozí věty plyne, že matice AA† je maticí kolmé projekce z vektorového prostoru Rn, kde n je počet řádků matice A na podprostor generovaný sloupci matice A (tato interpretace má samozřejmě smysl pouze pro matice mající více řádků než sloupců). Dále pro matice A, jejichž sloupce tvoří nezávislé vektory, má smysl výraz (AT A)−1AT a není těžké ověřit, že tato matice splňuje všechny vlastnosti z (1) a (2) z předchozí věty, jedná se tedy o pseudoinverzi k matici A. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Z předchozí věty vyplývají také následující vlastnosti pseudoinverze: Pro všechny matice A platí (A†)† = A, pokud má matice A, typu m × n, plnou řádkovou hodnost m, pak A† = A∗(AAT )−1, pokud má matice A, typu m × n, plnou sloupcovou hodnost n, pak A† = (AT A)−1A∗. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Plán přednášky 1 Literatura 2 Odhady 3 Testování hypotéz 4 Lineární modely 5 Vícerozměrné Nm(µ, V ) 6 Hlavní věta a použití Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Jestliže má náhodný vektor Z = (Z1, . . . , Zn) nezávislé komponenty Zi ∼ N(0, 1), je jeho varianční matice jednotkovou maticí, tj. var Z = In. Uvažme vektor U = a + BZ, kde a je libovolný konstantní vektor v Rm a B je konstantní matice typu (m, n). Víme E U = a a var U = V = BBT (protože varianční matice Z je identická). Je tedy tato varianční matice vždy pozitivně semidefinitní. Říkáme, že náhodný vektor U má mnohoměrné normální rozdělení Nm(a, V ). Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Pro libovolné mnohoměrné normální rozdělení Nm(a, V ) znovu vezmeme afinní transformaci W = c + DU s vektorem konstant c ∈ Rk a libovolnou konstantní maticí typu (k, m). Přímým výpočtem W = c + D(a + BZ) = (c + Da) + (DB)Z, což je samořejmě náhodný vektor W ∼ Nk(c + Da, DBT BDT ). Chová se tedy kovarianční matice mnohoměrného normálního rozdělení při afinních transformacích jako kvadratická forma. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Dokázali jsme, že jakákoliv linární kombinace komponent složek náhodného vektoru s mnohoměrným normálním rozdělením je náhodná veličina s normálním rozdělením. Stejně je každý vektor vzniklý výběrem jen některých komponent vektoru U opět náhodným vektorem s mnohoměrným normálním rozdělením. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Plán přednášky 1 Literatura 2 Odhady 3 Testování hypotéz 4 Lineární modely 5 Vícerozměrné Nm(µ, V ) 6 Hlavní věta a použití Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Theorem V lineárním modelu Y = Xβ + σZ platí pro vhodné matice P a R: (1) Pro odhad ˆY platí ˆY = Xβ + σPPT Z, ˆY ∼ N(Xβ, σ2 PPT ). (2) Reziduální součet čtverců RSS a normovaný čtverec velikosti rezidua mají rozdělení: Y − ˆY ∼ N(0, σ2 RRT ), Y − Y 2 /σ2 ∼ χ2 n−k . (3) Náhodná veličina b = β + σ(PT X)−1PT Z má rozdělení b ∼ N(β, σ2 (XT X)−1 ). (4) Pro reziduální rozptyl platí (n − k)S2/σ2 ∼ χ2 n−k. (5) Střední hodnota reziduálního rozptylu je E S2 = σ2. (6) Veličiny b a S2 jsou nezávislé. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Úplně nejjednodušší je to v případě jediného výběru, kdy testujeme, zda jediný parametr β je roven dané hodnotě β0. Volíme matici X s jediným sloupcem plným jedniček. Výraz Y = Xβ + σZ komponenty v Y jsou nezávislé veličiny Yi ∼ Nβ, σ2, jde o náhodný výběr rozsahu n z normálního rozdělení. Obecná věta dává odhad b = (XT X)−1 XT Y = 1 n n i=1 Yi = ¯Y S2 = 1 n − 1 Y − X ¯Y 2 = 1 n − 1 n i=1 (Yi − ¯Y )2 , což jsou právě výběrový průměr a rozptyl, se kterými jsme již počítali. Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití Zajímá nás přitom statistika T = ¯Y − β0 S √ n Testování hypotézy β = β0 se nazývá jednovýběrový t-test. Na hladině α hypotézu zamítáme, když je |T| ≥ tn−1(α). Literatura Odhady Testování hypotéz Lineární modely Vícerozměrné Nm(µ, V ) Hlavní věta a použití párový t-test Je vhodný na případy, kdy testujeme dvojice náhodných vektorů W1 = (Wi1) a W2 = (Wi2), o rozdílech jejichž komponent Yi = Wi1 − Wi2 víme, že mají rozdělení N(β, σ2). Potřebujeme navíc, aby byly veličiny Yi nezávislé (což neříká, že musí být nezávislé jednotlivé dvojice Wi1 a Wi2!). Můžeme si představit třeba hodnocení dvou různých vyučujících tímž studentem. Testujeme hypotézu, že pro všechna i je E Wi1 = E Wi2. Používáme statistiku T = ¯W1 − ¯W2 S √ n.