Link: OLE-Object-Data Vzorová písemná zkouška -- teoretická část Úkol 1.: Popište, v čem spočívá rozdíl mezi jednovýběrovým a párovým Wilcoxonovým testem Řešení: Jednovýběrový Wilcoxonův test slouží k testování hypotézy, že medián rozložení, z něhož pochází daný náhodný výběr, je rovna nějaké konstantě, zatímco párový Wilcoxonův test slouží k testování hypotézy, že rozdíl mediánů dvourozměrného rozložení, z něhož pochází daný dvourozměrný náhodný výběr, je roven nějaké konstantě. Úkol 2.: Za jakých podmínek může být výběrový koeficient korelace R[12] považován za přibližně nestranný odhad teoretického koeficientu korelace r? Řešení: Pokud rozsah dvourozměrného náhodného výběru je aspoň 30. Úkol 3.: Máme náhodný výběr X[1], ..., X[n] z normálního rozložení N(m,s^2), kde rozptyl s^2 známe. Na hladině významnosti a testujeme H[0]: m = c proti H[1]: m != c. Jak se nazývá uvedený test? Jakým rozložením se řídí testové kritérium, je-li nulová hypotéza pravdivá? Řešení: Jedná se o jednovýběrový z-test. Testové kritérium se řídí rozložením N(0,1). Úkol 4.: Jaký je kritický obor pro test hypotézy o shodě středních hodnot r >= 3 normálních rozložení se stejným rozptylem, pokud předpokládáme, že test provádíme na základě znalosti r nezávislých náhodných výběrů o celkovém rozsahu n a hladina významnosti je a? Řešení: Úkol 5.: Máme jednorozměrný datový soubor tvořený hodnotami x[1], ..., x[n]. Jak se nazývá hodnota, která leží v intervalu (x[0,25] - 3q, x[0,25] -- 1,5q), kde q = x[0,75] -- x[0,25] je kvartilová odchylka. Řešení: Jde o odlehlou hodnotu. Každý z úkolů je hodnocen maximálně 8 body. Na teoretickou část lze získat 40 bodů. Vzorová písemná zkouška -- praktická část Úkol 1.: Je dáno pět nezávislých náhodných výběrů o rozsazích 5, 7, 6, 8, 5, přičemž i-tý výběr pochází z rozložení N(m[i],s^2), i = 1, ..., 5. Byl vypočten celkový součet čtverců S[T] = 15 a reziduální součet čtverců S[E] = 3. Na hladině významnosti 0,05 testujte hypotézu o shodě středních hodnot. Řešení: n = 5 + 7 + 6 + 8 + 5 = 31, r = 5, S[A] = S[T] -- S[E] = 15 -- 3 = 12 Protože F >= F[0,95](4,26), H[0] zamítáme na hladině významnosti 0,05. Úkol 2.: Z realizace náhodného výběru rozsahu 100, který pochází z rozložení N(m, s^2), byl vypočten výběrový průměr m = 15 a výběrový rozptyl s^2 = 36. Najděte 95% empirický interval spolehlivosti pro neznámou střední hodnotu u. Řešení: h = 16,18, tedy 13,82 < u < 16,18 s pravděpodobností aspoň 0,95. Úkol 3.: 100 náhodně vybraných pokusných osob mělo nezávisle na sobě odhadnout, kdy od daného signálu uplyne minuta. 35 osob délku 1 minuty nadhodnotilo, přičemž součet pořadí odchylek jejich odhadů od 1 minuty činil 3110. Zbylých 65 osob délku 1 minuty podhodnotilo. Lze na asymptotické hladině významnosti 0,05 zamítnout hypotézu, že polovina lidské populace délku jedné minuty nadhodnotí a polovina podhodnotí? Řešení: Testujeme hypotézu H[0]: x[0,50] = 0 proti H[1]: x[0,50] != 0. Úloha vede na jednovýběrový Wilcoxonův test, kde S[W]^+ = 3110 Realizace asymptotické testové statistiky: hodnota příslušného kvantilu = 1,96, rozhodnutí o nulové hypotéze: zamítáme na asymptotické hladině významnosti 0,05. Úkol 4.: Pro 12 náhodně vybraných ojetých automobilů byl vypočten výběrový koeficient korelace mezi jejich stářím v měsících a počtem najetých kilometrů. Nabyl hodnoty 0,831. Za předpokladu, že data pocházejí z dvourozměrného normálního rozložení, testujte na hladině významnosti 0,05 hypotézu o nezávislosti obou veličin. Uveďte hodnotu testové statistiky a kritický obor. Řešení: Testujeme H[0]: r = 0 proti oboustranné alternativě H[1]: r != 0 Testová statistika . Kritický obor . Protože , H[0] zamítáme na hladině významnosti 0,05. Úkol 5.: Nechť X[1,] ..., X[n] je náhodný výběr z N(m,s^2), kde rozptyl známe. Jak musíme změnit rozsah výběru, aby šířka 100(1-a)% empirického intervalu spolehlivosti pro střední hodnotu klesla na polovinu? Řešení: Označme d, h meze původního intervalu spolehlivosti a n původní rozsah náhodného výběru. Šířka intervalu spolehlivosti je h -- d = m + u[1-a/2] -- (m - u[1-a/2]) = u[1-a/2] , tedy n >= . Nyní označme d*, h* meze nového intervalu spolehlivosti a n* nový rozsah náhodného výběru. Požadujeme, aby h* - d* = , tedy n* >= . Vidíme, že rozsah výběru se musí zvětšit 4 x. Každý úkol je hodnocen maximálně 12 body. Na praktickou část lze získat 60 bodů. Body z praktické a teoretické části se sčítají. Výsledné hodnocení: (90, 100] ... A, (80, 90] ... B, (70, 80] ... C, (60, 70] ... D, (50, 60] ... E, [0, 50] ... F