Statistika v kinantropologii Mgr. Martin Sebera, Ph.D. Úvod.. 4 Poznámky na úvod.. 5 1 Základní a výběrový soubor. 6 Kontrolní otázky a úkoly. 7 2 Průzkumová analýza dat. 8 2.1 Frekvenční grafy. 8 2.2 Krabicové grafy. 9 2.3 Grafy pro ověření normality výběru. 9 2.4 Příklad. 10 Kontrolní otázky a úkoly. 15 3 Základní statistické charakteristiky. 16 3.1 Popisná statistika. 16 3.2 Příklad. 17 Kontrolní otázky a úkoly. 18 4 Testování hypotéz. 19 4.1 Odhady parametrů. 19 4.2 Testování hypotéz. 19 4.2.1 Jednovýběrové testy. 21 4.2.2 Dvouvýběrové testy. 21 4.2.3 Párový test 22 4.2.4 Testy dobré shody. 23 4.3 Příklad.. 24 Kontrolní otázky a úkoly. 28 5 Neparametrické testy. 30 Vybrané neparametrické testy.. 30 5.1 c^2 test dobré shody. 30 5.2 Wilcoxonův test pro dva závislé výběry. 31 5.3 Mannův-Whitneyův test pro dva nezávislé výběry. 32 5.4 Příklad I 33 5.5 Příklad II 33 Kontrolní otázky a úkoly. 35 6 Korelační koeficient. 36 Příklad. 37 Kontrolní otázky a úkoly. 38 7 Regresní přímka.. 39 7.1 Lineární regrese. 39 Příklad. 41 Kontrolní otázky a úkoly. 43 Seznam použitých zdrojů.. 44 Rejstřík. 44 Příloha 1 - data.. 46 Úvod Práce předkládá možnosti využití základního matematicko-statistického aparátu pro potřeby studia v kinantropologickém výzkumu na Fakultě sportovních studií. Možnost statistického zpracování dat je stále velmi dynamicky se rozvíjející disciplína. S rostoucí dostupností výkonné měřící a výpočetní techniky se statistické metody začaly ve stále větším měřítku prosazovat v běžné kinantropologické praxi. Smyslem předloženého materiálu je porozumět mechanismu, na jehož základě jsou základní statistické výpočty prováděny. Přiměřená znalost statistiky pak pomůže studentům lépe chápat zákonitosti naměřených dat. Aplikovat statistické metody a postupy znamená zaznamenávat data o jevech a zpracovávat je, tj. třídit, vyhodnocovat a interpretovat. Statistika se tak nachází v úzkém kontaktu s informačními technologiemi (informatika, výpočetní technika). Cíl materiálu Na konci tohoto kurzu bude student schopen: · porozumět a vysvětlit základní statistické charakteristiky; · použít testování hypotéz na vybraných případech; · interpretovat výsledky na reálných příkladech (srovnání dvou skupin, hledání a popis závislostí, zhodnocení statistického modelu); Text je rozvržen do 7 kapitol. 1 se zabývá základními termíny a odbornými pojmy, kapitola 2 pak rozložením četnosti a grafickým znázorněním dat, 3. základními statistickými charakteristikami, 4. se věnuje obecně testování hypotéz, testy normality a t-testy. 5. Kapitola popisuje základní neparametrické testy, 6. Zmiňuje parametrický i neparametrický výpočet korelačního koeficientu a poslední se věnuje základům lineární regrese. Pro názorné ukázky příkladu a řešení byl použit sw Statistica 10 CZ, ke kterému mají přístup všichni studenti Masarykovy univerzity. Text označený zelenou barvou nabízí přesný postup při průchodu kontextovým menu v sw Statistica. http://www.muni.cz/ics/services/software/statistica?lang=cs Poznámky na úvod Dvojí zápis dat v sw STATISTICA. Za drobnou nevýhodu práce v sw STATIATICA lze považovat dva různé zápisy dat, které se používají při jednotlivých výpočtech. Prvním je způsob zápisu po proměnných: každý sloupec obsahuje popis proměnné a ve sloupci pod ním pak hodnoty dané proměnné. Druhým způsobem je zápis proměnné společně s tzv. grupovací proměnnou. V prvním sloupci je identifikátor grupovací proměnné a ve druhém sloupci jsou vlastní data – tab. 1. Tab. 1 Odlišné způsoby zápisu stejných hodnot vybraných proměnných Zápis po proměnných Zápis s grupovací proměnnou délka-skupina 1 délka-skupina 2 68 142 199 179 158 138 skupina délka skupina1 68 skupina1 199 skupina1 158 skupina2 142 skupina2 179 skupina2 138 Ikonky k porozumění a rychlejší orientace v textu (http://openclipart.org/search/?query=smile) Začátek teorie http://www.balviten.cz/uploadedfiles/fckeditor/image/smile.jpg Konec teorie http://www.balviten.cz/uploadedfiles/fckeditor/image/smile.jpg Řešený příklad http://openclipart.org/image/800px/svg_to_png/78265/SMILE_11.png Důležitá informace hodna zapamatování http://www.spsul.cz/images/smile09.jpg 1 Základní a výběrový soubor Základní soubor Představuje soubor všech prvků (osob, objektů, …), které mohou být teoreticky předmětem sledování a u kterých se objevuje sledovaný znak. Počet členů této množiny označujeme N a toto N je obvykle velmi velké, může být i nekonečno (v případě sledování proměnných v čase). Výzkumník zpravidla provádí svá šetření na mnohem menší množině, tzv. výběrovém souboru, který je vybrán některou z metod (výběr náhodný nebo záměrný stratifikovaný) vždy však způsobem, aby výběr co nejlépe reprezentoval základní soubor. Výběrový soubor Náhodný výběr představuje takovou techniku, kdy každý prvek má stejnou pravděpodobnost výběru, nebo má stejnou pravděpodobnost dostat se do výběrového souboru. Prakticky se náhodný výběr provádí pomocí losování nebo generátorem náhodných čísel (software), výjimečně tabulkou náhodných čísel. Příklad 1 Základní soubor všech atletů v ČR je definován svým registrem, který je dostupný na webu Českého atletického svazu. Výběrový soubor můžeme vytvořit 3 způsoby: 1. náhodný systematický výběr. Do výběrového souboru vložíme každého k-tého člena z pořadí všech atletů, kteří byli předtím seřazení podle svého příjmení. Hodnota k je určena předem. 2. náhodný vícestupňový výběr. Typicky ho provádíme ve více krocích (dva či více). Např. nejprve seřadíme seznam atletů podle příslušnosti ke krajům, poté v každé takové skupině provedeme náhodný výběr. 3. náhodný stratifikovaný výběr. Základní soubor rozdělíme podle jasného kritéria a jedinci jsou vybíráni do vzorku náhodně z těchto skupin (např. vybereme disciplíny a věkovou kategorii a poté provedeme náhodný výběr). Statistické jednotky Jsou prvky statistického souboru, které mají alespoň jednu společnou vlastnost. U statistických jednotek zjišťujeme statistické znaky. Statistický znak Je označením určité vlastnosti jednotky, kterou zkoumáme. Hodnota statistického znaku představuje míru sledované vlastnosti Znaky, které nabývají více než jedné varianty, označujeme a nazýváme proměnnými. http://www.spsul.cz/images/smile09.jpg Typy proměnných Při statistické analýze potřebujeme u každé proměnné určit její typ. Můžeme se setkat s několika způsoby klasifikace proměnných, v našem textu popisujeme přístup, který za hlavní kritérium považuje typy vztahů mezi hodnotami. Podle Řezankové (2005) u tohoto hlediska rozlišujeme proměnné: · Nominální. Hodnotou je číslo nebo text. U těchto proměnných můžeme provádět jen rozdělení četností, případně operaci porovnání. Příklad: student absolvoval motorický test „běh na 50 m“ s výkonem 7,4 s a motorický test „leh-sed s výsledkem 50 opakování za minutu. Číselné hodnoty 7,4 a 50 určují jen odlišné výsledků motorických testů, nic jiného se vyčíst nedá · Ordinální znaky umožňuje provádět srovnání a tím určit pořadí. V případě textových proměnných je nutné tyto převést na čísla. Příklad: v dotaznících vyjadřujeme míru souhlasu s daným tvrzením. Svou kondicí hodnotím jako: vynikající – velmi dobrou – dobrou – slabou – špatnou. Výroky respondentů můžeme určit pořadí, jak který respondent souhlasí s tvrzením. Však netvrdíme, že rozdíl mezi odpověďmi vynikající a velmi dobrou je stejný jako mezi slabou a špatnou. · Intervalové kromě porovnání můžeme provádět operaci součtu a rozdílu. Příklad: výška a hmotnost jedince. Naměříme-li u batolete výšku v cm po čtyřech měsících hodnoty 60, 62, 64, 66, znamená to, že každým měsícem dítě vyrostlo o 2 cm. · Poměrové znaky umožňují interpretovat kromě operace rovnosti, uspořádání a rozdílu ještě operace podílu a součinu. Příklad: zaběhne-li atlet 100 m za 11 s a druhý atlet za 22 s, je možné prohlásit, že první je dvakrát rychlejší než druhý. Nominální a ordinální proměnné jsou souhrnně označovány jako kvalitativní; intervalové a poměrové proměnné jsou souhrnně označovány jako kvantitativní (numerické, kardinální). Kvantitativní proměnné můžeme podle jiného hlediska dělit na · diskrétní, které nabývají pouze celočíselných obměn (počet permanentek do posilovny) a · spojité (metrické), jež mohou nabývat libovolných hodnot z určitého intervalu (věk respondenta, výkon ve vrhu koulí). Nominální, ordinální a kvantitativní diskrétní proměnné můžeme souhrnně označit jako kategoriální (obměny těchto proměnných nazýváme kategoriemi). · dichotomické (alternativní), které nabývají pouze dvou kategorií (ekonomicky aktivní a neaktivní, kuřák a nekuřák), a · vícekategoriální (množné), jež nabývají více než dvou kategorií (rodinný stav, obor). Kontrolní otázky a úkoly 1. Uveďte 3 základní a výběrové soubory ze sportovního prostředí 2. Definujte typy proměnných 3. U každého typu proměnných uveďte 3 ze sportovního prostředí 4. Uveďte proměnné, která jsou kategoriální, ale nejsou ordinální 5. Jakého typu je proměnná „pohlaví“? 2 Průzkumová analýza dat Účelem průzkumové analýzy dat (exploratory data analysis) je odhalit jejich zvláštnosti a ověřit předpoklady pro následné statistické zpracování. O výběru předpokládáme, že jeho rozdělení je normální a data splňují předpoklady nezávislosti a homogenity. V této kapitole se omezíme pouze na ověřování normality a homogenity dat. K ověření těchto předpokladů budeme používat především grafické metody, které vděčí za svůj vznik především rozvoji počítačové grafiky. Tak zvaná vizualizace dat je důležitým nástrojem při analýze dat, regresní analýze, analýze časových řad a dalších. Statistické programy nabízejí více grafů pro identifikaci statistických zvláštností dat. Následuje stručný popis nejpoužívanějších grafů průzkumové analýzy. 2.1 Frekvenční grafy Jedním ze základních typů grafického zobrazení dat jsou tzv. frekvenční (četnostní) grafy, které zobrazují informace obsažené ve frekvenční tabulce (tabulka rozdělení četností). Mezi nejznámější frekvenční grafy patří histogramy a polygony četností. Před konstrukcí těchto grafů musíme výběr roztřídit, tj. rozdělit n hodnot do k intervalů (tříd). Statistické programy počet tříd a jejich šířku většinou nabízí. Nabízené hodnoty můžeme ve většině případů měnit. Při volbě intervalů můžeme například postupovat tak, že vhodně zaokrouhlíme dolů nejmenší hodnotu a nahoru největší hodnotu. Takto vzniklý rozsah hodnot pak dělíme na počet intervalů, který bývá blízký deseti. Praktické hledisko je zde to, aby středy nebo hranicemi intervalů byla „rozumná“ celá čísla. Ať kreslíme histogram sami nebo pomocí počítače, musíme vždy zvolit z několika možností. Vzhledem k tomu, že často nevíme a priori, co můžeme v datech čekat, jsou tato rozhodnutí založena na zkušenosti. Sturgesovo pravidlo doporučuje volit počet intervalů k podle vztahu kde n je rozsah výběru. Pro přibližně symetrická rozdělení výběru lze počet intervalů (tříd) k počítat podle vztahu kde n je rozsah výběru a výraz označuje celočíselnou část čísla v závorce. Výhodou uvedených vzorců je sice standardizace, ale nevýhodou např. to, že hranice a středy tříd mohou být „nehezká“ čísla. Nutno dělat kompromisy mezi navrhovaným počtem intervalů a „rozumnými“ hranicemi a středy intervalů. Neexistuje universální postup, vždy se musí vycházet z konkrétních dat. Rovněž šířka intervalů závisí na povaze zkoumaných dat. Většinou pracujeme s intervaly stejné délky (mluvíme o ekvidistantním dělení). Nestejnou šířku tříd (neekvidistantní dělení) volíme jen ve zdůvodnitelných případech (např. při velmi zešikmeném rozdělení výběru), neboť komplikuje další práci s rozdělením četností. Tabulku rozdělení četností znázorňujeme graficky pomocí histogramu. V histogramu každé třídě odpovídá obdélník, jehož výška je rovna četnosti a šířka třídnímu rozpětí. Histogramy možno v jednotlivých programech doplnit křivkou hustoty (v případě absolutních nebo relativních četností) nebo distribuční funkcí (v případě kumulativních četností) některého teoretického rozdělení. Pomocí takto doplněných grafů rozhodujeme o vhodnosti proložení těmito funkcemi. Vzhledem k subjektivní podstatě třídění histogramy umožňují pouze odhady (někdy dosti nepřesné) tvaru funkce hustoty pravděpodobnostního rozdělení, typických vlastností a individuálních zvláštností dat. 2.2 Krabicové grafy Krabicový graf (Box and whiskers plot) zobrazuje data ve formě obdélníku (krabice), z něhož vybíhají úsečky (vousy). V nejjednodušší variantě představuje krabicový graf obdélník o délce rovné kvartilovému rozpětí a s vhodně zvolenou šířkou, která je úměrná . V místě mediánu je vertikální čára. Z obou protilehlých stran tohoto obdélníku vycházejí vodorovné úsečky (vousy) ukončené hodnotami , které leží uvnitř tzv. vnitřních hradeb , kde (1) (2) Hodnoty vně intervalu ( ) jsou tzv. vybočující hodnoty. http://www.spsul.cz/images/smile09.jpg Vybočující pozorování mohou být chybná nebo odlehlá. Chybné hodnoty, pokud identifikujeme zdroj chyb, je nutné vždy vyloučit nebo opravit. U odlehlých hodnot závisí rozhodnutí na tom, zda nalezneme nějaký důvod, proč daná hodnota není projevem přirozené variability. Krabicové grafy tedy dávají kondenzovanou vizuální informaci o úrovni (medián) a variabilitě (kvartilové rozpětí) dat. Umožňují orientační posouzení symetrie dat a přítomnosti vybočujících měření. 2.3 Grafy pro ověření normality výběru Pro zjišťování odchylek rozdělení výběru od normálního rozdělení slouží jednak porovnání histogramu a křivky hustoty normálního rozdělení, jednak různé grafy pro ověření normality výběru. V těchto grafech jsou vyneseny hodnoty empirické (vyznačené body) a teoretické (vyznačené plnou čarou) distribuční funkce. Na základě velikosti odchylek od lineárního průběhu můžeme posoudit míru porušení předpokladu normality. http://openclipart.org/image/800px/svg_to_png/78265/SMILE_11.png 2.4 Příklad Data uvedená v tabulce 1 (získané body na přijímací zkoušce) podrobte průzkumové (exploratorní) analýze. Tab. 1 Body získané v přijímacím řízení 17 12 15 16 18 17 18 9 12 15 16 11 16 17 18 12 14 20 21 17 11 14 15 20 14 12 16 15 14 15 16 15 Průzkumová analýza ve STATISTICE a) Frekvenční grafy Tabulku intervalového rozdělení četností nabízí program v modulu Statistika. Postup příkazů je následující: Potup: Statistika – Základní statistiky a tabulky – Popisné statistiky – Tabulky četností Výsledkem této procedury je textový výstup (tab. 2), který obsahuje frekvenční tabulku Tab. 2 Tabulka četností: body Četnost Kumulativní četnost Rel.četn. (platných) Kumul. % (platných) Rel.četn. všech Kumul. % všech 6 a, pak hypotézu H[0] nezamítáme. V opačném případu, kdy p £ a, pak hypotézu H[0 ]zamítáme. http://www.spsul.cz/images/smile09.jpg Věcná významnost · používání nestatistického hodnocení velikosti rozdílu či vztahu ve výzkumných výsledcích, tzv. „size of effect“, zvláště pomocí tzv. koeficientu w^2 jakožto podílu, resp. procenta vysvětleného rozptylu · Např. ke kvantifikování velikosti účinku, tj. k hodnocení věcné významnosti je možné použít Cohenův koeficient účinku d. Jednou z hlavních výhod koeficientu je jeho nezávislost na rozsahu výběru. Platí pro něj konvenční hodnoty, jež usnadňují rozhodnutí, kdy lze hovořit o velkém efektu. Pokud je d větší než 0,8, je efekt velký; pro d z intervalu 0,5 – 0,8 je efekt střední; efekt pod hodnotou 0,2 lze považovat za malý. Postup při práci s hypotézami by měl vypadat následovně: 1. nejprve zhodnotit věcnou významnost jak absolutně (v jednotkách měření), tak i relativně k podílu vlivu ostatních faktorů (pomocí w^2 ), a jen jde-li o randomizovaný výzkum pak 2. použít statistickou významnost a jakožto riziko zobecnění. http://www.balviten.cz/uploadedfiles/fckeditor/image/smile.jpg 4.2.1 Jednovýběrové testy Testy o střední hodnotě Jestliže testujeme hypotézu H: m = m[0] proti alternativní hypotéze A, pak testovým kritériem je statistika , (16) která má při platnosti hypotézy H: m = m[0] Studentovo rozdělení t(n-1). Kritické obory jsou dány vztahy (17) - (19). alternativa kritický obor A[1]: m > m[0] W[1] = {t; t ³ t[1-][a](n-1)} (17) A[2]: m < m[0] W[2] = {t; t £ - t[1-][a](n-1)} (18) A[3]: m ¹ m[0] W[3] = {t; |t| ³ t[1-][a/2](n-1)} (19) 4.2.2 Dvouvýběrové testy a) Test homogenity dvou rozptylů Testujeme hypotézu H: proti alternativě A[3]: . Testovým kritériem je statistika , (20) která má za předpokladu správnosti hypotézy H: rozdělení F(n[1] - 1, n[2] - 1). Hypotézu H zamítneme na hladině významnosti a ve prospěch alternativy A: , jestliže . (21) b) Testy o středních hodnotách dvou výběrů s homogenními rozptyly Jestliže nezamítneme hypotézu o homogenitě rozptylů obou výběrů, pak testujeme hypotézu H: m[1] = m[2] proti alternativní hypotéze A pomocí testového kritéria (22) kde . (23) Testové kritérium (22) má při platnosti hypotézy H: m[1] = m[2 ]rozdělení t( ). Kritické obory jsou dány vztahy (24) - (26). alternativa kritický obor A[1]: m[1] > m[2] W[1] = {t; t ³ t[1-][a](n[1 ]+[ ]n[2 ]-[ ]2)} (24) A[2]: m[1] < m[2] W[2] = {t; t £ -t[1-][a](n[1 ]+[ ]n[2 ]-[ ]2)} (25) A[1]: m[1] ¹ m[2] W[3] = {t; |t| ³ t[1-][a/2](n[1 ]+[ ]n[2 ]-[ ]2)} (26) Velmi důležitým předpokladem použití testu je nezávislost obou výběrů. c) Testy o středních hodnotách dvou výběrů s nehomogenními rozptyly Jestliže zamítneme hypotézu o homogenitě rozptylů obou výběrů, pak testujeme hypotézu H: m[1] = m[2]proti alternativní hypotéze A pomocí testového kritéria , (27) které má při platnosti hypotézy H: m[1] = m[2 ]přibližně rozdělení t(m). Pro počet stupňů volnosti n platí vztah . (28) Kritické obory jsou dány vztahy (29) - (31). alternativa kritický obor A[1]: m[1] > m[2] W[1] = {t; t ³ t[1-][a](n)} (29) A[2]: m[1] < m[2] W[2] = {t; t £ -t[1-][a](n)} (30) A[1]: m[1] ¹ m[2] W[3] = {t; |t| ³ t[1-][a/2](n)} (31) Rovněž u tohoto testu se předpokládá nezávislost obou výběrů. 4.2.3 Párový test Párový t-test se používá pro test hypotézy o rovnosti středních hodnot ve dvou výběrech za předpokladu normality rozdělení, pokud jsou oba výběry závislé. Většinou se jedná o dvojice dat (x[1], y[1]), …, (x[n], y[n]), kde veličina X má střední hodnotu m[1] a veličina Y má střední hodnotu m[2]. Testujeme hypotézu H[0]: m[1] - m[2] = 0, to znamená, že testujeme shodu středních hodnot. Test hypotézy o rozdílu středních hodnot náhodných veličin X a Y[ ]převádíme na test hypotézy o střední hodnotě veličiny D = X - Y. Jako testové kritérium volíme statistiku , (32) která má při platnosti hypotézy H[0] rozdělení t(n-1). Alternativním hypotézám odpovídají kritické obory (33), (34) a (35). alternativa kritický obor A[1]: m[1 ]- m[2 ]> 0 W[1] = {t; t ³ t[1-][a](n-1)} (33) A[2]: m[1 ]- m[2 ] < 0 W[2] = {t; t £ - t[1-][a](n-1)} (34) A[3]: m[1 ]- m[2 ] ¹ 0 W[3] = {t; |t| ³ t[1-][a/2](n-1)} (35) 4.2.4 Testy dobré shody Zatímco při parametrických testech předpokládáme, že typ rozdělení souboru je znám, testy dobré shody prověřují hypotézy právě o typu rozdělení, z něhož byl výběr pořízen. Jedná se tedy o hypotézy o shodě teoretického a empirického rozdělení. a) Kolmogorovův - Smirnovův jednovýběrový test Test vychází z netříděných hodnot a porovnává hodnoty teoretické (hypotetické) distribuční funkce F[0](x) a empirické distribuční funkce F[n](x), která je definována z výběrových hodnot uspořádaných podle velikosti předpisem. F[n](x) = (36) Testovým kritériem je statistika . (37) Hypotéza H: F[n](x) = F[0](x) bude zamítnuta na hladině významnosti a ve prospěch alternativy A: F[n](x) ¹ F[0](x), jestliže D ³ , (38) kde je kvantil pro Kolmogorov-Smirnovův test. b) c^2 - test dobré shody Testujeme hypotézu H[0]: základní soubor má rozdělení určitého typu proti A: základní soubor nemá rozdělení určitého typu. Test vychází z tříděných dat a předpokládá výběr velkého rozsahu. Empirické četnosti n[j ]se porovnávají s teoretickými četnostmi np[j], to znamená s četnostmi, které očekáváme v případě, že platí hypotéza H[0]. Testovací kritérium je statistika , (39) která má za předpokladu správnosti hypotézy H[0] asymptoticky Chí-kvadrát rozdělení n = k-c-1 stupni volnosti, kde k je počet tříd a c je počet neznámých parametrů ověřovaného rozdělení. Hypotézu H[0] zamítneme na hladině významnosti a ve prospěch alternativy A, jestliže (40) http://www.balviten.cz/uploadedfiles/fckeditor/image/smile.jpg http://openclipart.org/image/800px/svg_to_png/78265/SMILE_11.png 4.3 Příklad Určete s 95% spolehlivostí horní odhady srdeční frekvence (SF) ve dvou skupinách sportovců a na 5% hladině významnosti tvrzení, že průměr SF je u obou skupin stejný. Tab. 4 Naměřené hodnoty SF ve dvou skupinách Skupina 1 68 133 144 106 154 175 141 148 75 50 130 151 199 134 183 137 127 101 157 119 112 115 88 168 142 103 135 115 195 133 105 82 78 143 85 85 179 124 113 97 80 84 135 99 116 133 118 200 145 165 123 155 131 98 148 44 125 82 110 111 Skupina 2 148 127 174 132 125 139 158 140 108 146 125 154 132 128 127 111 134 111 118 105 150 109 112 114 115 81 132 112 148 162 124 159 198 134 134 157 158 73 137 154 138 168 151 136 117 104 141 171 145 151 140 113 147 146 105 141 128 167 152 131 167 133 108 148 POZOR na zápis vstupních dat a jeho alternativní formu, kterou vyžadují některé metody. V tomto případě musíme data zapsat ve formě grupovací proměnné! Řešení pomocí STATISTICA a) Grafické ověření normality dat Protože se při odvozování intervalů spolehlivosti i testů hypotéz předpokládá normální rozdělení výběrového souboru, měli bychom vždy tento předpoklad ověřit. Nesplnění předpokladu normality dat, vede k přibližným a někdy i chybným řešením. Potup: Statistika – Základní statistiky a tabulky – t-test (nezávislé, dle skupin) – detailní výsledky – kategorizované histogramy Obr. 5 Ověření symetrie a homogenity dat SF u obou skupin Potup: Statistika – Základní statistiky a tabulky – t-test (nezávislé, dle skupin) – detailní výsledky – kategorizované pravděpodobnostní normální grafy Obr. 6 Ověření normality dat SF u obou skupin b) Testy dobré shody Posloupností příkazů Potup: Statistika – Základní statistiky a tabulky – tabulky četností – normalita – test normality Získáme textový výstup Kolmogorov-Smirnovova testu (tab. 14), který obsahuje hodnotu statistiky (65) = maximální rozdíl, K-S tabulkovou statistiku a vypočítanou oboustrannou pravděpodobnost (p-hodnotu). K-S test potvrdil dobrou shodu výběrových rozdělení s rozdělením normálním. Tab. 5 Testy normality (SF) N max D K-S - p Lilliefors - p W p SF-skupina 1 60 0,049968 p > .20 p > .20 0,988634 0,850352 SF-skupina 2 64 0,052919 p > .20 p > .20 0,986257 0,698076 Na základě údajů v tabulce 5 nezamítáme hypotézu o normalitě obou výběrů. c) Intervaly spolehlivosti Zadání příkladu požaduje 95% jednostranné intervaly spolehlivosti - horní odhady očekávaných výdělků v obou městech. Posloupností příkazů Postup: Statistika – Základní statistiky a tabulky – Popisné statistiky a vypsáním v okénku Interval vstupního panelu 0.90, získáme 90% oboustranné intervaly spolehlivosti uvedené v tab. 6. Obr. 7 Dialogové okno pro výpočet oboustranného intervalu spolehlivosti pro průměr Tab. 6 Výstupu procedury Meze spolehlivosti průměru N platných Průměr Int. spolehl. -95,000% Int. spolehl. 95,000% SF-skupina 1 60 123,85 114,81 132,89 SF-skupina 2 64 135,20 129,57 140,84 d) Test rovnosti rozptylů Proceduru, která provádí výpočet F-testu (48) vyvoláme příkazy Postup: Statistika – Základní statistiky a tabulky – t-test nezávislé dle proměnných – Výpočet t-testy Výsledek testu je tab. 7. V horní části tabulky najdeme hodnoty základních výběrových statistik: průměr, rozsah výběru, směrodatnou odchylku. Následuje hodnota testového F-kritéria = 2,40 a vypočtená pravděpodobnost (p = 0,00, která představuje minimální hladinu jednostranného testu, pro kterou ještě H[0] zamítáme. F-test zamítl hypotézu o rovnosti rozptylů (p = 0,00 < 0,05 = a). Tab. 7 Test rovnosti rozptylů Průměr skupina1 Průměr skupina2 Poč.plat - skupina1 Poč.plat. skupina2 Sm.odch. skupina1 Sm.odch. skupina2 F-poměr Rozptyly p Rozptyly SF 123,85 135,20 60 64 34,98 22,56 2,40 0,00 e) Test rovnosti středních hodnot Na základě výsledků F-testu, který zamítl hypotézu o rovnosti rozptylů, bychom měli správně zvolit zvolit test (55) o středních hodnotách s nehomogenními rozptyly posloupností příkazů. Sw Statistica však neumožňuje tuto volbu a tak vybereme jedinou nabídku pro t-test. Postup: Statistika – Základní statistiky a tabulky – t-test nezávislé dle proměnných – Výpočet t-testy Tab. 8 Test rovnosti středních hodnot Průměr skupina1 Průměr skupina2 t separ. odh.prom sv p oboustr. SF 123,85 135,20 -2,13 99,77 0,04 V tab. 8 najdeme hodnotu testového kritéria (50) = t-statistika = -2,13, počet stupňů volnosti = 99,77 a minimální oboustranná pravděpodobnost p = 0,04 při které ještě zamítáme hypotézu o rovnosti středních hodnot. Protože vypočítaná dvoustranná pravděpodobnost p = 0.04 < 0,05 = a, zamítáme hypotézu H[0]: = 0 o rovnosti středních hodnot a s pravděpodobností 0,95 tvrdíme, že průměrné hodnoty srdeční frekvence (SF) uvedených skupin jsou různé. Závěr příkladu Grafy pro ověření normality a testy dobré shody ukázaly, že oba výběry mají normální rozdělení. Hypotézu o rovnosti středních hodnot naměřených srdečních hodnot v obou skupinách jsme s 95% spolehlivostí zamítli. Při testování se neomezíme pouze na jeden test. Je-li to možné, hypotézu ověříme více testy. Kontrolní otázky a úkoly 1. Popište průběh testování hypotéz pomocí tabulek 2. Popište průběh testování hypotéz pomocí software 3. Co je hladina statistické významnosti? 4. Hypotézu potvrzujeme nebo nezamítáme? Proč? 5. Může být hodnota 0,12 statisticky nulová? 6. Jak je rozdíl mezi F-testem a t-testem? 7. Uveďte dvojici proměnných, kterou lze považovat za závislá pozorování. 8. Uveďte dvojici proměnných, kterou lze považovat za nezávislá pozorování. 9. Jak ověříte normalitu vstupních dat? 10. Jak je definována věcná významnosti? 5 Neparametrické testy Teoretický aparát byl převzat z učebnice Cyhelský, Kahounová & Hindls (2001). http://www.balviten.cz/uploadedfiles/fckeditor/image/smile.jpg Vybrané neparametrické testy Často vycházíme z toho, že testování statistických hypotéz probíhá při apriorní znalostí toho, jaké je pravděpodobnostní rozdělení základního souboru, z něhož byl výběrový soubor pořízen. Mlčky předpokládáme pravdivost a funkčnost této znalosti. Existují metody, které slouží k ověřování předpokladů o typu rozdělení. Jinak řečeno, chceme testovat hypotézu o tom, že existuje shoda mezi teoreticky předpokládaným rozdělením a rozdělením empirickým (tj. rozdělením hodnot pořízených náhodným výběrem). Této skupině testů se často říká – jak už z povahy problému vyplývá – testy dobré shody. Testy dobré shody řadíme mezi velmi rozsáhlou skupinu dalších testů ve statistice, pro které používáme pojmenování neparametrické testy. Půjde zejména o testy shody úrovně (např. Wilcoxonův test, Friedmanův test, Mannův-Whitneyův test). Společnou předností pro tyto testy je, že nevyžadují praktickou žádnou znalost pravděpodobnostního rozdělení zkoumané veličiny. Vedle této okolnosti k dalším výhodám uvedené skupiny testů patří jejich účinné použití i při poměrně malém rozsahu výběru, dále možnost aplikovat je i pro ordinální a nominální proměnné a rovněž větší robustnost (to je obecně důležitá statistická vlastnost, kterou bychom mohli zjednodušeně charakterizovat asi takto: zvolený postup, např. statistický test, je tím robustnější, čím je kvalita jeho výsledků méně závislá na povaze konkrétních dat a na případném „narušení jejich kvality“ v důsledku výrazných odchylek od ideálních předpokladů). Na druhé straně použití neparametrického testu obvykle vede za jinak nezměněných podmínek k rozšíření oboru přijetí na úkor oboru kritického, což v konečných důsledcích může při použití neparametrického testu mít za následek zvýšení (v porovnání s analogickým parametrickým testem) pravděpodobnost chyby druhého druhu, tj. může dojít k chybnému nezamítnutí nepravdivé testované (nulové) hypotézy. Jinak řečeno, důsledkem aplikace neparametrického testu je nižší síla testu. 5.1 c^2 test dobré shody Základem tohoto často užívaného testu je možnost roztřídit výsledky náhodného výběru jednoznačným a vyčerpávajícím způsobem do určitého počtu navzájem se nepřekrývajících tříd. Nulová hypotéza pak vyjadřuje teoretické pravděpodobnosti obsazení těchto tříd a porovnává se se skutečnými výběrovými výsledky (čili s empirickými četnostmi). Odtud také název testy dobré shody. Problematika tohoto testu může mít dvě podoby. Buď nulová hypotéza H[0] (tedy teoretické pravděpodobnosti) je udána některým standardním rozdělením náhodné veličiny, které známe z počtu pravděpodobnosti (např. Poissonovo, normální, exponenciální či řada jiných), anebo obecněji hypotézu H[0] tvoří jakékoliv teoretické rozdělení pravděpodobností, které může být formulováno intuitivně, např. jako zobecněná zkušenost apod. Nulová hypotéza, udávající pravděpodobnost obsazení j-té třídy, (označíme ji p[j]) má tvar H[0]: p[j] = p[0j] pro j = 1, 2, …, k alternativní je H[1]: non H[0]. Testovým kritériem je veličina , (41) kde G[j] = n . p[0j] udává teoretické (očekávané) obsazení j-té třídy při rozsahu výběru n, zatímco n[j] je empirická četnost v téže j-té třídě. Statistika (41) má rozdělení c^2(k-1) a pro hypotézu H[1] se vyslovíme, pokud G překročí kvantil . Test klade celkem vysoké požadavky na rozsah výběru, protože by měl být ve všech třídách splněn požadavek G[j] = n . p[0,j] > 1 a alespoň v 80 % třídách G[j] = n . p[0,j] > 5. Pokud tomu v průběhu průzkumu tak není, je možné toho dosáhnout případným dodatečným navýšením rozsahu výběru (což ovšem někdy nemusí být již uskutečnitelné) nebo vhodným slučováním sousedním, popř. věcně příbuzných tříd). Původní počet k tříd se potom ale musí patřičným způsobem snížit. V předešlých odstavcích jsme se věnovali případu, kdy testované rozdělení bylo jednoznačně určeno (např. Possionovo, l = 2). Říkáme, že jde o tzv. úplně specifikovaný model rozdělení. Častá je však situace, kdy některý parametr nebo dokonce parametry všechny v testovaném rozdělení známy nejsou. (tzv. neúplně specifikovaný model rozdělení). Potom nezbývá, než chybějící počet c parametrů odhadnout z údajů výběru (mělo by se tak dít tzv. modifikovanou metodou chí-kvadrát minima, ale v praxi se velmi často tento požadavek nesplňuje a k odhadu se s vědomím jisté nepřesnosti používá spíše jiných metod, např. maximálně věrohodných odhadů). Další postup je potom už stejný jako v případě úplně specifikovaného modelu rozdělení, jen kritický obor je vymezen těmi hodnotami G, pro které platí , kde c je počet parametrů odhadnutých z výpočtu. Další neparametrické testy V této části se nejprve budeme věnovat testům o shodě úrovně. Úvodem upozorněme, že při výkladu následujících neparametrických testů budeme opět rozlišovat mezi závislými a nezávislými výběry. Tedy v případě nezávislých výběrů platí n[1] = n[2] = ¼ = n[k] = n, zatímco v případě nezávislých výběrů budeme mít n[1] ¹ n[2] ¹ ¼ ¹ n[k]. 5.2 Wilcoxonův test pro dva závislé výběry (neboli též pořadový znaménkový test) Předpokládejme, že pro každou vybranou statistickou jednotku, máme k dispozici dvě pozorování, tj. máme celkem 2n pozorování. Ověřujeme, zda úroveň hodnot je v obou výběrech stejná. Nulová (testovaná) hypotéza má tvar H[0]: m[1] = m[2] proti alternativě H[1]: non H[0] (dvoustranná alternativní hypotéza), resp. proti alternativě typu H[1]: m[1] ¹ m[2] (jednostranná alternativní hypotéza). Určení hodnoty příslušného testového kritéria je postaveno na zjištění rozdílů mezi dvojicemi pozorování s tím, že budeme zohledňovat i faktickou těchto rozdílů. Pro každou dvojici pozorování totiž vypočteme rozdíly d[i] pro i = 1, 2, …, n. Nenulovým rozdílům přiřadíme pořadová čísla s tím, že postupujeme od nejnižší absolutní hodnoty tohoto rozdílu k nejvyšší. Pořadová čísla poté rozdělíme do dvou skupin podle znamének diferencí a zjistíme součty těchto pořadových čísel. Menší ze součtů je hodnotou testového kritéria T[w], kterou porovnáme s kvantily speciálně zkonstruovaného rozdělení T[w]. Kritický obor je vymezen jako množina hodnot T[w] menších nebo rovných než (100 a/2) % kvantil rozdělení T[w] v případě dvoustranné alternativní hypotézy (T[w] £ T[w;][a/2]), resp. menších nebo rovných než 100 a % kvantil tohoto speciálního rozdělení v případě jednostranné alternativní hypotézy (T[w] £ T[w;][a]) Z technického hlediska ještě uvedeme, že pokud se během výpočtu testového kritéria objeví dvě nebo více stejných hodnot diferencí (což obecně nelze vyloučit), potom jim přiřazujeme tzv. průměrné pořadové číslo. Pokud se např. objeví stejné diference o velikosti dejme tomu 13, vyskytují se celkem čtyřikrát a těmto čtyřem hodnotám přísluší pořadová čísla např. 4, 5, 6, 7, pak průměrné pořadové číslo přiřazené každé z diferencí rovných 13 bude 5,5. 5.3 Mannův-Whitneyův test pro dva nezávislé výběry (někdy též Wilcoxonův test pro dva nezávislé výběry) Máme k dispozici dva nezávislé výběry, tj. máme-li celkem n[1] + n[2] = n pozorování, kde n[1 ]< n[2], lze i v této situaci testovat hypotézu o shodě úrovně v těchto dvou nezávislých výběrech, tzn. H[0]: m[1] = m[2] proti alternativě H[1]: non H[0] (dvoustranná alternativní hypotéza), resp. proti alternativě typu H[1]: m[1] ¹ m[2] (jednostranná alternativní hypotéza). Při výpočtu hodnoty testového kritéria údaje získané z obou výběrů seřadíme vzestupně a jednotlivým údajům přiřadíme pořadová čísla. V každém ze souborů tato pořadová čísla sečteme. Součet pořadových čísel v souboru o rozsahu n[1] (n[1] < n[2]) je statistikou B[1], kterou použijeme při výpočtu testového kritéria která má při platnosti H[0] rozdělení T[M]. Kritický obor je v případě dvoustranné hypotézy vymezen jako Je-li alespoň n[1] > 8 a zároveň n[2] > 14, můžeme aproximativně použít testového kritéria které má při platnosti H[0] normované normální rozdělení. Kritický obor je v případě dvoustranné alternativní hypotézy vymezen množinou hodnot http://www.balviten.cz/uploadedfiles/fckeditor/image/smile.jpg http://openclipart.org/image/800px/svg_to_png/78265/SMILE_11.png 5.4 Příklad I V případě, kdy data nepocházejí z normálního rozdělení, použijeme neparametrické testy. Na datech z tab. 4 proveďte neparametrický t-test. Data jsou jasně nezávislé výběry, pocházejí pokaždé od jiné skupiny respondentů, proto použijeme Mann-Whitneyův t-test Postup: Statistiky – Neparametrické statistiky – Porovnání dvou nezávislých vzorků (skupiny) Tab. 9 Výsledek Mann-Whitneyova t-testu Mann-Whitneyův U test (sf) Dle proměn. skupina Označené testy jsou významné na hladině p <,05000 Sčt poř. skupina1 Sčt poř. skupina2 U Z p-hodn. Z upravené P hodn. N skupina1 N platn. skupina2 2*1str. přesné p SF 3315,00 4435,00 1485,00 -2,17 0,03 -2,17 0,03 60 64 0,03 V tabulce najdeme opět hodnoty základních výběrových statistik: tentokráte součet pořadí. Následuje hodnota testového kritéria: U = 1485, a minimální oboustranná pravděpodobnost p = 0,03, při které ještě zamítáme hypotézu o rovnosti středních hodnot. I tento postup zamítl hypotézu o rovnosti středních hodnot naměřené srdeční frekvence obou skupin http://openclipart.org/image/800px/svg_to_png/78265/SMILE_11.png 5.5 Příklad II Test nezávislosti c^2 (chí-kvadrát), měření síly závislosti V roce 1950 zkoumali Yule a Kendall barvu očí a vlasů u 6800 mužů. Tab. 10 Data pro chí-2 test Barva očí Barva vlasů světlá Kaštanová Černá rezavá modrá 1768 807 180 47 šedá nebo zelená 946 1387 746 53 hnědá 115 438 288 16 Na asymptotické hladině významnosti 0,05 testujte hypotézu o nezávislosti barvy očí a barvy vlasů. Simultánní četnosti znázorněte graficky. Návod: Vytvořte nový datový soubor o 12 případech a třech proměnných (OCI, VLASY, CETNOST). Do proměnné OCI napište varianty barvy očí x[[1]] = 1 (modrá), x[[2]] = 2 (šedá nebo zelená), x[[3]] = 3 (hnědá), přičemž každá varianta se objeví čtyřikrát pod sebou. Do proměnné VLASY napište třikrát pod sebe všechny varianty y[[1]] = 1 (světlá), y[[2]] = 2 (kaštanová), y[[3]] = 3 (černá), y[[4]] = 4 (rezavá)[.] Tab. 11 Data pro chí-2 test ve formátu Statisticy oci vlasy cetnost 1 modrá světlá 1768 2 modrá kaštanová 807 3 modrá černá 180 4 modrá rezavá 47 5 šedozelená světlá 946 6 šedozelená kaštanová 1387 7 šedozelená černá 746 8 šedozelená rezavá 53 9 hnědá světlá 115 10 hnědá kaštanová 438 11 hnědá černá 288 12 hnědá rezavá 20 Postup: Statistiky – Základní statistiky a tabulky – Kontingenční tabulky – Specifikace tabulky (List1-oci, List2-vlasy) OK – V (váhy) proměnná vah: četnost – OK – Možnosti: zaškrtněte Pearson & M-L Chi -square, Phi & Cramer’s V – Detailní výsledky – Detailní 2-rozm. Tabulky Tab. 12 Výsledek chí-2 test Statist. : oci(3) x vlasy(4) (oci) Chí-kvadr. sv p Pearsonův chí-kv. 1088,934 df=6 p=0,0000 M-V chí-kvadr. 1157,153 df=6 p=0,0000 Fí ,4003188 Kontingenční koeficient ,3716458 Cramér. V ,2830681 Ve výstupní tabulce najdeme mj. hodnotu testové statistiky (Chi-square = 1088,149) s počtem stupňů volnosti (df = 6) a odpovídající p-hodnotou (p = 0,0000) i Cramérův koeficient (V = 0,283). Pro grafické znázornění četností se vraťte do Detailní výsledky – 3D histogram. Po vytvoření grafu (obr. 8) je nutné manuálně zvětšit rozsah zobrazovaných hodnot na osách x a y. Pomocí STATISTIKY je možno lehce ověřit splnění podmínek dobré aproximace (tzn., že teoretické četností mají být aspoň v 80 % případů větší než 5 a ve zbylých 20% případů nemají klesnout pod 2). Teoretické četnosti se vypočítají tak, že v Možnosti zaškrtneme Očekávané četnosti. V našem případě jsou podmínky dobré aproximace splněny. Obr. 8 3D histogram Závěr: Na základě tab. 12 zamítáme hypotézu o nezávislosti. Můžeme tak předpokládat, že existuje závislost mezi barvou očí a barvou vlasů. Závislost můžeme i docela přesně popsat. Světlovlasí lidé mají modré oči, tmavovlasí zas mají tmavé oči. Kontrolní otázky a úkoly 1. Kdy se používají neparametrické testy? 2. Proč se neparametrickým metodám říká pořadové? 3. Definujte robustnost metody. 4. Uveďte neparametrické t-testy. 5. K čemu slouží metoda chí-2 (chí-kvadrát)? 6. Proč se vlastně říká neparametrické? 6 Korelační koeficient Korelace znamená vzájemný vztah mezi dvěma procesy nebo veličinami. Pokud se mezi dvěma procesy ukáže korelace, je pravděpodobné, že na sobě závisejí, nelze z toho však ještě usoudit, že by jeden z nich musel být příčinou a druhý následkem. To samotná korelace nedovoluje rozhodnout. Výpočet Pearsonova korelačního koeficientu je naznačena v následujícím vztahu (42) Matematickými úpravami lze převést na tzv. výpočtový tvar: (43) V určitějším slova smyslu se pojem korelace užívá ve statistice, kde znamená vzájemný lineární vztah mezi znaky či veličinami x a y. Tento vztah může být kladný, pokud (přibližně) platí y = kx, nebo záporný (y = -kx). Míru korelace pak vyjadřuje korelační koeficient, který může nabývat hodnot od −1 až po +1. Hodnota korelačního koeficientu −1 značí zcela nepřímou závislost, tedy čím více se zvětší hodnoty v první skupině znaků, tím více se zmenší hodnoty v druhé skupině znaků, např. vztah mezi uplynulým a zbývajícím časem. Hodnota korelačního koeficientu +1 značí zcela přímou závislost, např. vztah mezi rychlostí běhu a běžeckou frekvencí kroků sprintera. Pokud je korelační koeficient roven 0, pak mezi znaky není žádná statisticky zjistitelná lineární závislost. Je dobré si uvědomit, že i při nulovém korelačním koeficientu na sobě veličiny mohou záviset, pouze tento vztah nelze vyjádřit lineární funkcí, a to ani přibližně. Může jít např. o nelineární závislost (kvadratickou, …). Hendl (1997) uvádí nevýhody korelačního koeficientu, který je citlivý k náhodné chybě. Proto se používá ve srovnávacím experimentu. Naneštěstí je citlivý také k rozmezí měření. Často zvětšením rozsahu měření, dosáhneme značného přiblížení korelačního koeficientu k 1. Snad největší chyba spočívá v tom, že přisuzujeme důležitost tomu, že korelační koeficient je významné různý od nuly. Ve srovnávacích experimentech není tento typ uvažování na místě, přesto se údaje o této významnosti pravidelně objevují v hodnotících zprávách. Závažná je skutečnost, že korelační koeficient neodhaluje ani přítomnost proporcionální chyby ani chyby konstantní. Odpůrci korelačního koeficientu tvrdí, že tato statistika by se neměla nikdy používat při hodnocení dat srovnávacích experimentů. Doporučuje se nahradit/doplnit posouzení korelačního koeficientu, který je pouze mírou lineární závislosti výsledků, jinými postupy, např. Bland-Altmanovým rozdílovým grafem (Bland & Altman, 1986). http://www.spsul.cz/images/smile09.jpg Koeficient determinace r^2 určuje, jaká část rozptylu výkonnosti v jednom testu je dána proměnlivostí výkonů v druhém testu. Čím více se bude r blížit hodnotě 1, tím považujeme danou závislost za silnější, čím více se bude r blížit hodnotě 0, tím považujeme danou závislost za slabší. Poznámky ke korelacím: Matematicko-statistické předpoklady výpočtu korelačního koeficientu: linearita, normalita, dostatečný rozsah souboru Spearmanův koeficient pořadové korelace Spearmanův koeficient pořadové korelace se používá pro výpočet těsnosti závislosti ordinálních znaků u souborů o nevelkém rozsahu při poruše normality rozložení četností. Vzorec pro výpočet koeficientu pořadové korelace je následující kde i[x,] resp. i[y ] je index pořadí hodnot x resp. y. (44) http://openclipart.org/image/800px/svg_to_png/78265/SMILE_11.png Příklad Zjistěte míru závislosti proměnné BMI a poměr pas/boky) z dat v příloze 1. Postup: Základní statistiky a tabulky – Korelační matice – 1 seznam proměnných – Možnosti – Zobrazit r, p, N: Souhrn Tab. 13 Výsledek výpočtu Pearsonova korelačního koeficientu Korelace. Označ. korelace jsou významné na hlad. p < ,05000 N=569 (Celé případy vynechány u ChD) poměr pas/boky BMI poměr pas/boky 1,0000 ,8922 p= --- p=0,00 BMI ,8922 1,0000 p=0,00 p= --- Postup: Základní statistiky – Neparametrické statistiky – Korelace Tab. 14 Výsledek výpočtu Spearmonova korelačního koeficientu poměr pas/boky BMI poměr pas/boky 1,000 0,919 BMI 0,919 1,000 Vyhodnocení příkladu: Velikost korelačního koeficientu mezi proměnnými „BMI“ a „poměr pas/boky“ je 0,8922 (Pearsonův), resp. 0,919 (Spearmonův). Znaménko plus značí přímou úměru. Korelační koeficient mezi proměnnými je poměrně vysoký a je roven hodnotě cca 0,9, což značí hodnotu indexu determinace 0,81. Neboli daným modelem jsme schopni vysvětlit cca 81 % celkové variability. Kontrolní otázky a úkoly 1. Co vyjadřuje korelační koeficient? 2. Co znamená znaménko plus (minus) u korelačního koeficientu? 3. Co vyjadřuje index determinace u korelačního koeficientu? Jak se počítá? 4. Jaký e rozdíl mezi Pearsonovým a Spearmonovým korelačním koeficientem? 5. Lze z existující závislosti určit příčinnost? Proč? 6. Může hodnota korelačního koeficientu rovna 0 mezi dvěma proměnnými znamenat závislost? 7 Regresní přímka 7.1 Lineární regrese Regrese umožňuje postihnout povahu závislosti. Hledáme matematickou funkci, která by co nejlépe vyjadřovala charakter závislosti. Tato matematická funkce se nazývá regresní funkce a je vyjádřena regresní rovnicí. Regresní funkce může nabývat mnoha typů: - lineární regrese - kvadratická regrese - kubická regrese - polynomická regrese - hyperbolická regrese - logaritmická regrese http://www.balviten.cz/uploadedfiles/fckeditor/image/smile.jpg Hlavní úkoly regresní analýzy jsou: v Volba regresní funkce Zvolíme vhodný tvar regresní funkce, která respektuje teoretický model závislosti. Není-li teoretický model znám, provádíme analýzu bodového diagramu, grafu podmíněných průměrů a při volbě regresní funkce vycházíme ze zkušeností. Podle tvaru regresní funkce rozlišujeme lineární a nelineární regresní modely. v Odhad parametrů regresní funkce K určení parametrů regresní funkce byla navržena řada metod. Je-li regresní funkce lineární vzhledem k parametrům, pak nejpoužívanější metoda pro odhad parametrů je metoda nejmenších čtverců. Tato metoda vychází z požadavku, aby součet čtverců odchylek pozorovaných hodnot od hodnot modelových , ležících na regresní křivce, byl minimální. v Posouzení kvality zvolené regresní funkce Vystihneme-li průběh korelační závislosti regresní funkcí, zajímají nás velikosti odchylek experimentálních hodnot od vyrovnaných hodnot (hodnot ležících na výběrové regresní křivce). Přichází-li v úvahu více typů regresní funkce, můžeme při výběru využít následující kritéria: Ø Reziduální rozptyl , (45) kde součet (46) se nazývá reziduální součet čtverců, n je počet pozorování a (p + 1) = c je počet parametrů regresní funkce. Za vhodnější se považuje ta regresní funkce, u níž má reziduální rozptyl (45) menší hodnotu Ø Index determinace , (47) kde součet (48) se nazývá teoretický součet čtverců a součet (49) se nazývá celkový součet čtverců. Výběrovou regresní funkci považujeme za tím výstižnější, čím je index determinace bližší jedné. Nejjednodušší z nich je lineární regresní funkce, která má ve své empirické podobě tvar Y = a + b . x (50) Pro konkrétní závislost (např. tělesné výšky a hmotnosti) je třeba určit tzv. regresní koeficienty a, b, přičemž vycházíme z empirických údajů (znaků) sledované závislosti. Pro výpočet regresních koeficientů a, b je výhodné použít následující vzorce (51) (52) http://www.balviten.cz/uploadedfiles/fckeditor/image/smile.jpg http://openclipart.org/image/800px/svg_to_png/78265/SMILE_11.png Příklad U dvaceti prodaných ojetých automobilů určité značky byla zjištěna cena a stáří auta. Závislost ceny na stáří automobilu popište regresní přímkou. Zjištěné hodnoty jsou uvedený v tab. 17. Odhadněte parametry regresní přímky a charakterizujte těsnost závislosti pomocí koeficientu determinace. Tab. 15 Data k přímkové regresi i x[i ] [roky] y[i ] [10 tis. Kč] i x[i ] [roky] y[i ] [10 tis. Kč] 1 0,6 55,0 11 5,0 34,0 2 1,0 54,6 12 5,1 31,0 3 1,1 50,6 13 5,2 29,0 4 2,0 51,1 14 5,6 31,6 5 2,3 47,0 15 5,9 34,0 6 2,5 50,0 16 6,0 25,6 7 3,0 43,6 17 6,1 28,0 8 4,1 41,3 18 6,3 24,6 9 4,4 43,0 19 6,8 27,0 10 4,8 39,9 20 7,5 17,6 Přímková regrese ve STATIAITCE Postup: Základní statistiky – Vícenásobná regrese Závislou proměnnou stanovíme cenu, nezávislou roky. Získáme vstupní panel pro přímkovou regresi a v Kroku 1 vybereme proměnné, viz obr. 17. Obr. 9 Výsledky přímkové regrese Stejný výsledek integrovaný do jednoho kroku lze vypočítat společně s grafickým znázorněním. Postup: Grafy – Bodové grafy – další nastaveníé podle obr. Obr. 10 Nastavení parametrů přímkové regrese Obr. 11 Alternativní výsledek přímkové regrese Na obr. 9 a 11 jsou uvedeny odhady regresních koeficientů a jejich testování. Všechny regresní koeficienty jsou statisticky různé od nuly a výsledný model je ve tvaru: cena = 59,9524 – 5,1647 * roky Vypočítaný index determinace r^2 = 0,9266 naznačuj velmi vysokou přesnost tohoto modelu. Kontrolní otázky a úkoly 1. V čem spočívá princip metody nejmenších čtverců? 2. Co vyjadřuje index determinace? 3. Uveďte dvojici proměnných, mezi nimiž existuje exponenciální vztah 4. Jaký je vztah korelačního koeficientu v lineární regresi? 5. Zkuste vymyslet nelineární závislost mezi dvěma proměnnými. Seznam použitých zdrojů · Bland, J. M., & Altman, D.. G. Statistical methods for assessing agreement between two methods of clinical measurement. In Lancet, (1) 1986, s. 307–10. · Cyhelský, L., Kahounová, J., & Hindls, R. (2001). Elementární statistická analýza. (2. dopl. vyd., 318 s.) Praha: Management Press. · Hendl, J. Statistické přístupy k porovnání biomedicínských metod měření. In. Česká kinantopologie. 1997, roč. 1, č. 2, s. 87-96. · Hendl, J. (2006). Přehled statistických metod zpracování dat: analýza a metaanalýza dat. (Vyd. 2., opr., 583 s.) Praha: Portál. · Meloun, M., & Militký, J. (1998). Statistické zpracování experimentálních dat. (2. vyd., xxi, 839 s.) Praha: East Publishing. · Řezanková, H. (2005). Analýza kategoriálních dat. (Vyd. 1., 99 s.) Praha: Oeconomica. Rejstřík funkce regresní, 39 graf Bland-Altmanův, 36 histogram, 8 krabicový, 9 chyba druhého druhu, 20 prvního druhu, 20 koeficient determinace, 36 korelace Pearsonův, 36 korelace Spearmonův, 37 variační, 16 kvartil dolní, 16 horní, 16 medián, 16 Modus, 16 odchylka směrodatná, 16 pravidlo Sturgesovo, 8 proměnná intervalová, 7 kategoriální, 7 nominální, 7 ordinální, 7 průměr aritmetický, 16 regrese index determinace, 40 reziduální rozptyl, 39 rozpětí kvartilové, 16 variační, 16 rozptyl, 16 soubor výběrový, 6 základní, 6 test dobré shody, 23 dvouvýběrový, 21 homogenity rozptylů, 21 chí-2, 23 jednovýběrový, 21 Kolmogorovův - Smirnovův, 23 Mann-Whitneyův, 32 neparametrický, 30 párový, 22 středních hodnot s homogenním rozptylem, 21 středních hodnot s nehemogenním rozptylem, 22 Wilcoxonův, 31 testování hypotéz, 19 výběr náhodný stratifikovaný, 6 náhodný systematický, 6 náhodný vícestupňový, 6 významnost statistická, 19 vecná, 20 Příloha 1 - data poměr pas/boky BMI 0,60 18,68 0,73 16,77 0,75 19,60 0,76 19,22 0,76 18,95 0,77 18,08 0,77 18,07 0,77 18,82 0,77 17,39 0,77 20,19 0,78 18,98 0,78 17,40 0,78 19,08 0,78 18,96 0,78 17,26 0,78 19,39 0,78 17,57 0,78 17,93 0,79 25,13 0,79 19,82 0,79 22,01 0,79 21,16 0,79 20,25 0,79 19,54 0,79 20,15 0,79 18,93 0,80 17,54 0,80 20,73 0,80 20,55 0,80 20,69 0,80 18,75 0,80 19,69 0,80 21,31 0,80 21,43 0,80 19,98 0,80 20,27 0,80 19,30 0,80 20,15 0,80 19,55 0,81 19,40 0,81 18,86 0,81 21,74 0,81 23,61 0,81 20,90 0,81 21,56 0,81 20,64 0,81 22,11 0,81 18,44 0,81 21,76 0,81 18,45 0,81 20,69 0,81 19,16 0,81 20,69 0,81 19,65 0,81 21,08 0,81 20,40 0,81 20,58 0,82 19,56 0,82 20,57 0,82 21,12 0,82 20,76 0,82 20,80 0,82 21,60 0,82 21,48 0,82 19,96 0,82 21,08 0,82 23,46 0,82 21,21 0,82 19,64 0,82 19,54 0,82 21,38 0,82 20,92 0,82 20,13 0,82 23,12 0,82 21,10 0,82 20,45 0,82 21,42 0,82 22,14 0,82 19,88 0,82 21,59 0,82 22,31 0,82 22,31 0,82 20,09 0,82 20,87 0,82 19,34 0,83 22,11 0,83 21,59 0,83 21,35 0,83 23,05 0,83 22,44 0,83 21,76 0,83 21,15 0,83 22,28 0,83 20,17 0,83 22,07 0,83 20,44 0,83 21,25 0,83 22,03 0,83 22,49 0,83 20,01 0,83 21,15 0,83 22,39 0,83 21,64 0,83 21,62 0,83 20,68 0,83 20,47 0,83 20,90 0,83 21,30 0,83 21,45 0,84 22,50 0,84 20,82 0,84 21,44 0,84 21,92 0,84 22,68 0,84 21,91 0,84 21,45 0,84 21,43 0,84 22,66 0,84 23,17 0,84 22,68 0,84 20,84 0,84 22,90 0,84 24,51 0,84 22,91 0,84 21,67 0,84 22,73 0,84 24,16 0,84 20,35 0,84 24,12 0,84 21,32 0,84 23,84 0,84 21,63 0,84 22,76 0,84 19,97 0,84 24,17 0,84 20,72 0,84 23,11 0,84 22,12 0,84 21,57 0,84 21,89 0,84 19,65 0,84 21,62 0,84 22,13 0,84 21,67 0,84 22,82 0,84 23,32 0,84 21,59 0,84 20,65 0,84 21,62 0,84 21,98 0,84 23,21 0,85 22,06 0,85 24,42 0,85 23,97 0,85 22,92 0,85 23,45 0,85 22,16 0,85 23,13 0,85 23,66 0,85 22,40 0,85 23,64 0,85 22,91 0,85 23,96 0,85 20,65 0,85 21,80 0,85 22,26 0,85 20,90 0,85 24,12 0,85 22,90 0,85 20,87 0,85 22,01 0,85 22,68 0,85 22,66 0,85 22,56 0,85 21,50 0,85 21,68 0,85 23,67 0,85 22,97 0,85 23,19 0,85 21,23 0,85 21,07 0,85 21,46 0,86 23,14 0,86 25,47 0,86 22,62 0,86 22,53 0,86 21,68 0,86 22,77 0,86 24,60 0,86 24,26 0,86 23,86 0,86 23,69 0,86 23,81 0,86 24,49 0,86 24,63 0,86 23,55 0,86 23,26 0,86 24,78 0,86 22,59 0,86 24,35 0,86 23,15 0,86 21,41 0,86 21,51 0,86 23,47 0,86 25,21 0,86 24,12 0,86 23,03 0,86 23,21 0,86 23,28 0,86 22,42 0,86 23,21 0,86 24,46 0,86 23,21 0,86 26,40 0,86 22,85 0,86 22,98 0,86 24,07 0,86 24,98 0,87 22,47 0,87 22,33 0,87 23,18 0,87 24,72 0,87 23,70 0,87 24,64 0,87 23,10 0,87 24,66 0,87 23,59 0,87 22,12 0,87 25,97 0,87 24,04 0,87 23,62 0,87 22,25 0,87 24,08 0,87 24,23 0,87 26,95 0,87 22,90 0,87 24,39 0,87 24,11 0,87 23,95 0,87 23,35 0,87 22,54 0,87 24,90 0,87 22,41 0,87 25,52 0,87 25,48 0,87 22,56 0,87 24,45 0,87 25,39 0,87 25,61 0,87 23,91 0,87 23,43 0,87 23,44 0,87 22,67 0,87 25,66 0,87 23,36 0,87 23,63 0,87 22,97 0,87 22,15 0,87 24,71 0,87 22,08 0,87 23,37 0,87 24,49 0,87 25,42 0,87 25,30 0,87 24,47 0,87 22,64 0,87 25,25 0,87 23,49 0,88 22,20 0,88 24,54 0,88 25,83 0,88 27,20 0,88 24,25 0,88 24,97 0,88 24,09 0,88 26,28 0,88 25,28 0,88 24,30 0,88 24,89 0,88 25,29 0,88 24,13 0,88 24,35 0,88 25,13 0,88 25,74 0,88 24,36 0,88 23,33 0,88 22,11 0,88 22,97 0,88 25,48 0,88 23,68 0,88 21,77 0,88 22,88 0,88 23,95 0,88 24,20 0,88 23,32 0,88 24,06 0,88 25,55 0,88 23,61 0,88 23,68 0,88 22,55 0,88 23,83 0,88 23,90 0,88 25,17 0,88 24,12 0,88 26,47 0,88 26,35 0,88 22,58 0,88 24,20 0,88 22,99 0,88 26,76 0,88 24,24 0,88 24,11 0,89 23,39 0,89 26,38 0,89 25,73 0,89 25,77 0,89 25,83 0,89 27,26 0,89 25,02 0,89 24,45 0,89 29,05 0,89 27,00 0,89 26,08 0,89 26,89 0,89 27,59 0,89 26,14 0,89 26,54 0,89 24,35 0,89 24,77 0,89 30,20 0,89 22,09 0,89 25,84 0,89 24,23 0,89 25,44 0,89 26,89 0,89 23,61 0,89 23,38 0,89 26,34 0,89 25,88 0,89 26,05 0,89 25,17 0,89 26,07 0,89 27,51 0,89 23,86 0,89 23,50 0,89 24,99 0,89 25,66 0,89 23,00 0,89 25,59 0,89 24,08 0,89 25,15 0,89 24,94 0,89 24,74 0,89 24,80 0,89 23,06 0,90 26,52 0,90 25,49 0,90 27,18 0,90 27,22 0,90 24,70 0,90 29,38 0,90 24,22 0,90 22,24 0,90 24,51 0,90 26,91 0,90 24,06 0,90 22,63 0,90 26,23 0,90 27,64 0,90 26,26 0,90 28,24 0,90 24,86 0,90 27,62 0,90 26,60 0,90 28,00 0,90 22,90 0,90 24,76 0,90 25,28 0,90 25,01 0,90 26,14 0,90 23,54 0,90 27,04 0,90 25,11 0,90 24,51 0,90 27,12 0,90 24,86 0,90 25,34 0,90 26,31 0,91 25,51 0,91 26,27 0,91 29,64 0,91 28,67 0,91 30,06 0,91 32,34 0,91 25,05 0,91 26,22 0,91 27,80 0,91 25,08 0,91 24,61 0,91 27,83 0,91 24,18 0,91 26,86 0,91 27,43 0,91 25,75 0,91 28,09 0,91 30,99 0,91 28,12 0,91 26,07 0,92 24,52 0,92 26,01 0,92 26,96 0,92 28,58 0,92 27,40 0,92 28,34 0,92 30,65 0,92 31,67 0,92 28,30 0,92 28,18 0,92 27,41 0,92 28,56 0,92 27,27 0,92 27,39 0,92 27,50 0,92 27,96 0,92 30,13 0,92 29,65 0,92 26,62 0,92 28,74 0,92 28,22 0,92 31,28 0,92 29,30 0,92 24,78 0,92 27,21 0,92 26,08 0,92 27,01 0,92 24,16 0,92 26,75 0,92 27,41 0,92 27,18 0,92 25,63 0,92 26,02 0,92 26,54 0,92 29,55 0,92 28,85 0,92 25,63 0,92 27,11 0,93 25,42 0,93 27,99 0,93 27,65 0,93 31,33 0,93 26,26 0,93 26,34 0,93 25,26 0,93 27,37 0,93 27,44 0,93 37,46 0,93 27,84 0,93 28,78 0,93 31,46 0,93 28,57 0,93 27,70 0,93 27,17 0,93 32,31 0,93 25,86 0,93 32,21 0,93 28,48 0,93 30,22 0,93 25,37 0,93 28,76 0,93 29,72 0,93 28,47 0,93 29,27 0,93 29,25 0,93 27,29 0,93 29,16 0,93 26,59 0,93 26,84 0,93 27,65 0,93 26,75 0,94 28,90 0,94 29,06 0,94 26,62 0,94 24,98 0,94 29,61 0,94 28,56 0,94 32,03 0,94 29,06 0,94 27,70 0,94 25,37 0,94 28,98 0,94 28,76 0,94 28,22 0,94 29,94 0,94 26,64 0,94 29,98 0,94 27,22 0,94 29,66 0,94 28,85 0,94 28,02 0,94 26,46 0,94 27,56 0,94 32,80 0,94 27,36 0,95 28,79 0,95 31,89 0,95 31,20 0,95 28,62 0,95 29,37 0,95 29,21 0,95 28,50 0,95 30,56 0,95 29,31 0,95 32,85 0,95 25,84 0,95 29,34 0,95 30,66 0,95 26,50 0,95 31,10 0,95 29,93 0,95 28,04 0,95 28,06 0,96 30,40 0,96 28,33 0,96 28,41 0,96 33,40 0,96 27,61 0,96 34,64 0,96 32,28 0,96 31,05 0,96 34,25 0,96 32,65 0,96 32,79 0,96 28,24 0,96 33,24 0,97 32,22 0,97 35,58 0,97 32,65 0,97 31,85 0,97 31,74 0,97 29,36 0,97 30,59 0,97 35,29 0,97 30,55 0,97 31,18 0,97 30,39 0,97 33,98 0,98 29,69 0,98 31,56 0,98 30,40 0,98 29,22 0,98 31,86 0,98 33,55 0,98 36,61 0,98 27,99 0,98 31,83 0,98 32,35 0,98 25,56 0,98 30,02 0,99 35,37 0,99 35,57 0,99 34,31 0,99 32,50 0,99 33,40 1,00 37,49 1,00 35,54 1,01 40,15 1,01 35,69 1,01 40,67 1,03 36,84