Normální rozdělení dat Pokud máme dostatečný počet výsledků testování, či jiných dat, v obecném případě bude jejich grafické rozložení podobné znázornění na obrázku. Tzn. že nejčastěji se budou vyskytovat hodnoty blízké průměrné hodnotě. Čím více se hodnoty liší od průměru, tím méně často zastoupené jsou. Toto rozdělení se často podle svého objevitele nazývá Gaussovo rozdělení. MÍRY POLOHY Aritmetický průměr , μ - součet všech hodnot dělíme rozsahem souboru - tento znak je velmi citlivý na odlehlé hodnoty Medián ,MED - prostřední hodnota výběrového souboru - u sudého počtu měření se jedná o průměr ze dvou prostředních hodnot Modus , MOD - nejčastěji se vyskytující veličina - užívaný zejména u kvalitativních nominálních znaků MÍRY VARIABILITY Ukazují, jak daleko jsou hodnoty vzdáleny od centra. Variační rozpětí R - rozdíl mezi nejvyšší a nejnižší hodnotou dat wpe5.gif (990 bytes) - značně závislé na extrémních hodnotách Rozptyl s^2, σ^2 - průměr čtverců odchylek od průměru wpe4.gif (1139 bytes) Směrodatná odchylka s, σ - v praxi nejčastěji používaný ukazatel variability - její výhoda je, že má stejné jednotky jako měřená veličina - jedná se o odmocninu rozptylu wpe2.gif (1297 bytes) Normované testové výsledky Výsledky získané v jednotlivých testech jsou vyjádřeny v různých jednotkách (fyzikální – m, s , …, body, počet opakování, apod.) Abychom je mohli porovnávat, sčítat, vyhodnocovat, převádíme je na tzv. normované body. Nejznámější z normovaných stupnic jsou: z-body T-body percentily steny K vytvoření normované stupnice je třeba otestovat poměrně velké soubory (n>100), z jejichž výsledků normu vytvoříme. z-body odchylku testového výsledku od průměru normové populace dělíme směrodatnou odchylkou x[i]…konkrétní výkon …aritmetický průměr s…směrodatná odchylka Příklad: Skok z místa – výkon 213, průměrný výkon 205, směrodatná odchylka 11,5 Protože výsledky na z-bodové stupnici jsou pro praktické použití nevhodné (malá čísla, záporné hodnoty), používáme je jako základ pro výpočet T-bodů. T-body 50…konstanta z…výsledek z-bodu Příklad: Konstrukce T-bodové stupnice: a) Vypočteme hodnoty a s referenčního souboru b) Přidělíme hodnotě 50 bodů c) postupujeme ve stupnici směrem nahoru (51, 52, …) a dolů (49, 47, …) tak, že 1b = s / 10 d) tuto „teoretickou“ stupnici upravíme na prakticky měřitelné hodnoty Výpočet a využití percentilů Nejjednodušší způsob zhodnocení výkonu testované osoby v některém testu je určení jejího pořadí v souboru (pracujeme s tzv. pořadovou stupnicí) Např. žák dosáhne 3. nejlepšího výkonu mezi 35 spolužáky ve třídě, což jej srozumitelné vyjádření jeho pozice ve skupině. Ale být 3. mezi 35 nebo 3. mezi 100 žáky je podstatný rozdíl. Proto je výhodnější vyjádřit pořadí v procentech. Provádíme tedy měření tzv. procentilového skóre, zkráceně procentilu (percentilu). Percentil určuje relativní pozici testované osoby ve skupině, informuje nás o tom, kolik procent osob skóruje níže než testovaná osoba. Naměřený výkon převedeme na percentily podle vzorce: kumf…kumulativní četnost – narůstá s pořadím výkonů ve skupině od nejhoršího po nejlepší n…počet testovaných osob Příklad: Testovaná osoba dosahuje 93. percentilu tzn., že 93% žáků je horších, 7% lepších. Padesátý percentil – medián Skóre, které dosahuje prostřední člen skpiny. Za předpokladu normálního rozložení četností se medián rovná aritmetickému průměru. Percentilové stupnice (pro grafické znázornění výsledku) Konstruují se z výsledků velkých souborů (stovky – tisíce testovaných osob) Nemá charakter pravidelné ekviintervalové stupnice. Vychází z kumulativních četností jednotlivých hrubých skóre → kolem mediánu je stupnice „hustší“, ke krajům „řídne“. wpeB.gif (10242 bytes) Testování statistických hypotéz Jejich úkolem je ověřovat oprávněnost určitých předpokladů (hypotéz) vyslovených o vlastnostech dějů. Podstata testování hypotéz je předpoklad platnosti určité okolnosti (tzv. nulové hypotézy H[0]), respektive její neplatnosti (→ přijetí tzv. alternativní hypotézy H[a]). Riziko chyby přijetí – zamítnutí H[0] se nazývá hladina významnosti, značí se písmenem α. Zpravidla volíme α = 0,05 nebo 0,01 (tj. 5% nebo 1% riziko pravděpodobnosti). Snížení ryzika chybného rozhodnutí nejsnáze dosáhneme zvětšováním rozsahu výběru souboru. Testovací kritérium se označuje t. Jestliže vypočtené t je menší než tzv. kritická hodnota, přijímáme H[0] (rozdíl není statisticky významný). Jestliže vypočtené t překračuje tabulkovou hodnotu, platí H[a] (rozdíl je statisticky významný – signifikantní). Pro výpočet t-testu používáme různé vzorce pro tyto případy: a) tzv. závislé soubory (párové hodnoty) jde o testování stejných probandů s určitým časovým odstupem b) tzv. nezávislé soubory jedná se o soubory různých osob Postup: - vypočteme , s pro 1. a 2. soubor - tzv. F-testem zjistíme, zda jde o „shodné“ nebo „rozdílné“ rozptyly - použijeme příslušný vzorec pro shodné nebo rozdílné soubory