Popisné statistiky:
ní tendence a variability
Mgr. Zuzana Lenhartová
LfcvLw iiwuh i--ó«: LiuraiH irty potaty
.....Ilnt
špatná orientace)
- nemůžeme proměnnou popsat rychle
Jak zobrazení dat zredukovat?
- úsporně popsat rozložení proměnných skrze ukazatele centrální tendence a ukazatele variability
= ukazatel středních hodnot; ukazatel míry polohy
- charakteristika typické hodnoty dat
- ukazuje, kde se na měřené škále (číselné ose) data nalézají
- popisuje rozložení četností jedné proměnné
Ukázat
- udává, jak moc či málo jsou data na škále rozptýlená
Ukazatele centrální tendence
- popisná statistika (číselná charakteristika proměnné)
- ukazatel středních hodnot
- udávají průměrnou, typickou, reprezentativní, očekávanou hodnotu - jeden údaj
- jedno číslo - krásné a zrádné
• modus
• medián
Modu
- kategoriální typická hodnota
- nejčastější hodnota (hodnota s nejvyšší četností v datech)
-jediná možnost u nominálních dat, u vyšších úrovní často užitečnou volbou
- když známe všechny naměřené hodnoty, stanovíme modus tak, že zjistíme, která hodnota se v daném souboru vyskytuje nejčastěji
Příklad: 14, 3, 18, 4, 8, 18, 4, 6, 8, 10, 8
- v případě tabulky četnosti s intervaly lze modus určit přibližně jako střed intervalu s největší četností
- nezávislý na extrémních hodnotách naměřené veličiny
- modus nemusí být určen jednoznačně - se stejnou nejvyšší frekvencí se může vyskytovat více hodnot
- rozdělení s jedním modem (vrcholem) - unimodální
- rozdělení pravděpodobnosti s dvěma vrcholy dvouvrcholová (bimodální).
Medián
- pořadová střední hodnota
- prostřední hodnota z řady hodnot seřazených podle velikosti
- 50. percentil - rozděluje soubor dat na dvě stejné části
- při sudém počtu prvků je mediánem průměr ze dvou prostředních hodnot/ kterékoli číslo z intervalu mezi nejbližší vyšší a nejbližší nižší hodnotou (konsensuálně střed intervalu)
- používáme pro pořadová data a výše
- nezávislý na extrémních hodnotách měřené veličiny
Příklad: Měření vědomostí žáků didaktickým testem, výsledky:
14, 3, 18, 4, 8, 18, 4, 6, 8, 10, 8
Aritmetický průměr
Příklad
Určete průměr, medián a modus u těchto čtyř rozložení (sad dat):
a. 3, 3, 4, 5, 6, 8, 8, 8, 9
b. 2, 4, 4, 4, 6, 7, 7
c. 7, 7, 8, 9, 10, 10, 10
d. 1, 1, 3, 4, 5, 9
Míry variability
(rozptýlenosti)
I- omezenost středních hodnot - udávají pouze to, kolem jaké hodnoty se data "centrují" - který jsou nejčastější - data se stejnou střední hodnotou mohou mít různou rozptýlenost Variabilita - jak moc či málo jsou data na škále rozptýlená • malá variabilita - většina hodnot v souboru je stejných nebo velmi blízkých • vysoká variabilita - hodnoty jsou velmi rozmanité • tři ukazatelé variability (podle škál)
CÍP pr*zi
a nominální škále:
Na pořadové škále:
Variační rozpětí
- pokud můžeme seřadit hodnoty od nejmenší po největšř a můžeme říct, co je minimum a co je maximum, máme rozpětí
- R = Xmax - Xmin
- extrémně roste s velikostí vzorku - čím větší soubor, tím větší hodnota rozpětí
Příklad: 2, 8, 9, 10,1, 0, 5
Interkvartilové rozpětí
- vzdálenost mezi dvěma body na škále, které jsou na nějakém místě, které můžeme snadno definovat - používá se 25. a 75. percentil
S Prezi
- Q = Q3 - Ql (75. percentil minus 25. percentil)
používáme spíše než jednoduché variační rozpětí
Na intervalové, poměrové škále
- charakteristiky založené na odchylkách od průměru
- měří rozptýlenost dat kolem aritmetického průměru
x = X - m
Rozptyl
- aritmetický průměr čtverců odchylek od aritmetického průměru
- průměrná odchylka na druhou
- populační rozptyl: (1x2 I n)
- výběrový rozptyl: (Zx2 / (n - 1) - při počítání pro všechny prvky populace
součet odchylek na druhou = suma čtverců
- používá se v inferenční statistice
Směrodatná odchylka
- standardní odchylka
- odmocnina rozptylu - návrat k původní jednotce, ve které měříme
i Prezi
Popisné statistiky:
ní tendence a variability
Mgr. Zuzana Lenhartová
LfcvLw iiwuh i--ó«: LiuraiH irty potaty
.....Ilnt