Seminární cvičení

Míry rozptylu

Míry rozptylu nám udávají, jak moc jsou data rozptýleny kolem středové hodnoty. Můžeme tedy říct, že se jedná o variabilitu v datech. Větší variabilita v datovém souboru je vhodná, protože nám popisuje rozmanitější data. Představte si, že by všichni žáci ve vaší třídě dostali z testu jedničku. Variabilita by v tomto případě byla nulová a my bychom nevěděli, co se děje. Možná, že žáci před písemkou měli přístup k správným odpovědím, ale nám to neřekne, nebo možná dobře od sebe opisovali. Nicméně jako učitel nemáte možnost posoudit kdo má jaké znalosti z probíraného tématu. Existují různé způsoby, jak získat hodnoty pro rozptyl. Nejčastěji se setkáte se směrodatnou odchylkou a směrodatnou chybou.

  • Směrodatná odchylka nám říká, jak moc jsou hodnoty naší proměnné rozptýlené kolem průměru. Díky její znalosti můžeme odhadovat, jak daleko je vzdálené různé množství případů (viz normální rozložení). Nízká směrodatná odchylka znamená, že hodnoty jsou blízko průměru, zatímco vysoká směrodatná odchylka naznačuje, že hodnoty jsou rozptýleny v širším rozsahu.
  • Směrodatná chyba je mírou toho, jak daleko se očekává, že výběrový průměr dat bude od skutečného populačního průměru. Používá se k porovnání mezi vzorkem a populací. Má velkou roli při testování statistických hypotéz a dává představu o přesnosti a spolehlivosti odhadu. Čím menší je chyba, tím více odpovídá výběrový soubor souboru základnímu.  

Vyzkoušejte si


K příkladu s proměnnou x4 přidáme tedy i míry rozptylu. Zůstaneme pořád v rozbalené roletce Statistics (Statistiky), akorát se přesuneme do sekce Dispersion (Rozptyl), kde zaklikneme Std. deviation (směrodatná odchylka z anglického standard deviation, označováno jako SD) a do sekce Inference (Inference/Odvození), kde zaklikneme S.E. mean (směrodatná chyba z anglického The standard error of the mean, označováno jako SE).

Na chvilku odbočíme od tématu. Vidíme, že v sekci Dispersion již máme zaškrtnuty Maximum a Minimum, se kterými jsme se setkali při kontrole dat. Patří tedy mezi míry variability a JASP je má automaticky označeny při práci s popisnými statistikami. 



V tabulce se nám objeví nové hodnoty Std. Error of Mean (směrodatná chyba) je rovna 0,07. To znamená, že průměr našeho vzorku (výběrový soubor) a průměr populace (základní soubor) jsou přibližně stejné. Náš odhad bude teda přesný. Další hodnotou, která nás zajímá je Std. Deviation (směrodatná odchylka) které hodnota je rovna 1,16. 

Z předešlých seminářů víme, že APA formát je používá jako norma pro psaní citací (příklady zde). APA nám však pomáhá i například tím, jak mají být graficky zpracovány grafy (zde) a tabulky (zde) a jak správně zapsat statistické výsledky (více zde). V našem případě bychom použili průměr, protože se jedná o intervalovou proměnnou. Kromě míry centrální tendence vždy uvádíme i míru rozptylu, která se týká našeho vzorku. Proto reportujeme hodnoty standardní odchylky (v kurzívě). Do práce bychom napsali: Žáci dosáhli v testu čtení, který měřil porozumění odstavce, průměru 3,06 (SD = 1,16).   

asa