Pravděpodobnost a zobecňující statistika Inference (možnost zobecnění) jako předpoklad statistické práce. Statistická signifikace. (Různé typy testů: Chi2, T-test, F-test. Neparametrické testy.) NEJPRVE STANDARDIZACE: •Proč standardizace? • •Jak se provádí. • •Co to je Z-SCORE. Co je to nulová hypotéza? •Obvykle se testuje NULOVÁ HYPOTÉZA (H0) jako specifický model statistické hypotézy. NULOVÁ HYPOTÉZA PŘEDPOKLÁDÁ STAV „NEEXISTENCE“ (ROZDÍLU) ČI STAV SHODY: •Rozložení hodnot znaku se neliší od nějakého teoretického rozložení (například normálního nebo náhodného). •Rozložení četností hodnot proměnné (vlastností jednotky), např. příjmu, věku, míry anomie, spokojenosti v životě, …, ve výběrovém souboru odpovídá rozložení proměnné v populaci (neliší se od něho). •Mezi dvěma parametry, např. mezi průměrným příjmem mužů a žen, není v základním souboru rozdíl (usuzujeme na to ze zjištěných statistik ve výběrovém souboru). •Mezi empirickým a náhodným rozložením hodnot v kontingenční tabulce není rozdílu (empirické rozložení je náhodné, neexistuje vztah nejen mezi 2 proměnnými, které tabulku tvoří, ale ani mezi jejich variantami). Nulová hypotéza •Hypotézy lze zásadně prohlásit za falešné (tedy zamítnout jejich platnost), nikoliv však dokazovat jejich platnost. Hypotéza nemůže být přímo dokázána, nýbrž může být jen zamítnuta jí odporující (nulová) hypotéza. • DVA VÝSLEDKY TESTOVÁNÍ H0 •NEMÁME DŮVOD ZAMÍTNOUT MODEL NULOVÉ HYPOTÉZY A PROTO JI PŘIJÍMÁME. •DATA NEODPOVÍDAJÍ H0 (jejich existence je při platnosti H0 vysoce nepravděpodobná) A PROTO JI ZAMÍTÁME. JEJÍ ZAMÍTNUTÍ VŠAK VĚTŠINOU NESTAČÍ PRO PŘIJETÍ ALTERNATIVNÍ HYPOTÉZY. • HLADINA VÝZNAMNOSTI (significance level) •Nazývá se tak pravděpodobnost, že náhodná odchylka (daná výběrovou chybou) překročí určitou danou hodnotu, nazývanou hranice významnosti či KRITICKÁ HODNOTA. Představuje velikost rizika chyby, jež připustíme. •Zjištěné (empirické) odchylky, vyskytující se s pravděpodobností MENŠÍ NEŽ JE ZVOLENÁ HLADINA VÝZNAMNOSTI (HV), se nazývají STATISTICKY VÝZNAMNÉ (signifikantní) na této zvolené hladině. TESTOVACÍ KRITÉRIUM •Každému testovacímu kritériu PŘÍSLUŠÍ TEORETICKÉ ROZDĚLENÍ (normální rozložení, t neboli Studentovo rozložení, F rozložení, ...). • •Tabelovány bývají jeho KRITICKÉ HODNOTY. POSTUP TESTOVÁNÍ •Zvolíme vhodné TESTOVACÍ KRITÉRIUM, jehož teoretické rozložení (standardizované normální rozložení, Studentovo rozložení, rozložení chí-kvadrátu…). •Vypočítáme z dat výběrového souboru jeho empirickou hodnotu (z-skóre jemuž odpovídá standardizované normální rozložení, t hodnotu jíž odpovídá Studentovo rozložení, chí-kvadrát jemuž odpovídá rozložení chí-kvadrát …). •Porovnáme vypočítanou statistiku s jejím teoretickým rozložením - s její KRITICKOU HODNOTOU (T*). 1. TEST NORMALITY ROZLOŽENÍ •Procedura EXPLORE: Plots • - NORMAL Q-Q PLOT Intervaly spolehlivosti FREQUENCY Interval spolehlivosti pro dichotomické proměnné •Trik spočívá v tom, že hodnoty dichotomie (ať byly kódovány jako 0 a 1, nebo jako 1 a 2) převedeme (rekódujeme procedurou Recode) na hodnoty 0 a 100. •Descriptives. – Zjistíme průměr, což je pravděpodobnost. A pomoci předcházejícího vzorce spočítáme STANDARDNÍ CHYBU. •Tj., například •=ODMOCNINA((55,9*(100-55,9)/1803)) •Krát 2 (HLADINA VÝZNAMNOSTI 95%) • Interval spolehlivosti pro polytomické proměnné •FREQUENCIES… • •PRAVDĚPODOBNOST je validní procento. Jak postupujeme? Tedy Standardizovaná CHYBA je: • •=ODMOCNINA((12*(100-12)/1780)) • •krát 2 (interval spolehlivosti 95%).