Suprkůl hafo zbytečnej statistickej slovníček Motto: „These are sungod days, like subtle layers of yawning before this hungry mouth slowmotion days are dawning why don’t it all just burn away?“ Motorpsycho, The Golden Core (Timothy’s Monster, 1994) Přednáška 1 – Úvod description - popis data - data variable - proměnná inference – usuzování, úsudek population - populace measurement – měření coding – kódování value – hodnota constant – konstanta level of measurement – úroveň měření nominal - nominální ordinal – pořadová, ordinální interval - intervalová ratio – poměrová discrete – nespojitá, diskrétní continuous – spojitá dichotomous - dichotomická alternative - altenativní polytomous - polytomická procedure - postup measurement error – chyba měření observed (measured) value (score) – naměřená hodnota true score – skutečná hodnota accuracy – přesnost bias – chyba, zkreslení random error – náhodná chyba systematic error – systematická chyba reliability – spolehlivost, reliabilita Přednáška 2 – Četnosti a rozložení četností (absolute) frequencies – (absolutní) četnosti relative frequencies – relativní četnosti percent - procenta cumulative - kumulativní total - celkem N=samplesize – velikost vzorku, výběrového souboru minimum - minimum maximum - maximum valid values – platné hodnoty valid percent – relativní četnosti platných hodnot latent variable – skrytá proměnná outlier – odlehlá hodnota, outlier interval size – velikost, šíře intervalu bar chart – sloupcový diagram histogram - histogram pie chart – koláčový diagram frequency distribution – rozložení, rozdělení četností normal - normální rectangular – uniformní unimodal - unimodální bimodal - bimodální positively/negatively skewed – zprava/zleva zešikmené (lepto-/platy-)kurtic – leptokurtické/platykurtické floor/ceiling effect – efekt podlahy/stropu normal distribution – normální rozložení, rozdělení bell curve – Gaussova křivka Poisson distribution – Jedovo rozložení Přednáška 3 – Míry centrální tendence a variability measures of central tendency – míry centrální tendence (střední hodnoty) mode – modus median - medián mean – průměr weighted mean – vážený průměr add – sčítat multiply – násobit measures of variability – míry variability (rozptýlenosti) entropy - entropie rank-order – pořadová/-é range – (variační) rozpětí interquartile range – (mezi)kvartilové rozpětí variance – rozptyl standard deviation – směrodatná odchylka sum of squares – suma čtverců (součet odchylek na druhou) square – mocnina na druhou square root – druhá odmocnina data transformations – transformace dat standard scores – standardní, normované skóry z-scores – z-skóry, standardní, normované skóry statistical notation – statistické značky sample size – velikost vzorku, výběrového souboru subsample - podvzorek score - skór deviation score – deviační, odchylkový skór (odchylka od průměru) Přednáška 4 – Kvality statistik (+normální rozložení) least squares – nejmenší čtverce resistence - rezistence robustness - robustnost statistics as estimators – statistiky jako estimátory estimation – odhad unbiasedness – nezkreslenost consistency - konzistence relative efficiency – relativní účinnost Přednáška 5 – Zobrazení dvourozměrných dat, Korelační koeficient relationship between 2 variables level of measurement – úroveň měření predictor – prediktor, nezávislá proměnná v regresi contingency table – kontingenční tabulka crosstabulation – kontingenční tabulka cell - buňka row/column marginal frequencies – řádkové/sloupcové marginální četnosti linear relationship (vs.curvilinear (non-linear) realtionship) – lineární vztah linear association – lineární vztah (souvislost) correlation - korelace monotonous relationship – monotónní vtah (stále stoupající nebo stále klesající funkce) strength of association/relationship/correlation – těsnost, síla... positive relationship negative (inverse) relationship covariance = shared variance – sdílený rozptyl Pearson’s product-moment correlation – pearsonův součinový-momentový koeficient korelace sample/population homogeneity – homogenita vzorku/populace coefficient of determination – koeficient determinace Spearman (rank correlation) rho – pořadový korelační Kendall tau(-b,-c) Rank – pořadí phi – fí point-biserial correlation – bodově-biseriální korelace Přednáška 6 – Statistická predikce statistical prediction – statistická predikce (předpovídání,odhadování) estimate – odhadnout, odhad predicted value – odhadovaná hodnota line slope – sklon (směrnice) přímky function - funkce polynomial - polynomiální linear - lineární quadratic - kvadratická modelling – modelování regression - regrese residual n.- reziduální hodnota, reziduum (někdy i „ten reziduál“) predictor – prediktor sources of variablity (variance) – zdroje variability dependent and independent variable – závislá a nezávislá intercept – průsečík regresní přímky s osou y least squares (estimation) – odhad metodou nejmenších čtverců regression coefficents (a,b) – regresní koeficienty egression and residual variance (sum of squares) explained variance – vysvětlený rozptyl model fit with the data – shoda modelu s daty coefficient of determination (R square) – koeficient determinace assumptions of the linear regression model – předpoklady pro... residuals normally distributed – normální rozložení reziduí homoscedascity – rozptyl reziduí se s hodnotou prediktoru nemění multiple regression – mnohočetná... logistic regression – logistická nonlinear regression – nelineární Přednáška 7 – Počet pravděpodobnosti Probability – pravděpodobnost Event – jev random trial - náhodný pokus sample space – pole jevů random vs. deterministic events – náhodné vs. deterministické jev mutally exclusive events – „vzájemně (oboustranně) výlučný jev“ conditional probability – podmíněná pravděpodobnost Bayes’s theorem – Bayesův teorém random variable – náhodná proměnná probability distribution – pravděpodobnostní rozložení distribution function – distribuční funkce probability density – hustota pravděpodobnosti Přednáška 8 – Statistické usuzování, odhady statistical description – deskripce (popis) dat inference – usuzování, indukce parameters - parametry random sample (sampling) – náhodný výběr estimates – odhady sampling error – chyba způsobená výběrem vzorku random error – náhodná chyba systematic error – systematickjá chyba (nadhodnocování, podhod..) sampling distribution – výběrové rozložení standard error (of the mean) – směrodatná chyba central limit theorem – centrální limitní teorém Student's t-distribution – Studentovo t-rozložení degrees of freedom (d.f.) – stupně volnosti chi-square distribution – chí-kvadrát rozložení F-distribution – Fisherovo-Snedecorovo F-rozložení point estimate – bodový odhad interval estimate – intervalový odhad confidence interval (CI) – interval spolehlivosti level of confidence – hladina spolehlivosti Přednáška 9 – Statistické testování hypotéz statistical hypotheses testing – statistické testování hypotéz hypothesis - hypotéza hypothesis supported by data – h. podpořená daty null hypothesis – nulová hyp. scientific/alternative hypothesis – vědecká/alt. hyp. level of statistical significance – úroveň/hladina statistické významnosti (průkaznosti) type-I error – chyba prvního druhu type-II error (statistical) power – síla testu Přednáška 10 – Statistické testování hypotéz II Difference - rozdíl Association – korelace effect size – velikost efektu/účinku two-tailed - jednostranná one-tailed (directional) – oboustranná sign test – binomický znaménkový test (párový) (nominální) chi-square – chí-kvadrát (nezávislé výběry) (nominální) Wilcoxon T – (párový) (ordinál) Mann-Whitney U – (nezávislý (ordinál) paired(-samples) t-test (dependent, repeated measures) – párový t-test (interval) one sample t-test – jednovýběrový t-test independent samples t-test – t-test pro nezávislé výběry(skupiny) Cohen’s d – Cohenovo d strength of association – těsnost vztahu (korelace) explained variance – vysvětlený rozptyl tests of (univariate) normality – testy normality rozložení goodness-of-fit tests – „testy dobré shody“ Přednáška 11 – Testy pro nominální a ordinální proměnné – neparametrické metody Frequency – četnost relative frequency – relativní četnost expected frequency – očekávaná četnost residuals – rezidua (zbytky) Chi-square – chí kvadrát Chi-square goodness-of-fit test – chí-kvadrát test dobré shody observed (empirical) frequency vs. expected frequency – empirická vs. očekávaná četnost contingency table (crosstabulation, ctosstab) – kontingenční tabulka strength of association – síla vztahu contingency coefficient – koeficient kontingence standardized residuals – standardizovaná rezidua Non-parametric - neparametrický Robust - robustní data assumptions – předpoklady ohledně charakteru dat sample distribution – rozložení hodnot proměnné ve vzorku (odlišovat od „sampling distribution“) Přednáška 12 – Analýza rozptylu multiple tests – mnohočetné (hromadné) porovnání, testy (fishing) capitalizing on chance – (rybaření v datech) zneužití pravděpodobnostního charakteru statistického testování hypotéz Bonferroni correction – Bonferroniho korekce statistical power – síla testu analysis of variance – analýza rozptylu post-hoc tests (multiple comparisons) – post-hoc testy repeated measures ANOVA - ANOVA pro opakovaná měření (jako párový t-test) two(three..)-way ANOVA - ANOVA s 2 a více faktory (faktoriální ANOVA) (factorial ANOVA) Přednáška 13 – Vícerozměrné metody multivariate techniques – vícerozměrné metody multiple regression – vícerozměrná regrese structural equation modeling – strukturální modelování latent variables – latentní (neměřené) proměnné discriminant analysis – diskriminační analýza logistic regression – logistická regrese factor analysis – faktorová analýza factor - faktor exploratory FA (=FA) confirmatory FA (=CFA) correlation matrix – korelační matice factor loading – faktorové náboje good structure – „dobrá struktura“ cluster analysis – shluková analýza similarity indices (measures) – ukazatele podobnosti --------------------------------------------------------------------------------- S láskou a značným sebezapřením zpracoval Mírek Zítků pod vlivem okolností (zkouška blízko, odpoledne u fotbálku, večer v Boru, tři piva, jedna kofola, myšlenky bludné) v noci z 29. na 30. května léta nebožkova Kristova 2007 Případné připomínky si nechte pro sebe…