Seminární úkol by měl obsahovat alespoň dvě tabulky. První z nich by měla obsahovat informace o průměrech (M) a směrodatných odchylkách (SD) všech kvantitativních proměnných, se kterými pracujete (prediktorů i závislé proměnné) a taky o korelacích mezi nimi (napravo od SD). Někdy se tato tabulka označuje jako „Matice nultého řádu“ (Zero-order matrix). Pod tabulkou bývají obvykle uvedena velikost vzorku (N), pro kterou byly korelace počítány, pokud pracujeme metodou listwise (pracujeme pouze s případy, které nemají ve sledovaných proměnných žádnou chybějící hodnotu). Na diagonále (která nyní obsahuje pouze „–“) bývají často uvedeny odhady reliability – pak je potřeba v poznámce pod tabulkou uvést např. „Na diagonále jsou uvedeny odhady reliability (Cronbachovo α). Pokud pracujeme metodou listwise, bývají napravo od diagonály (která nyní obsahuje prázdné buňky) uvedeny počty případů, pro které je počítána konkrétní korelace (protože se tyto počty mohou lišit pro různé páry proměnných). Dále mohou být v poznámce pod tabulkou uvedeny vysvětlivky jednotlivých proměnných (např. „STAI – State-Trait Anxiety Inventory“ atd.), pokud jsou v samotné tabulce označeny zkratkami. V tabulce uveďte původní subškály REI i jejich skór vzniklý jejich sloučením. Tabulka 1 Průměry, směrodatné odchylky a Pearsonovy korelace mezi proměnnými Proměnné M SD 1. 2. 3. 4. 5. 6. 1. Proměnná 1 14,07 1,99 – 2. Proměnná 2 2,27 0,90 0,37 – 3. Proměnná 3 2,01 0,47 0,06 0,18 – 4. Proměnná 4 7,65 0,66 0,12 0,56 0,45 – 5. Proměnná 5 1,04 0,15 0,65 0,14 0,15 0,10 – 6. Proměnná 6 3,06 0,48 0,09 –0,05 –0,52 0,18 0,32 – N = 200. Tabulka s odhady regresních koeficientů může vypadat jako Tabulka 2. · První sloupec obsahuje kroky a prediktory vložené v daném kroku. „Konstanta“ je totéž co „průsečík“ (intercept) a udává očekávanou hodnotu závislé proměnné, který by měl všechny hodnoty ostatních prediktorů = 0. · B je nestandardizovaný regresní koeficient a udává očekávanou (predikovanou, „průměrnou“) změnu závislé proměnné při změně daného prediktoru o +1 jednotku, kontrolujeme-li vliv ostatních prediktorů (tj. kdyby hodnoty ostatních prediktorů zůstaly konstantní), jak ostatně vyplývá z rovnice vícenásobné regrese. V psychologii se často B špatně interpretuje, protože psychologické proměnné nemají žádnou „hmatatelnou“ jednotku, jako např. ve fyzice hmotnost nebo délka. · CI je interval spolehlivosti (měl by se rovnat 1 – zvolená hladina alfa) pro B. · SE B je standardní chyba B (v SPSS „Std. Error“) regresního koeficientu. · β je standardizovaný regresní koeficient. Podobá se B, ale je v metrice směrodatných odchylek. Jedná se tedy o očekávanou (predikovanou, „průměrnou“) změnu závislé proměnné v z-skórech při změně hodnoty prediktoru o +1 směrodatnou odchylku (daného prediktoru), kontrolujeme-li vliv ostatních prediktorů. Obvykle nabývá β hodnot od –1 do +1 a jeho velikost se interpretuje podobně jako velikost korelace, v případě multikolinearity mezi prediktory se ale může pohybovat mimo toto rozmezí (zejm. pokud určité prediktory silně korelují navzájem a zároveň silně korelují se závislou proměnnou) a jeho interpretace jeho velikosti je obtížnějš · t je testová statistika pro parciální t-test, který ověřuje nulovou hypotézu, že B = 0. Její hodnota odpovídá B / SE B a stupně volnosti = N – počet prediktorů (včetně konstanty). · p je p-hodnota (v SPSS značeno „Sig.“) pro tento t-test. · r[sp] je semiparciální korelace. V SPSS se nachází v tabulce „Coefficients“ ve sloupci „Correlations – Part“. Kdybychom ji umocnili na druhou, říká nám, jaký podíl rozptylu sdílí daný prediktor „očištěný“ o efekt ostatních prediktorů (tj. kdybychom z daného prediktoru odfiltrovali rozptyl vysvětlitelný ostatními prediktory) s naší závislou proměnnou. · ΔR^2 je přírůstek vysvětleného rozptylu (v SPSS „R Square Change“). Tj. o kolik se zvýšil vysvětlený rozptyl ve srovnání s modelem v předchozím kroku. Hvězdičkami je (kvůli úspoře místa) vyznačena jeho statistická významnost (srovnáním p-hodnoty s konvenčními hladinami 0,05, 0,01 a 0,001, v případě p > 0,05 by nebyly uvedeny žádné *). · Pod tabulkou je znovu uvedena velikost vzorku (N) a význam hvězdiček. Také zde mohou být vysvětlivky zkratek proměnných, ale pokud již jsou vysvětleny jinde, stačí zde uvést např. „Zkratky proměnných/prediktorů jsou vysvětleny v poznámce pod Tabulkou 1“. Tabulka 2 Vícenásobná lineární regrese s DOPLNIT jako závislou proměnnou Kroky a prediktory B 95% CI (B) SE B β t p r[sp] ΔR^2 Dolní Horní Krok 1^ 0,03* Konstanta 1,84 1,60 2,09 0,12 14,90 < 0,001 Proměnná 1 0,00 –0,02 0,02 0,01 –0,01 –0,24 0,807 0,01 Proměnná 2 0,09 0,05 0,13 0,02 0,17 4,22 < 0,001 0,03 Krok 2 0,27*** Konstanta 3,12 2,83 3,41 0,15 21,34 < 0,001 Proměnná 1 0,01 –0,01 0,03 0,01 0,04 1,21 0,227 0,01 Proměnná 2 0,06 0,03 0,10 0,02 0,12 3,52 < 0,001 0,04 Proměnná 3 –0,51 –0,57 –0,45 0,03 –0,52 –16,48 < 0,001 0,40 Proměnná 4 0,06 0,00 0,12 0,04 0,07 2,08 0,137 0,00 Pozn. N = 721. r[sp][ ]– semiparcinální korelace. *p < 0,05, **p < 0,01, ***p < 0,001 Tvorbu regresních modelů popište v textu např. takto: „Pomocí lineární regrese jsme analyzovali vztah mezi [zkoumané proměnné]. Závisle proměnnou bylo [závislá proměnná]. Předpokládali jsme, že [zde můžete připomenout své hypotézy]. [Vyjádření k předpokladům] V prvním kroku jsme jako prediktory vložili [prediktory vložené v prvním kroku]. Model v kroku 1 byl statisticky významný, F(2; 718) = 10,22, p < 0,001, ale vysvětloval nízký podíl rozptylu (R^2 = 0,03, adj. R^2 = 0,02). Jediným signifikantním prediktorem byla Proměnná 2, ale její efekt byl poměrně nízký (β = 0,17, p < 0,001). V kroku 2 jsme jako prediktory přidali …, což vedlo k signifikantnímu nárůstu vysvětleného rozptylu, ΔR^2 = 0,27, F(2; 716) = 136,24, p < 0,001. Celkový model v kroku 2 byl statisticky významný, F(4; 716) = 75,16, p < 0,001, a vysvětloval přibližně třetinu rozptylu [závislé proměnné], R^2 = 0,30, adj. R^2 = 0,29. Výrazný a signifikantní efekt na [závislá proměnná] zde měla zejména Proměnná 3 (β = 0,17, p < 0,001), efekt Proměnné 2 zůstal slabý, ale signifikantní (β = 0,17, p < 0,001). Efekty ostatních prediktorů byly velmi slabé a nesignifikantní. Odhady parametrů jednotlivých modelů podrobněji ukazuje Tabulka 2.“ (Můžete se podívat také na verbalizaci výsledků v Morganové et al.) F-testy celkových modelů (ověřujících nulovou hypotézu R^2 = 0) jsou v SPSS v tabulce ANOVA. V sloupci df jsou stupně volnosti pro model (df Regression) a rezidua (df Residual), které se uvádějí za testovou statistiku F do závorky a odděleny jsou středníkem. Dále uvádíme testovou statistiku F (v SPSS ve stejnojmenném sloupci), a p-hodnotu (v SPSS „Sig.“). F-testy pro přírůstek vysvětleného rozptylu (tj. ověřujících nulovou hypotézu ΔR^2 = 0) jsou uvedeny v tabulce „Model Summary“ pod „Change Statistics“. Opět uvádíme stupně volnosti pro model a rezidua („df1“ a „df2“), testovou statistiku F a p-hodnotu („Sig. F Change“) Nezapomeňte se také vyjádřit k předpokladům: jaký předpoklad jste ověřovali prostřednictvím čeho a k čemu jste dospěli, např. „Normalitu reziduí jsme ověřili pomocí jejich histogramu a P-P grafu. Inspekce těchto grafů ukázala, že rozložení reziduí je pouze mírně levostranně zešikmené.“ Přehledný souhrn všech předpokladů a postup jejich ověření je ve Fieldovi vždy v konkrétní kapitole o daném testu/modelu.