Autoři: RNDr. Eva Koriťáková, Ph.D., Bc. Lucie Nekvindová, Bc. Veronika Prelecová Institut biostatistiky a analýz, Lékařská fakulta, Masarykova univerzita, Brno 1 Manuál pro analýzu dat v softwaru SPSS Software SPSS je produkt IBM (http://www.ibm.com/analytics/us/en/technology/spss/). SPSS je dostupné v rámci MU z https://inet.muni.cz/auth/login (login stejný jako do www.is.muni.cz, seznam dostupných softwarů lze najít v oddílu Provozní služby -> Software). Načtení datového souboru File -> Open -> Data -> vybrat datový soubor -> pokud načítáme excelovský soubor, nezapomenout změnit Files of type na Excel (*.xls, *.xlsx, *.xlsm) -> Open -> ve Worksheet vybrat požadovaný list excelovského souboru -> nechat zatržené Read variable names from first row of data -> OK Uložení datového souboru File -> Save as -> zadat název souboru -> Save 1. Vizualizace dat Vytváření grafů pomocí záložky Graphs. Koláčový graf Graphs -> Legacy Dialogs -> Pie -> Summaries for groups of cases -> Define -> Define Slices by: zvolit proměnnou (např. Gender) -> OK Pozn.: Po dvojím kliknutí na graf se nám ukáže okno Chart Editoru, kde lze přidat název grafu (Options -> Title), měnit barvu či ohraničení grafu a upravovat či nastavovat další parametry Sloupcový graf (na ose y počty lidí) Graphs -> Legacy Dialogs -> Bar -> Nechat zatržené Simple a Summaries for groups of cases -> Define -> Category Axis: zvolit proměnnou (např. Group) -> OK Sloupcový graf (na ose y procenta) Graphs -> Legacy Dialogs -> Bar -> Nechat zatržené Simple a Summaries for groups of cases -> Define -> Category Axis: zvolit proměnnou (např. Group) -> místo N of cases zatrhnout % of cases -> OK Histogram (na ose y počty lidí) Graphs -> Legacy Dialogs -> Histogram -> Variable: zvolit proměnnou (např. Age) -> OK Pozn.: Dále lze zatrhnout Display normal curve a lze vykreslit histogramy podle kategoriální proměnné tím, že se kategoriální proměnná přetáhne do Rows nebo Columns Histogram (na ose y procenta) Graphs -> Chart Builder -> OK -> Gallery: Histogram -> přetáhnout požadovaný graf do okna výše -> požadovanou proměnnou (např. Age) přetáhnout do pole X-Axis? pod grafem (viz. Obr. 1) -> Element Properties -> Statistic: Histogram Percent -> případně zaškrtnout Display normal curve -> Apply -> Close -> OK Pozn.: Dále lze v Chart Builder vykreslit histogramy podle kategoriální proměnné kliknutím na záložku Groups/Point ID, zatrhnutím Rows panel variable nebo Columns panel variable a dále přetáhnutím vybrané kategoriální proměnné do políčka Panel? Krabicový graf Graphs -> Legacy Dialogs -> Boxplot -> Nechat zatržené Simple a zatrhnout Summaries of separate variables -> Define -> Boxes Represent: zvolit proměnnou (např. Age) -> OK Autoři: RNDr. Eva Koriťáková, Ph.D., Bc. Lucie Nekvindová, Bc. Veronika Prelecová Institut biostatistiky a analýz, Lékařská fakulta, Masarykova univerzita, Brno 2 Obr. 1: Dialogové okno Chart editoru pro vytvoření grafu Autoři: RNDr. Eva Koriťáková, Ph.D., Bc. Lucie Nekvindová, Bc. Veronika Prelecová Institut biostatistiky a analýz, Lékařská fakulta, Masarykova univerzita, Brno 3 2. Příprava dat pro analýzu Nastavení formátu u MMSE na numerickou proměnnou 1. způsob: Přejít na Variable View a u vybrané proměnné ve sloupci Type rozkliknout tlačítko se třemi tečkami -> zatrhnout Numeric -> OK -> u vybrané proměnné přejít do sloupce Measure -> vybrat Scale 2. způsob: Data -> Define Variable Properties -> Variables to Scan: zvolit proměnnou (MMSE) -> Continue -> Type: vybrat Numeric -> Measurement Level: vybrat Scale -> OK Nastavení formátu u scan_date na datum 1. způsob: Přejít na Variable View a kliknout u vybrané proměnné do sloupce Type -> zatrhnout Date -> v pravém okně z nabídky vybrat format (např. dd-mmm-yyyy) 2. způsob: Data -> Define Variable Properties -> Variables to Scan: zvolit proměnnou (scan_date) -> Continue -> Type: vybrat Date a formát (např. dd-mmm-yyyy) -> Measurement Level: vybrat např. Scale nebo Ordinal -> OK Úprava počtu desetinných míst u Weight Přejít na Variable View a kliknout a nastavit Decimals např. na hodnotu 1 Identifikace duplikací Data -> Identify Duplicate Cases -> Define matching cases by: vybrat proměnnou (ID) -> Sort within matching groups by: vybrat proměnnou (např. scan_date) -> Sort: Ascending -> nechat zaškrtnuté Indicator of primary cases a Last case in each group is primary -> lze ponechat název Name: PrimaryLast Pozn.: Výsledkem je proměnná PrimaryLast, která primární záznamy označuje hodnotou 1 a duplikátní hodnotou 0. Je patrné, že jako primární je definován záznam s nejnovějším datumem. Pokud chceme, aby byl jako primární záznam označen ten s nejstarším datumem, tak zaškrtneme First case in each group is primary -> lze ponechat název Name: PrimaryFirst Odstranění duplikací: Data -> Select cases -> zaškrtnout Use filter variable -> do okénka přetáhnout proměnnou identifikující primární a duplikátní záznamy (např. PrimaryFirst) -> zaškrtnout Delete unselected cases Odstranění chybějících a chybných hodnot Data -> Select cases -> zatrhnout If condition is satisfied -> kliknout na tlačítko If -> do okénka zapsat podmínky (např. MISSING(Age)=0 & Age <=110 & MISSING(Weight)=0 -> Continue -> zaškrtnout Delete unselected cases -> OK Rekódování proměnné Gender, aby obsahovala pouze hodnoty F a M 1. způsob – ručně: Najít si řádek s hodnotou FF a hodnotu FF přepsat na F 2. způsob – vytvořením nové proměnné: Transform -> Recode into Different Variables -> do okénka Input Variable přetáhnout proměnnou Gender -> Name: zadat název nové proměnné (např. Gender_rek) -> Change -> kliknout na tlačítko Old and New Values -> v oddílu Old Value zadat Value: FF -> zatrhnout Output variables are strings -> v oddílu New Value zadat Value: F -> Add -> v oddílu Old Value zatrhnout All other values -> v oddílu New Value zatrhnout Copy old values -> Add -> Continue -> OK 3. způsob – pozměněním původní proměnné: Transform -> Recode into Same Variables -> do okna Variables přetáhnout proměnnou Gender -> Old and New Values -> v sekci Old Value vepsat Value: FF -> v sekci New Value vepsat Value: F -> Add -> Continue -> OK Autoři: RNDr. Eva Koriťáková, Ph.D., Bc. Lucie Nekvindová, Bc. Veronika Prelecová Institut biostatistiky a analýz, Lékařská fakulta, Masarykova univerzita, Brno 4 Rekódování proměnné Group, aby obsahovala pouze hodnoty 1 (CN), 2 (MCI) a 3 (AD) Transform -> Recode into Different Variables -> do okénka Input Variable přetáhnout proměnnou Group -> Name: zadat název nové proměnné (např. Group_3kat) -> Change -> Old and New Values -> v oddílu Old Value zadat Value: 4 -> v oddílu New Value zadat Value: 3 -> Add -> v oddílu Old Value zadat 3 -> v oddílu New Value zadat 2 -> Add -> v oddílu Old Value zatrhnout All other values -> v oddílu New Value zatrhnout Copy old values -> Add -> Continue -> OK Obr. 2: Ukázka rekódování proměnné do jiné proměnné Vytvoření textových popisků u kvalitativní proměnné Přejít do Variable View -> kliknout u příslušné proměnné (Group_3kat) do okénka Value a rozkliknout tlačítko se třemi tečkami -> Value: 1, Label: CN -> Add -> Value: 2, Label: MCI -> Add -> Value: 3, Label: AD -> Add -> OK Pozn. 1: Při zadávání textových popisků nepíšeme uvozovky, doplní se samy. Pozn. 2: Hodnoty a testové popisky lze přepínat v hlavním panelu pomocí tlačítka. Autoři: RNDr. Eva Koriťáková, Ph.D., Bc. Lucie Nekvindová, Bc. Veronika Prelecová Institut biostatistiky a analýz, Lékařská fakulta, Masarykova univerzita, Brno 5 3. Popisná sumarizace dat Popisná sumarizace dat pomocí Analyze -> Descriptive Statistics Popisná sumarizace kvalitativních dat – frekvenční tabulka 1. způsob: Analyze -> Descriptive Statistics -> Frequencies -> Variables: zvolit proměnnou (např. Group) -> OK 2. způsob: Kliknout pravým tlačítkem na název proměnné (např. Group) v Data View nebo Variable View -> Descriptive Statistics Popisná sumarizace kvantitativních dat 1. způsob: Analyze -> Descriptive Statistics -> Descriptives -> Variables: zvolit proměnnou (např. Age) -> OK Pozn.: Automaticky se vypisuje průměr, směrodatná odchylka, minimum a maximum, lze vybrat též rozptyl, rozsah či standardní chybu, pokud bychom vypsat medián, lze využít následující tři postupy. 2. způsob: Analyze -> Tables -> Custom Tables -> OK -> vybrané proměnné přetáhnout do pravého okna (do Rows nebo Columns) -> Summary Statistics -> zvolit např. Valid N, Mean, Std. Deviation, Median, Minimum, Maximum -> Apply to Selection -> Close -> OK Obr. 3: Popisná sumarizace pomocí Custom Tables 3. způsob: Analyze -> Descriptive Statistics -> Explore -> Dependent List: vybrat proměnné -> zatrhnout Statistics -> OK 4. způsob: Kliknout pravým tlačítkem na název proměnné (např. Age) v Data View nebo Variable View -> Descriptive Statistics Popisná sumarizace – zapnutí filtru (vyfiltrování posledních 20 pacientů) Data -> Select Cases -> zatrhnout Based on time or case range -> Range -> vyplnit First Case: 813, Last Case: 833 -> Continue -> zatrhnout Filter out unselected cases -> OK Analyze -> Descriptive Statistics -> Descriptives -> Variables: zvolit proměnnou (např. Age) -> OK Pozn.: Nezapomenout poté vypnout filtr Data -> Select Cases -> All cases -> OK Autoři: RNDr. Eva Koriťáková, Ph.D., Bc. Lucie Nekvindová, Bc. Veronika Prelecová Institut biostatistiky a analýz, Lékařská fakulta, Masarykova univerzita, Brno 6 4. Transformace dat Logaritmická transformace Transform -> Compute Variable -> Target Variable: název nové proměnné (např. Weight_log) -> Function group: Arithmetic -> Functions and Special Variables: vybrat Ln a přetáhnout do okna Numeric Expresssion -> do argumentu funkce vložíme vybranou proměnnou (např. Weight) Obr. 4: Ukázka transformace proměnné na novou proměnnou pomocí Compute Variable Standardizace dat Analyze -> Descriptive Statistics -> Descriptives -> Variables: vybrat proměnné -> zatrhnout Save standardized values as variables -> OK Centrování dat Transform -> Compute Variable -> Target Variable: zadat jméno nové proměnné (např. Height_centr) -> Numeric Expression: vybrat proměnnou, kterou chceme centrovat a přidat minus průměrná hodnota (např. Height-175.97) Kategorizace Transform -> Visual Binning -> Variables to Bin: vybrat proměnnou (např. Age) -> Continue -> Binned Variable: název nové proměnné (např. Age_kat) -> Make Cutpoints -> vyplnit First Cutpoint Location: 60, Number of Cutpoints: 3, Width: 10 -> Apply -> Upper Endpoints: zatrhnout Excluded (<) -> kliknout na Make Labels -> OK Autoři: RNDr. Eva Koriťáková, Ph.D., Bc. Lucie Nekvindová, Bc. Veronika Prelecová Institut biostatistiky a analýz, Lékařská fakulta, Masarykova univerzita, Brno 7 Obr. 5: Ukázka kategorizace proměnné pomocí Visual Binning 5. Intervaly spolehlivosti Výpočet intervalu spolehlivosti a střední chyby průměru (standard error) Analyze -> Tables -> Custom Tables -> OK -> do okna vpravo přetáhnout vybrané proměnné (buď do Rows, nebo Columns) -> Summary Statistics -> zvolit Mean, Lower CL for Mean, Upper CL for Mean, Standard Error of Mean -> Apply to Selection -> Close -> OK 6. Statistické testy pro kvantitativní data – parametrické testy Jednovýběrový t-test Analyze -> Compare Means -> One-Sample T test -> Test Variables: zvolit proměnnou (např. Hippocampus volume (mm3)) -> Test Value: vyplnit 6575 -> OK Párový t-test Analyze -> Compare Means -> Paired-Samples T Test -> Paired Variables: přesunout vybrané proměnné (např. Hippocampus_volume (mm3) jako Variable1 a Hippocampus_volume_24 (mm3) jako Variable2) -> OK Dvouvýběrový t-test Analyze -> Compare Means -> Independent-Samples T Test -> Test Variables: zvolit proměnnou (např. Putamen_volume (mm3)) -> Grouping Variable: zvolit proměnnou (např. Gender_rek) -> Define Groups -> doplnit Group 1: F a Group 2: M -> Continue -> OK Autoři: RNDr. Eva Koriťáková, Ph.D., Bc. Lucie Nekvindová, Bc. Veronika Prelecová Institut biostatistiky a analýz, Lékařská fakulta, Masarykova univerzita, Brno 8 Analýza rozptylu (ANOVA) a post-hoc testy Analyze -> Compare Means -> One-Way ANOVA -> Dependent List: zvolit proměnnou (např. Hippocampus_volume (mm3)) -> Factor: zvolit proměnnou (např. Group_3kat) -> Options -> zatrhnout Homogenity of variance test a Brown-Forsythe -> Continue -> Post Hoc -> zatrhnout Tukey (v případě vyrovnaných počtů subjektů ve skupinách) nebo Scheffe (pro stejné i nestejné počty subjektů ve skupinách) -> Continue -> OK 7. Statistické testy pro kvantitativní data – neparametrické testy Wilcoxonův test – jednovýběrový Analyze -> Nonparametric Tests -> One Sample -> na záložce Objective zatrhnout Customize analysis -> na záložce Fields do pole Test Fields přesunout proměnnou, kterou chceme testovat (např. MMSE) -> na záložce Settings zatrhnout Customize tests -> zatrhnout Compare median to hypothesized -> Hypothesized median: doplnit 27,5 -> Run Wilcoxonův test – párový 1. způsob: Analyze -> Nonparametric Tests -> Related Samples -> na záložce Objective zatrhnout Customize analysis -> na záložce Fields do pole Test Fields přesunout proměnné, které chceme testovat (např. MMSE a MMSE_24) -> na záložce Settings zatrhnout Customize tests -> Wilcoxon matched-pair signed-rank (2 samples) -> Run Pozn.: Chceme-li jinou neparametrickou obdobu párového t-testu, můžeme zvolit znaménkový test zaškrtnutím Sign Test (2 samples) 2. způsob: Analyze -> Nonparametric Tests -> Legacy Dialogs -> 2 Related Samples -> Test Pairs: vložit proměnné (např. MMSE a MMSE_24) -> Test Type: Wilcoxon (případně Sign) -> OK Mannův-Whitneyův test 1. způsob: Analyze -> Nonparametric Tests -> Independent Samples -> na záložce Objective zatrhnout Customize analysis -> na záložce Fields do pole Test Fields přesunout proměnnou, kterou chceme testovat (např. Hippocampus_volume (mm3)) a do pole Groups přesunout grupovací proměnnou (např. Gender_rek) -> na záložce Settings zatrhnout Customize tests -> Mann-Whitney U (2 samples) -> Run 2. způsob: Analyze -> Nonparametric Tests -> Legacy Dialogs -> 2 Independent Samples -> Test Variable List: vybrat proměnné (např. Hippocampus_volume (mm3)) -> Grouping Variable: vybrat grupovací proměnnou, která musí být typu numeric (např. Gender_rek2) -> Define Groups -> doplnit Group 1: 1, Group 2: 2 -> Continue -> OK Pozn.: textovou proměnnou lze změnit na proměnnou s číselnými kategoriemi pomocí Transform -> Automatic Recode -> vybrat proměnnou (např. Gender_rek) -> New Name: vyplnit název nové proměnné (např. Gender_rek2) -> Add New Name -> OK Kruskalův-Wallisův test 1. způsob: Analyze -> Nonparametric Tests -> Independent Samples -> na záložce Objective zatrhnout Customize analysis -> na záložce Fields do pole Test Fields přesunout proměnnou, kterou chceme testovat (např. Hippocampus_volume (mm3)) a do pole Groups přesunout grupovací proměnnou (např. Group_3kat) -> na záložce Settings zatrhnout Customize tests -> Kruskal-Wallis 1-way ANOVA (k samples) -> Run Autoři: RNDr. Eva Koriťáková, Ph.D., Bc. Lucie Nekvindová, Bc. Veronika Prelecová Institut biostatistiky a analýz, Lékařská fakulta, Masarykova univerzita, Brno 9 2. způsob: Analyze -> Nonparametric Tests -> Legacy Dialogs -> K Independent Samples -> Test Variable List: vybrat proměnné (např. Hippocampus_volume (mm3)) -> Grouping Variable: vybrat grupovací proměnnou (např. Group_3kat) -> Define Range: doplnit rozsah grupovací proměnné Minimum: 1, Maximum: 3 -> Continue -> OK Pozn.: Post hoc testy ke Kruskal-Wallis ANOVě počítané 2. způsobem v SPSS neexistují, je možné to řešit sadou Mannových-Whitneyových testů (manuálně je pak nutno provést Bonferroniho korekci) 8. Ověření předpokladů statistických testů Vykreslení Q-Q grafu pro jednotlivé skupiny 1. způsob: Analyze -> Descriptive Statistics -> Q-Q Plots -> Variables: zvolit proměnnou (např. Hippocampus_volume (mm3)) -> Test Distribution: Normal -> OK Pozn.: Nelze pomocí tohoto způsobu nastavit grupovací proměnnou. 2. způsob: Analyze -> Descriptive Statistics -> Explore -> Dependent List: zvolit proměnné (např. Hippocampus_volume (mm3)) -> Factor List: vybrat grupovací proměnnou (např. Gender_rek) -> Plots -> odtrhnout Stem-and-leaf a zatrhnout Normality plots with tests (a případně i Histogram) -> Continue -> Display: zatrhnout Plots -> OK 9. Další užitečné příkazy Popisná sumarizace kvantitativní proměnné podle kategorií kvalitativní proměnné Analyze -> Tables -> Custom tables -> OK -> Columns: přetáhnout kvantitativní proměnnou (např. Hippocampus_volume (mm3)) -> Summary Statistics: zvolit např. Valid N, Mean, Std. Deviation, Median, Minimum, Maximum -> Apply to Selection -> Close -> Rows: přetáhnout kvalitativní proměnnou (např. Gender_rek) -> Categories and Totals -> lze zaškrtnout Total (sumarizace pro všechny kategorie dohromady) -> Apply -> OK Pozn.: Pokud chceme zobrazit popisné statistiky do řádků, stačí zvolit Position: Rows Vytvoření šablony grafů Upravit si graf do finální podoby v Chart Editor -> File -> Save Chart Template -> zaškrtnout, která nastavení se mají uložit -> Continue -> File name: pojmenovat šablonu -> vybrat adresář, kam se to uloží -> Save Úprava grafu podle šablony 2x kliknout do grafu -> Chart Editor -> File -> Apply Chart Template -> vybrat styl -> Open Rozdělení souboru pomocí SPLIT FILE Data -> Split File... -> zatrhnout Organize output by groups -> zvolit proměnnou (např. Group_3kat) do Groups Based on: -> OK Zrušení rozdělení souboru Data -> Split File... -> zatrhnout Analyze all cases, do not create groups -> OK Autoři: RNDr. Eva Koriťáková, Ph.D., Bc. Lucie Nekvindová, Bc. Veronika Prelecová Institut biostatistiky a analýz, Lékařská fakulta, Masarykova univerzita, Brno 10 10.Analýza kontingenčních tabulek Kontingenční tabulka absolutních četností Analyze -> Descriptive Statistics -> Crosstabs -> Rows (select variables) (např. Group_3kat) -> Columns (select variables) (např. Age_kat) -> Cells -> na záložce Counts zatrhnout Observed -> Continue ->OK Kontingenční tabulka procent Analyze -> Descriptive Statistics -> Crosstabs -> Rows (select variables) (např. Group_3kat) -> Columns (select variables) (např. Age_kat) -> Cells -> na záložce Percentages zatrhnout Row, Columns nebo Total -> Continue -> OK Pokud chceme kontingenční tabulku jenom procent Analyze -> Descriptive Statistics -> Crosstabs -> Rows (select variables) (např. Group_3kat) -> Columns (select variables) (např. Age_kat) -> Cells -> na záložce Percentages zatrhnout Row, Columns nebo Total -> na záložce Counts nesmí být zatrhnuté nic -> Continue -> OK Kontingenční tabulka – očekávané četnosti Analyze -> Descriptive Statistics -> Crosstabs -> Rows (select variables) (např. Group_3kat) -> Columns (select variables) (např. Age_kat) -> Cells -> na záložce Counts zatrhnout Expected -> Continue ->OK Pearsonův chí-kvadrát test Analyze -> Descriptive Statistics -> Crosstabs -> Rows (select variables) (např. Group_3kat) -> Columns (select variables) (např. Age_kat) -> Statistics -> zatrhnout Chi-square -> Continue -> OK Fisherův exaktní test Analyze -> Descriptive Statistics -> Crosstabs -> Rows (select variables) (např. Group_3kat) -> Columns (select variables) (např. Age_kat) -> Statistics -> zatrhnout Chi-square -> Continue -> Exact > zatrhnout Exact -> Continue -> OK McNemarův test Analyze -> Descriptive Statistics -> Crosstabs -> Rows (select variables) (např. mmse_kat) -> Columns (select variables) (např. mmse_24_kat) -> Statistics -> zatrhnout McNemar -> Continue -> OK Relativní riziko (RR) a poměr šancí (OR) Analyze -> Descriptive Statistics -> Crosstabs -> Rows (select variables) (např. mmse_kat) -> Columns (select variables) (např. Gender) -> Statistics -> zatrhnout Risk -> Continue -> OK !!!Pozor lze vypočítat pouze pro tabulky 2x2. Relativní riziko (RR) a poměr šancí (OR) včetně p-hodnoty Analyze -> Regression -> Binary Logistic -> vybrat závisle proměnnou a kovariátu -> Categorical (lze zvolit, zda je referenční kategorie Last nebo First; při změně kliknout na Change) -> Options (zatrhnout CI for exp(B), aby se vypsaly intervaly spolehlivosti) ->Continue ->OK Autoři: RNDr. Eva Koriťáková, Ph.D., Bc. Lucie Nekvindová, Bc. Veronika Prelecová Institut biostatistiky a analýz, Lékařská fakulta, Masarykova univerzita, Brno 11 11.ROC analýza I. Analyze -> ROC Curve -> zadat Test Variable a State Variable (jako Value of State Variable zadat rizikovou kategorii) -> na záložce Options lze zvolit, zda „Larger test result indicates more positive test” nebo „Smaller test result indicates more positive test” -> Continue II. Pokud chceme vypočítat k AUC intervaly spolehlivosti a p-hodnotu: zatrhnout „Standard erorr and confidence interval “ III. Pokud chceme získat tabulku se senzitivitou a 1-specificitou: zatrhnout „Coordinate points of the ROC Curve“ IV. Pro zjištění cut-off (nejlepšího dělícího bodu) je nutné tabulku s 1-specificitou zkopírovat do Excelu, vypočítat specificitu a nalézt nejlepší cut-off a to následovně: a. kliknout levým tlačítkem myši na tabulku -> Copy -> vložit do Excelu b. v Excelu spočítat specificitu (tzn. udělat 1-(sloupeček s 1-Specificity)) a pak spočítat součet senzitivity a specificity -> vybrat řádek s největší hodnotou součtu senzitivity a specificity -> to je nejlepší cut-off V. Vytvoření kategorizovaného MMSE skóre s využitím cut-off: Transform -> Recode into Different Variables -> pojmenovat novou proměnnou (např. mmse_kat3) v Output Variable a kliknout Change -> Old and New Values -> do Range, LOWEST through value napsat 28,5 -> do New Value (Value) napsat 1 -> Add -> kliknout na All other values -> do New Value (Value) napsat 0 -> Add -> Continue -> OK VI. Ověření vypočítané senzitivity a specificity: Analyze -> Descriptive Statistics -> Crosstabs -> do Rows (např. mmse_kat3) do Columns (např. group_01_CnMci)-> Cells -> na záložce Precentages zatrhnout Column -> Continue -> OK -> senzitivita je tady procento v levém dolním rohu, specificita je procento v pravém horním rohu – záleží ale na nakódování dat a v Rows musí být výsledek diagnostického testu a v Columns skutečnost 12.Korelační analýza Bodový graf (“Scatterplot”) Graphs -> Legacy Dialogs -> Scatter/Dot... -> zvolit Simple Scatter -> Define -> zvolit proměnné (např. Putamen_volume (mm3) jako X a Amygdala_volume (mm3) jako Y -> OK Výpočet Pearsonova korelačního koeficientu Analyze -> Correlate -> Bivariate -> zvolit proměnné (např. Amygdala_volume (mm3) a Putamen_volume (mm3)) -> v sekci Correlation Coefficients zatrhnout Pearson -> OK Výpočet Pearsonova korelačního koeficientu – 2. způsob Analyze -> Descriptive Statistics -> Crosstabs -> zvolit proměnné (např. Amygdala_volume (mm3) a Putamen_volume (mm3)) -> Statistics -> zatrhnout Correlations -> Continue -> je vhodné zatrhnout Supress tables -> OK Poznámka: Spočte to zároveň i Spearmanův korelační koeficient Výpočet Spearmanova korelačního koeficientu Analyze -> Correlate -> Bivariate -> zvolit proměnné (např. MMSE a Hippocampus_volume (mm3)) -> v sekci Correlation Coefficients zatrhnout Spearman -> OK Autoři: RNDr. Eva Koriťáková, Ph.D., Bc. Lucie Nekvindová, Bc. Veronika Prelecová Institut biostatistiky a analýz, Lékařská fakulta, Masarykova univerzita, Brno 12 13.Regresní analýza Lineární regrese a odstranění vlivu kovariát Analyze -> Regression -> Linear -> zvolit proměnné (např. Nucl_caud_volume (mm3) jako Dependent, Age... jako Independent(s)) -> OK -> vypíše regresní koeficienty a p-hodnoty - Vykreslení Q-Q grafu a histogramu standardizovaných reziduí: na záložce Plots kliknout na *ZRESID a zaškrtnout Histogram -> Continue - Vykreslení Q-Q grafu a histogramu pro rezidua – 2. způsob: kliknout na Save a v sekci Residuals zaškrtnout Standardized či Unstandardized -> Continue -> OK Analyze -> Descriptive Statistics -> Explore -> Dependent List (zvolit např. RES_1) -> Plots -> zaškrtnout Normality plots with tests a Histogram -> Continue -> OK - Vykreslení bodového grafu predikovaných hodnot a reziduí: na záložce Plots zvolit na Y osu *ZRESID a na osu X *ZPRED - Uložení reziduí a predikovaných hodnot: na záložce Save zaškrtnout při Predicted Values i při Residuals: Standardized nebo Unstandardized podle toho, co nám vyhovuje -> Continue -> OK 14.Analýza přežití Kaplanův-Meierův odhad funkce přežití pro jeden výběr Analyze -> Survival -> Kaplan-Meier... -> zvolit proměnné Time a Status (např. čas jako Time a úmrtí jako Status) -> kliknout na Define event (do Single value zvolit příslušnou hodnotu, která kóduje událost (většinou hodnota 1)) -> OK - Vykreslení křivky přežití: kliknout na Options a zatrhnout Survival v sekci Plots - Vypsání tabulky pro výpočet x-letého přežití: kliknout na Options a zatrhnout Survival table(s) v sekci Statistics - Vypsání tabulky s mediánem přežití: kliknout na Options a zatrhnout Mean and median survival v sekci Statistics Kaplanův-Meierův odhad funkce přežití pro více výběrů Analyze -> Survival -> Kaplan-Meier -> zvolit proměnné Time a Status (např. čas jako Time a úmrtí jako Status) -> kliknout na Define event (do Single value zvolit příslušnou hodnotu, která kóduje událost (většinou hodnota 1)) -> zvolit Factor (proměnná podle které chceme rozdělit data do skupin) -> OK - Vykreslení křivek přežití: kliknout na Options a zatrhnout Survival v sekci Plots - Výpočet testu na srovnání přežití ve skupinách: kliknout na Compare Factor a zatrhnout Log rank v sekci Test Statistics - Vypsání tabulky pro výpočet x-letého přežití: kliknout na Options a zatrhnout Survival table(s) v sekci Statistics - Vypsání tabulky s mediánem přežití: kliknout na Options a zatrhnout Mean and median survival v sekci Statistics Coxův model proporcionálních rizik Analyze -> Survival -> Cox Regression -> zvolit proměnné Time, Status a Covariates (např. OS_doba_mesice jako Time, úmrtí jako Status a ECOG1 jako Covariates) -> kliknout na Define event (do Single value zvolit příslušnou hodnotu, která kóduje událost (většinou hodnota 1)) -> OK - Vykreslení křivek přežití: kliknout na Plots a zatrhnout Survival - Vypočtení interval spolehlivosti: kliknout na Options a zatrhnout CI for exp(B) v záložce Model Statistics