Téma 2.: Bodové a intervalové rozložení četností Nejprve budeme pracovat s datovým souborem znamky.sta, který obsahuje údaje o známkách z matematiky, angličtiny a pohlaví 20 studentů 1. ročníku (viz skripta Popisná statistika, příklad 2.4). Úkol 1.: Vytvořte a) sloupkový diagram absolutních četností znaků X a Y, b) polygon absolutních četností znaků X a Y c) graf četnostní funkce znaku X, d) graf empirické distribuční funkce znaku X. Návod: ad a) Grafy – Histogramy – Proměnné X, Y – OK- vypneme Normální proložení – Detaily–zaškrtneme Mezery mezi sloupci - OK. Sloupkový diagram pro znak X Sloupkový diagram pro znak Y ad b) V pracovním sešitu vstoupíme do tabulky rozložení četností proměnné X resp. Y. Nastavíme se na řádek označený ChD. Pomocí Případy – Odstranit vymažeme tento řádek. Nastavíme se kurzorem na Četnost - klikneme pravým tlačítkem – Grafy bloku dat – Spojnicový graf: celé sloupce. Vykreslí se polygon absolutních četností. Polygon absolutních četností pro znak X Polygon absolutních četností pro znak Y ad c) Při tvorbě histogramu vypneme Normální proložení, zadáme v Detailech Osa Y % - 2 x klikneme myší na pozadí grafu – vybereme Graf: Obecné – zaškrtneme Značky – vybereme Graf: Sloupce – Typ: Čáry, nastavíme čárkovanou čáru. Graf četnostní funkce pro znak X Pro znak Y ad d) Při tvorbě histogramu vypneme Normální proložení, zadáme v Detailech volbu Zobrazovaný typ: Kumulativní, Osa Y % - 2x klikneme myší na pozadí grafu – vybereme Graf: Sloupce – Typ: Obdélníky. Upozornění: V tomto grafu se objeví svislé čáry, které samozřejmě do grafu empirické distribuční funkce nepatří. Pro znak X Pro znak Y Úkol 2.: Vytvořte variační řady známek z matematiky a angličtiny pouze a) pro ženy, b) pro muže. Návod: ad a) Statistiky – Základní statistiky a tabulky – Tabulky četností – OK – Proměnné X, Y – OK – vybereme Select Cases - zaškrtneme Zapnout filtr – do okénka některé, vybrané pomocí výrazu zapíšeme Z = 0, OK, Výpočet. Variační řada známek z matematiky pro ženy: Variační řada známek z angličtiny pro ženy: ad b) Statistiky – Základní statistiky a tabulky – Tabulky četností – OK – Proměnné X, Y – OK – vybereme Select Cases - zaškrtneme Zapnout filtr – do okénka některé, vybrané pomocí výrazu zapíšeme Z = 1, OK, Výpočet. Variační řada známek z matematiky pro muže: Variační řada známek z angličtiny pro muže: Úkol 3.: Nadále budeme pracovat s celým datovým souborem. Vytvoříme kontingenční tabulku simultánních absolutních četností znaků X a Y a graf simultánní četnostní funkce. Návod: Statistiky – Základní statistiky/tabulky – odškrtneme Zapnout filtr – OK - Kontingenční tabulky – OK – Select cases –– Specif. tabulky - List 1 X, List 2 Y, OK, Výpočet. Vidíme, že ve výběrovém souboru byly 4 studenti, kteří měli z obou předmětů „výborně“, jeden student, který měl z matematiky „výborně“ a z angličtiny „velmi dobře“ atd. až 4 studenti, kteří z obou předmětů neprospěli. Vytvoření grafu simultánní četnostní funkce: Na liště aktivujeme Výsledky: kontingenční tabulky – Detaily - 3D histogramy. Vzniklý graf je třeba upravit: 2x klikneme myší na pozadí grafu – Rozvržení grafu – Typ – Špičky – OK. Upozornění: Ve Statistice verze 6 je třeba ručně měnit nastavení os X a Y. 2x klikneme myší na pozadí grafu – Osa: Měřítko – Mód: Ručně – Minimum 0 (a totéž provedeme pro Osu Y). Graf lze natáčet pomocí Zorného bodu. Úkol 4.: Vytvořte kontingenční tabulku sloupcově a řádkově podmíněných relativních četností znaků X a Y. Návod: Aktivujeme na liště Výsledky: kontingenční tabulky – Možnosti - zaškrtneme ve sloupci Výpočet tabulek volbu Procenta z počtu ve sloupci (resp. Procenta z počtu v řádku) – Výpočet. Kontingenční tabulka sloupcově podmíněných relativních četností : Interpretace např. 4. řádku ve 2. sloupci: V souboru byli 4 studenti, kteří měli velmi dobře z angličtiny. Mezi nimi byl jeden, který neprospěl z matematiky, což představuje 1/4 = 25%. Kontingenční tabulka řádkově podmíněných relativních četností: Interpretace např. 2. sloupce ve 4. řádku: V souboru bylo 8 studentů, kteří neprospěli z matematiky. Mezi nimi byl jeden, který měl velmi dobře z angličtiny, což představuje 1/8 = 12,5%. Nyní se budeme věnovat datovému souboru ocel.sta. Obsahuje údaje o mezi plasticity a mezi pevnosti 60 vzorků oceli (viz skripta Popisná statistika, příklad 2.13). Úkol 4.: Načteme soubor ocel.sta. Proměnným X a Y vytvoříme návěští „mez plasticity“ a „mez pevnosti“. Podle Sturgersova pravidla najdeme optimální počet třídicích intervalů pro znaky X a Y a vhodně stanovíme meze třídicích intervalů. Návod: Soubor – Otevřít – vybereme příslušný adresář se souborem ocel.sta – Otevřít. Kurzor nastavíme na X – 2x klikneme myší – Dlouhé jméno mez plasticity – OK, kurzor nastavíme na Y – 2x klikneme myší – Dlouhé jméno mez pevnosti – OK. Protože případů je 60, podle Sturgersova pravidla je optimální počet třídicích intervalů 7. Musíme zjistit minimum a maximum, abychom vhodně stanovili třídicí intervaly: Statistiky - Základní statistiky/tabulky – Popisné statistiky - OK - Proměnné X,Y – OK – Detailní výsledky – ponecháme zaškrtnuté Minimum&maximum – Výpočet. Pro X je minimum 33 a maximum 160, tedy dolní mez prvního třídicího intervalu volíme 30, horní mez posledního třídicího intervalu 170. Celkem tedy třídicí intervaly pro znak X budou: (30,50>, (50,70>, (70,90>, (90,110>, (110,130>, (130,150>, (150,170> Pro Y je minimum 52 a maximum 189, tedy dolní mez prvního třídicího intervalu volíme 50, horní mez posledního třídicího intervalu 190. Celkem tedy třídicí intervaly pro znak Y budou: (50,70>, (70,90>, (90,110>, (110,130>, (130,150>, (150,170>, (170,190>. Úkol 5.: Provedeme zakódování hodnot proměnných X a Y do příslušných třídicích intervalů. Všem hodnotám proměnné X, které leží v intervalu (30,50>, přiřadíme hodnotu 1 atd. až všem hodnotám proměnné X, které leží v intervalu (170,190>, přiřadíme hodnotu 7. Analogicky pro Y. Návod: Vytvoříme dvě nové proměnné: Vložit – Přidat proměnné – 2 – Za Y – OK – přejmenujeme je na RX a RY. Nastavíme se kurzorem na RX – Data – Překódovat - vyplníme podmínky pro všech 7 kategorií. (Pozor – podmínky píšeme ve tvaru X > 30 and X <= 50 atd.). Pak klepneme na OK. Analogicky překódujeme hodnoty proměnné Y do proměnné RY. Úkol 6.: Vytvoříme histogram pro X a pro Y. Návod: Grafy – Histogramy – Proměnné X – vypneme Normální proložení – Detaily – zaškrtneme Hranice – Určit hranice – 50 70 90 110 130 150 170 OK – OsaY %. Po vykres-lení histogramu lze 2 x klepnout na pozadí grafu a ve volbě Všechny možnosti měnit různé vlastnosti grafu. Histogram pro znak X Histogram pro znak Y Úkol 7.: Vytvoříme graf intervalové empirické empirické distribuční funkce pro X. Návod: Vytvoříme tabulku četností pro proměnnou RX. Před 1. případ vložíme dva řádky, u nichž do Kumulativní rel. četnost napíšeme 0. Do sloupce Kategorie napíšeme 10, 30, 50, …, 190: Nastavíme se kurzorem na Kumulativní rel. četnost – klikneme pravým tlačítkem – Grafy bloku dat – Vlastní graf bloku podle sloupce – Sloupcové grafy (Proměnné) – OK. Ve vytvořeném grafu odstraníme značky a změníme rozsah hodnot na vodorovné ose od 1 do 10. Úkol 8.: Nakreslíme dvourozměrný tečkový diagram pro (X,Y). Návod: Grafy – Bodové grafy – Proměnné X,Y – OK - vypneme Lineární proložení – OK. Vidíme, že mezi oběma proměnnými existuje určitý stupeň přímé lineární závislosti – s růstem hodnot meze plasticity vesměs rostou hodnoty meze pevnosti a naopak. Práce se systémem SPSS Bodové zpracování četností Otevřeme datový soubor znamky.sav. Vytvoření návěští jednotlivým proměnným a popis jejich variant se provádí v okně Variable View. Tabulku rozložení četností pro známky z matematiky získáme takto: Analyze – Descriptive Statistics – Frequencies – Variable X – OK. Dostaneme tabulku rozložení četností. Pro grafické znázornění četností do ni vstoupíme dvojklikem. Vezmeme do bloku absolutní četnosti variant 1, 2, 3, 4. Klikneme pravým tlačítkem – Create Graph – Bar. Spojnicový graf či výsečový diagram získáme tak, že v Create Graph vybereme Line resp. Pie. Vlastnosti grafu se dají měnit v Chart Editor, do něhož vstoupíme tak, že 2x klikneme myší na vytvořený graf. Graf četnostní funkce získáme tak, že v tabulce rozložení četností se nastavíme na Percent a v Create Graph vybereme Dot. Graf empirické distribuční funkce získáme tak, že tabulce rozložení četností se nastavíme na Cumulative Percent a v Create Graph vybereme Bar. Pak vstoupíme do Chart Editoru a změníme šířku sloupce na 100%. Chceme-li pracovat pouze s částí datového souboru (např. pouze se známkami z matematiky pro muže), jdeme do menu Data – Select Cases – If condition is satisfied – If – Z=1 – Continue – OK. Vytvoření kontingenční tabulky Kontingenční tabulku simultánních absolutních četností známek z matematiky a angličtiny vytvoříme tímto způsobem: Analyze – Descriptive Statistics – Crosstabs – Row(s) X, Column(s) Y – OK. Chceme-li získat simultánní relativní četnosti nebo řádkově či sloupcově podmíněné relativní četnosti, v Crosstabs zvolíme Cells a zaškrtneme Percentages Total resp. Row resp. Column. Složený sloupkový diagram dostaneme tak, že v Crosstabs zaškrtneme Display clustered charts. Intervalové zpracování četností Otevřeme datový soubor ocel.sav. V úkolu 4 jsme zjistili, že hodnoty znaku X (tj. meze plasticity) je vhodné roztřídit do 7 třídicích intervalů: (30,50>, (50,70>, (70,90>, (90,110>, (110,130>, (130,150>, (150,170> Provedeme zakódování hodnot znaku X do těchto třídicích intervalů. Transform – Recode into Different Variables – Numeric Variable X, Output variable RX – Change – Old and new values – v Old Value zaškrtneme Range, 30 through 50, v New Value zadáme Value 1 – Add, vrátíme se do Old Value, Range 51 throuhg 70, v New Value zadáme value 2 – Add atd. Podobně zakódujeme hodnoty znaku Y do proměnné RY. Vytvoření histogramu pro X: Graphs – Legacy Dialogs – Histogram – Variable X – OK. Vzniklý histogram upravíme v Chart Editor: Options – Un-Bin Element – Binning – na X Axis zaškrtneme Custom, Interval width 20, zaškrtneme Custom value from anchor 30 – Apply. Nakreslení grafu intervalové empirické distribuční funkce pro X: Vytvoříme tabulku rozložení četností pro znak X. V této tabulce se nastavíme na Cumulative Percent a v Create Graph vybereme Line. Nakreslení dvourozměrného tečkového diagramu pro (X, Y): Graphs – Legacy Dialogs – Scatter/Dot – Define – Y Axis Y, X Axis X – OK.