Téma 1.: Bodové a intervalové rozložení četností Nejprve budeme pracovat s datovým souborem znamky.sta, který obsahuje údaje o známkách z matematiky, angličtiny a pohlaví 20 studentů 1. ročníku. Úkol 1.: Načtěte soubor znamky.sta. Proměnným X, Y, Z vytvořte návěští (X - známka z matematiky, Y - známka z angličtiny, Z - pohlaví studenta). Popište, co znamenají jednotlivé varianty (u znaků X a Y: 1 - výborně, 2 - velmi dobře, 3 - dobře, 4 - neprospěl, u znaku Z: 0 - žena, 1 - muž). Návod: Soubor – Otevřít – vybereme příslušný adresář se souborem znamky.sta – Otevřít. Kurzor nastavíme na Prom1 – 2x klikneme myší – Jméno X – Dlouhé jméno známka z matematiky, Text. hodnoty – 1 výborně, 2 velmi dobře, 3 dobře, 4 neprospěl, OK. U proměnné Y lze textové hodnoty okopírovat z proměnné X – v Editoru textových hodnot zvolíme Kopírovat z proměnné X. Přepínání mezi číselnými hodnotami a jejich textovým popisem se děje pomocí tlačítka s ikonou štítku. Úkol 2.: Vytvořte a) variační řadu známek z matematiky a známek z angličtiny, b) sloupkový diagram absolutních četností znaků X a Y, c) polygon absolutních četností znaků X a Y Návod: ad a) Statistiky – Základní statistiky a tabulky – Tabulky četností – OK – Proměnné X, Y – OK - Výpočet. Variační řada známek z matematiky Tabulka četností:X: znamka z M (znamky.sta) Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost vyborne velmi dobre dobre neprospel ChD 7 7 35,00000 35,0000 3 10 15,00000 50,0000 2 12 10,00000 60,0000 8 20 40,00000 100,0000 0 20 0,00000 100,0000 Variační řada známek z angličtiny Tabulka četností:Y: znamka z A (znamky.sta) Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost vyborne velmi dobre dobre neprospel ChD 4 4 20,00000 20,0000 4 8 20,00000 40,0000 7 15 35,00000 75,0000 5 20 25,00000 100,0000 0 20 0,00000 100,0000 ad b) Grafy – Histogramy – Proměnné X, Y – OK- vypneme Normální proložení – Detaily– zaškrtneme Mezery mezi sloupci - OK. Sloupkový diagram pro znak X Histogram z X znamky 3v*20c výborně velmi dobře dobře neprospěl X 0 1 2 3 4 5 6 7 8 9 Početpozorování Sloupkový diagram pro znak Y Histogram z Y znamky 3v*20c výborně velmi dobře dobře neprospěl Y 0 1 2 3 4 5 6 7 8 Početpozorováníad c) V pracovním sešitu vstoupíme do tabulky rozložení četností proměnné X resp. Y. Nastavíme se na řádek označený ChD. Pomocí Případy – Odstranit vymažeme tento řádek. Nastavíme se kurzorem na Četnost - klikneme pravým tlačítkem – Grafy bloku dat – Spojnicový graf: celé sloupce. Vykreslí se polygon absolutních četností. Polygon absolutních četností pro znak X Spojnicový graf z Četnost Tabulka3 1v*4c výborně velmi dobře dobře neprospěl 1 2 3 4 5 6 7 8 9 Četnost Polygon absolutních četností pro znak Y Spojnicový graf z Četnost Tabulka4 1v*4c výborně velmi dobře dobře neprospěl 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 Četnost Úkol 2.: Vytvořte variační řady známek z matematiky a angličtiny pouze a) pro ženy, b) pro muže. Návod: ad a) Statistiky – Základní statistiky a tabulky – Tabulky četností – OK – Proměnné X, Y – OK – vybereme Select Cases - zaškrtneme Zapnout filtr – do okénka některé, vybrané pomocí výrazu zapíšeme Z = 0, OK, Výpočet. Variační řada známek z matematiky pro ženy: Tabulka četností:X: známka z matematiky (znamky) Zhrnout podmínku: Z=0 Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost výborně velmi dobře dobře neprospěl ChD 5 5 50,00000 50,0000 2 7 20,00000 70,0000 1 8 10,00000 80,0000 2 10 20,00000 100,0000 0 10 0,00000 100,0000 Variační řada známek z angličtiny pro ženy: Tabulka četností:Y: znamka z angličtiny (znamky) Zhrnout podmínku: Z=0 Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost výborně velmi dobře dobře neprospěl ChD 4 4 40,00000 40,0000 2 6 20,00000 60,0000 1 7 10,00000 70,0000 3 10 30,00000 100,0000 0 10 0,00000 100,0000 ad b) Statistiky – Základní statistiky a tabulky – Tabulky četností – OK – Proměnné X, Y – OK – vybereme Select Cases - zaškrtneme Zapnout filtr – do okénka některé, vybrané pomocí výrazu zapíšeme Z = 1, OK, Výpočet. Variační řada známek z matematiky pro muže: Tabulka četností:X: známka z matematiky (znamky) Zhrnout podmínku: Z=1 Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost výborně velmi dobře dobře neprospěl ChD 2 2 20,00000 20,0000 1 3 10,00000 30,0000 1 4 10,00000 40,0000 6 10 60,00000 100,0000 0 10 0,00000 100,0000 Variační řada známek z angličtiny pro muže: Tabulka četností:Y: znamka z angličtiny (znamky) Zhrnout podmínku: Z=1 Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost velmi dobře dobře neprospěl ChD 2 2 20,00000 20,0000 6 8 60,00000 80,0000 2 10 20,00000 100,0000 0 10 0,00000 100,0000 Úkol 3.: Nadále budeme pracovat s celým datovým souborem. Vytvoříme kontingenční tabulku simultánních absolutních četností znaků X a Y a graf simultánní četnostní funkce. Návod: Statistiky – Základní statistiky/tabulky – odškrtneme Zapnout filtr – OK Kontingenční tabulky – OK – Specif. tabulky - List 1 X, List 2 Y, OK, Výpočet. Kontingenční tabulka (znamky) Četnost označených buněk > 10 (Marginální součty nejsou označeny) X Y výborn ě Y velmi dobře Y dobře Y neprospěl Řádk. součty výborně 4 1 2 0 7 velmi dobře 0 2 1 0 3 dobře 0 0 1 1 2 neprospěl 0 1 3 4 8 Vš.skup. 4 4 7 5 20 Vidíme, že ve výběrovém souboru byli 4 studenti, kteří měli z obou předmětů „výborně“, jeden student, který měl z matematiky „výborně“ a z angličtiny „velmi dobře“ atd. až 4 studenti, kteří z obou předmětů neprospěli. Úkol 4.: Vytvořte kontingenční tabulku sloupcově a řádkově podmíněných relativních četností znaků X a Y. Návod: Aktivujeme na liště Výsledky: kontingenční tabulky – Možnosti - zaškrtneme ve sloupci Výpočet tabulek volbu Procenta z počtu ve sloupci (resp. Procenta z počtu v řádku) – Výpočet. Kontingenční tabulka sloupcově podmíněných relativních četností : Kontingenční tabulka (znamky) Četnost označených buněk > 10 (Marginální součty nejsou označeny) X Y výborn ě Y velmi dobře Y dobře Y neprospěl Řádk. součty Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost výborně 4 1 2 0 7 100,00% 25,00% 28,57% 0,00% velmi dobře 0 2 1 0 3 0,00% 50,00% 14,29% 0,00% dobře 0 0 1 1 2 0,00% 0,00% 14,29% 20,00% neprospěl 0 1 3 4 8 0,00% 25,00% 42,86% 80,00% Vš.skup. 4 4 7 5 20 Interpretace např. 4. řádku ve 2. sloupci: V souboru byli 4 studenti, kteří měli velmi dobře z angličtiny. Mezi nimi byl jeden, který neprospěl z matematiky, což představuje 1/4 = 25%. Kontingenční tabulka řádkově podmíněných relativních četností: Kontingenční tabulka (znamky) Četnost označených buněk > 10 (Marginální součty nejsou označeny) X Y výborn ě Y velmi dobře Y dobře Y neprospěl Řádk. součty Četnost Řádk. četn. Četnost Řádk. četn. Četnost Řádk. četn. Četnost Řádk. četn. Četnost výborně 4 1 2 0 7 57,14% 14,29% 28,57% 0,00% velmi dobře 0 2 1 0 3 0,00% 66,67% 33,33% 0,00% dobře 0 0 1 1 2 0,00% 0,00% 50,00% 50,00% neprospěl 0 1 3 4 8 0,00% 12,50% 37,50% 50,00% Vš.skup. 4 4 7 5 20 Interpretace např. 2. sloupce ve 4. řádku: V souboru bylo 8 studentů, kteří neprospěli z matematiky. Mezi nimi byl jeden, který měl velmi dobře z angličtiny, což představuje 1/8 = 12,5%. Nyní se budeme věnovat datovému souboru ocel.sta. Obsahuje údaje o mezi plasticity a mezi pevnosti 60 vzorků oceli. Úkol 5.: Načtěte soubor ocel.sta. Proměnným X a Y vytvořte návěští „mez plasticity“ a „mez pevnosti“. Podle Sturgersova pravidla najděte optimální počet třídicích intervalů pro znaky X a Y a vhodně stanovíte meze třídicích intervalů. Návod: Soubor – Otevřít – vybereme příslušný adresář se souborem ocel.sta – Otevřít. Kurzor nastavíme na X – 2x klikneme myší – Dlouhé jméno mez plasticity – OK, kurzor nastavíme na Y – 2x klikneme myší – Dlouhé jméno mez pevnosti – OK. Protože případů je 60, podle Sturgersova pravidla je optimální počet třídicích intervalů 7. Musíme zjistit minimum a maximum, abychom vhodně stanovili třídicí intervaly: Statistiky Základní statistiky/tabulky – Popisné statistiky - OK - Proměnné X,Y – OK – Detailní výsledky – ponecháme zaškrtnuté Minimum&maximum – Výpočet. Pro X je minimum 33 a maximum 160, tedy dolní mez prvního třídicího intervalu volíme 30, horní mez posledního třídicího intervalu 170. Celkem tedy třídicí intervaly pro znak X budou: (30,50>, (50,70>, (70,90>, (90,110>, (110,130>, (130,150>, (150,170> Pro Y je minimum 52 a maximum 189, tedy dolní mez prvního třídicího intervalu volíme 50, horní mez posledního třídicího intervalu 190. Celkem tedy třídicí intervaly pro znak Y budou: (50,70>, (70,90>, (90,110>, (110,130>, (130,150>, (150,170>, (170,190>. Úkol 6.: Proveďte zakódování hodnot proměnných X a Y do příslušných třídicích intervalů. Všem hodnotám proměnné X, které leží v intervalu (30,50>, přiřaďte hodnotu 1 atd. až všem hodnotám proměnné X, které leží v intervalu (170,190>, přiřaďte hodnotu 7. Analogicky pro proměnnou Y. Návod: Vytvoříme dvě nové proměnné: Vložit – Přidat proměnné – 2 – Za Y – OK – přejmenujeme je na RX a RY. Nastavíme se kurzorem na RX – Data – Překódovat - vyplníme podmínky pro všech 7 kategorií. (Pozor – podmínky píšeme ve tvaru X > 30 and X <= 50 atd.). Pak klepneme na OK. Analogicky překódujeme hodnoty proměnné Y do proměnné RY. Úkol 7.: Vytvořte histogram pro X a pro Y. Návod: Grafy – Histogramy – Proměnné X – vypneme Normální proložení – Detaily – zaškrtneme Hranice – Určit hranice – zvolíme Zadejte hraniční rozmezí – Minimum: 30, Krok: 20, Maximum: 170 OK – Osa Y %. Po vykreslení histogramu lze 2 x klepnout na pozadí grafu a ve volbě Všechny možnosti měnit různé vlastnosti grafu. Histogram pro znak X Histogram z X ocel 4v*60c 50 70 90 110 130 150 170 X 0% 3% 7% 10% 13% 17% 20% 23% 27% Procentopozorování Histogram pro znak Y Histogram z Y ocel 4v*60c 70 90 110 130 150 170 190 Y 0% 3% 7% 10% 13% 17% 20% 23% 27% ProcentopozorováníÚkol 8.: Sestavte kontingenční tabulky absolutních četností a relativních četností dvourozměrných třídicích intervalů pro (X,Y). Návod: Statistiky – Základní statistiky/tabulky – Kontingenční tabulky – OK – Specif. tabulky - List 1 RX, List 2 RY, OK, Výpočet. Kontingenční tabulky absolutních a relativních četností. Kontingenční tabulka (ocel.sta) Četnost označených buněk > 10 (Marginální součty nejsou označeny) RX RY 1 RY 2 RY 3 RY 4 RY 5 RY 6 RY 7 Řádk. součty Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. 1 5 3 0 0 0 0 0 8 8,33% 5,00% 0,00% 0,00% 0,00% 0,00% 0,00% 13,33% 2 0 3 1 0 0 0 0 4 0,00% 5,00% 1,67% 0,00% 0,00% 0,00% 0,00% 6,67% 3 0 4 7 1 1 0 0 13 0,00% 6,67% 11,67% 1,67% 1,67% 0,00% 0,00% 21,67% 4 0 0 6 8 1 0 0 15 0,00% 0,00% 10,00% 13,33% 1,67% 0,00% 0,00% 25,00% 5 0 0 0 4 5 0 0 9 0,00% 0,00% 0,00% 6,67% 8,33% 0,00% 0,00% 15,00% 6 0 0 0 0 2 5 0 7 0,00% 0,00% 0,00% 0,00% 3,33% 8,33% 0,00% 11,67% 7 0 0 0 0 0 1 3 4 0,00% 0,00% 0,00% 0,00% 0,00% 1,67% 5,00% 6,67% Vš.skup. 5 10 14 13 9 6 3 60 8,33% 16,67% 23,33% 21,67% 15,00% 10,00% 5,00% Úkol 9.: Vytvořte stereogram pro (RX,RY). Návod: Statistiky – Základní statistiky/tabulky – Kontingenční tabulky – OK – Specif. tabulky - List 1 RX, List 2 RY – OK – OK – Detailní výsledky – zaškrtneme 3D histogramy. Dvourozměrné rozdělení: RX x RY Úkol 10.: Nakreslete dvourozměrný tečkový diagram pro (X,Y). Návod: Grafy – Bodové grafy – Proměnné X,Y – OK - vypneme Lineární proložení – OK. Bodový graf z Y proti X ocel 4v*60c 20 40 60 80 100 120 140 160 180 X 40 60 80 100 120 140 160 180 200 Y Vidíme, že mezi oběma proměnnými existuje určitý stupeň přímé lineární závislosti – s růstem hodnot meze plasticity vesměs rostou hodnoty meze pevnosti a naopak.