Téma 1.: Bodové a intervalové rozložení četností Nejprve budeme pracovat s datovým souborem znamky.sta, který obsahuje údaje o známkách z matematiky, angličtiny a pohlaví 20 studentů 1. ročníku. Úkol 1.: Načtěte soubor znamky.sta. Proměnným X, Y, Z vytvořte návěští (X - známka z matematiky, Y - známka z angličtiny, Z - pohlaví studenta). Popište, co znamenají jednotlivé varianty (u znaků X a Y: 1 - výborně, 2 - velmi dobře, 3 - dobře, 4 - neprospěl, u znaku Z: 0 - žena, 1 - muž). Návod: Soubor – Otevřít – vybereme příslušný adresář se souborem znamky.sta – Otevřít. Kurzor nastavíme na Prom1 – 2x klikneme myší – Jméno X – Dlouhé jméno známka z matematiky, Text. hodnoty – 1 výborně, 2 velmi dobře, 3 dobře, 4 neprospěl, OK. U proměnné Y lze textové hodnoty okopírovat z proměnné X – v Editoru textových hodnot zvolíme Kopírovat z proměnné X. Přepínání mezi číselnými hodnotami a jejich textovým popisem se děje pomocí tlačítka s ikonou štítku. Úkol 2.: Vytvořte a) variační řadu známek z matematiky a známek z angličtiny, b) sloupkový diagram absolutních četností znaků X a Y, c) polygon absolutních četností znaků X a Y Návod: ad a) Statistiky – Základní statistiky a tabulky – Tabulky četností – OK – Proměnné X, Y – OK - Výpočet. Variační řada známek z matematiky Tabulka četností:X: znamka z M (znamky.sta) Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost vyborne velmi dobre dobre neprospel ChD 7 7 35,00000 35,0000 3 10 15,00000 50,0000 2 12 10,00000 60,0000 8 20 40,00000 100,0000 0 20 0,00000 100,0000 Variační řada známek z angličtiny Tabulka četností:Y: znamka z A (znamky.sta) Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost vyborne velmi dobre dobre neprospel ChD 4 4 20,00000 20,0000 4 8 20,00000 40,0000 7 15 35,00000 75,0000 5 20 25,00000 100,0000 0 20 0,00000 100,0000 ad b) Grafy – Histogramy – Proměnné X, Y – OK- vypneme Normální proložení – Detaily– zaškrtneme Mezery mezi sloupci - OK. Sloupkový diagram pro znak X Histogram z X znamky 3v*20c výborně velmi dobře dobře neprospěl X 0 1 2 3 4 5 6 7 8 9 Početpozorování Sloupkový diagram pro znak Y Histogram z Y znamky 3v*20c výborně velmi dobře dobře neprospěl Y 0 1 2 3 4 5 6 7 8 Početpozorováníad c) V pracovním sešitu vstoupíme do tabulky rozložení četností proměnné X resp. Y. Nastavíme se na řádek označený ChD. Pomocí Případy – Odstranit vymažeme tento řádek. Nastavíme se kurzorem na Četnost - klikneme pravým tlačítkem – Grafy bloku dat – Spojnicový graf: celé sloupce. Vykreslí se polygon absolutních četností. Polygon absolutních četností pro znak X Spojnicový graf z Četnost Tabulka3 1v*4c výborně velmi dobře dobře neprospěl 1 2 3 4 5 6 7 8 9 Četnost Polygon absolutních četností pro znak Y Spojnicový graf z Četnost Tabulka4 1v*4c výborně velmi dobře dobře neprospěl 3,5 4,0 4,5 5,0 5,5 6,0 6,5 7,0 7,5 Četnost Úkol 2.: Vytvořte variační řady známek z matematiky a angličtiny pouze a) pro ženy, b) pro muže. Návod: ad a) Statistiky – Základní statistiky a tabulky – Tabulky četností – OK – Proměnné X, Y – OK – vybereme Select Cases - zaškrtneme Zapnout filtr – do okénka některé, vybrané pomocí výrazu zapíšeme Z = 0, OK, Výpočet. Variační řada známek z matematiky pro ženy: Tabulka četností:X: známka z matematiky (znamky) Zhrnout podmínku: Z=0 Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost výborně velmi dobře dobře neprospěl ChD 5 5 50,00000 50,0000 2 7 20,00000 70,0000 1 8 10,00000 80,0000 2 10 20,00000 100,0000 0 10 0,00000 100,0000 Variační řada známek z angličtiny pro ženy: Tabulka četností:Y: znamka z angličtiny (znamky) Zhrnout podmínku: Z=0 Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost výborně velmi dobře dobře neprospěl ChD 4 4 40,00000 40,0000 2 6 20,00000 60,0000 1 7 10,00000 70,0000 3 10 30,00000 100,0000 0 10 0,00000 100,0000 ad b) Statistiky – Základní statistiky a tabulky – Tabulky četností – OK – Proměnné X, Y – OK – vybereme Select Cases - zaškrtneme Zapnout filtr – do okénka některé, vybrané pomocí výrazu zapíšeme Z = 1, OK, Výpočet. Variační řada známek z matematiky pro muže: Tabulka četností:X: známka z matematiky (znamky) Zhrnout podmínku: Z=1 Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost výborně velmi dobře dobře neprospěl ChD 2 2 20,00000 20,0000 1 3 10,00000 30,0000 1 4 10,00000 40,0000 6 10 60,00000 100,0000 0 10 0,00000 100,0000 Variační řada známek z angličtiny pro muže: Tabulka četností:Y: znamka z angličtiny (znamky) Zhrnout podmínku: Z=1 Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost velmi dobře dobře neprospěl ChD 2 2 20,00000 20,0000 6 8 60,00000 80,0000 2 10 20,00000 100,0000 0 10 0,00000 100,0000 Úkol 3.: Nadále budeme pracovat s celým datovým souborem. Vytvoříme kontingenční tabulku simultánních absolutních četností znaků X a Y a graf simultánní četnostní funkce. Návod: Statistiky – Základní statistiky/tabulky – odškrtneme Zapnout filtr – OK Kontingenční tabulky – OK – Specif. tabulky - List 1 X, List 2 Y, OK, Výpočet. Kontingenční tabulka (znamky) Četnost označených buněk > 10 (Marginální součty nejsou označeny) X Y výborn ě Y velmi dobře Y dobře Y neprospěl Řádk. součty výborně 4 1 2 0 7 velmi dobře 0 2 1 0 3 dobře 0 0 1 1 2 neprospěl 0 1 3 4 8 Vš.skup. 4 4 7 5 20 Vidíme, že ve výběrovém souboru byli 4 studenti, kteří měli z obou předmětů „výborně“, jeden student, který měl z matematiky „výborně“ a z angličtiny „velmi dobře“ atd. až 4 studenti, kteří z obou předmětů neprospěli. Úkol 4.: Vytvořte kontingenční tabulku sloupcově a řádkově podmíněných relativních četností znaků X a Y. Návod: Aktivujeme na liště Výsledky: kontingenční tabulky – Možnosti - zaškrtneme ve sloupci Výpočet tabulek volbu Procenta z počtu ve sloupci (resp. Procenta z počtu v řádku) – Výpočet. Kontingenční tabulka sloupcově podmíněných relativních četností : Kontingenční tabulka (znamky) Četnost označených buněk > 10 (Marginální součty nejsou označeny) X Y výborn ě Y velmi dobře Y dobře Y neprospěl Řádk. součty Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost výborně 4 1 2 0 7 100,00% 25,00% 28,57% 0,00% velmi dobře 0 2 1 0 3 0,00% 50,00% 14,29% 0,00% dobře 0 0 1 1 2 0,00% 0,00% 14,29% 20,00% neprospěl 0 1 3 4 8 0,00% 25,00% 42,86% 80,00% Vš.skup. 4 4 7 5 20 Interpretace např. 4. řádku ve 2. sloupci: V souboru byli 4 studenti, kteří měli velmi dobře z angličtiny. Mezi nimi byl jeden, který neprospěl z matematiky, což představuje 1/4 = 25%. Kontingenční tabulka řádkově podmíněných relativních četností: Kontingenční tabulka (znamky) Četnost označených buněk > 10 (Marginální součty nejsou označeny) X Y výborn ě Y velmi dobře Y dobře Y neprospěl Řádk. součty Četnost Řádk. četn. Četnost Řádk. četn. Četnost Řádk. četn. Četnost Řádk. četn. Četnost výborně 4 1 2 0 7 57,14% 14,29% 28,57% 0,00% velmi dobře 0 2 1 0 3 0,00% 66,67% 33,33% 0,00% dobře 0 0 1 1 2 0,00% 0,00% 50,00% 50,00% neprospěl 0 1 3 4 8 0,00% 12,50% 37,50% 50,00% Vš.skup. 4 4 7 5 20 Interpretace např. 2. sloupce ve 4. řádku: V souboru bylo 8 studentů, kteří neprospěli z matematiky. Mezi nimi byl jeden, který měl velmi dobře z angličtiny, což představuje 1/8 = 12,5%. Nyní se budeme věnovat datovému souboru ocel.sta. Obsahuje údaje o mezi plasticity a mezi pevnosti 60 vzorků oceli. Úkol 5.: Načtěte soubor ocel.sta. Proměnným X a Y vytvořte návěští „mez plasticity“ a „mez pevnosti“. Úkol 6.: Pro X a Y použijeme intervalové zpracování četností. Podle Sturgesova pravidla je optimální počet třídicích intervalů 7. Musíme zjistit minimum a maximum, abychom vhodně stanovili třídicí intervaly. Návod: Statistiky - Základní statistiky/tabulky – Popisné statistiky - OK - Proměnné X,Y – OK – Detailní výsledky – ponecháme zaškrtnuté Minimum&maximum – Výpočet. Popisné statistiky (ocel.sta) Proměnná Minimum Maximum X Y 33,00000 160,0000 52,00000 189,0000 Pro X je minimum 33 a maximum 160, tedy vhodná volba třídicích intervalů je (30,50>, (50,70>, ..., (150,170>, pro Y je minimum 52 a maximum 189, tedy třídicí intervaly zvolíme (50,70>, (70,90>, ... , (170,190>. Úkol 7.: Vytvořte histogram pro X a pro Y. Návod: Grafy – Histogramy – Proměnné X – vypneme Normální proložení – Detaily – zaškrtneme Hranice – Určit hranice – zvolíme Zadejte hraniční rozmezí – Minimum: 30, Krok: 20, Maximum: 170 OK – Osa Y %. Po vykreslení histogramu lze 2 x klepnout na pozadí grafu a ve volbě Všechny možnosti měnit různé vlastnosti grafu. Histogram pro znak X Histogram z X ocel 4v*60c 50 70 90 110 130 150 170 X 0% 3% 7% 10% 13% 17% 20% 23% 27% Procentopozorování Histogram pro znak Y Histogram z Y ocel 4v*60c 70 90 110 130 150 170 190 Y 0% 3% 7% 10% 13% 17% 20% 23% 27% ProcentopozorováníKomentář: Rozložení četností jak pro mez plasticity, tak pro mez pevnosti je lehce nesymetrické. Navíc v histogramu pro mez plasticity je vidět, že interval od 50 do 70 má velmi malé četnostní zastoupení. Vysvětlení této skutečnosti je ovšem mimomatematická záležitost. Úkol 8.: Proveďte zakódování hodnot proměnných X a Y do příslušných třídicích intervalů. Všem hodnotám proměnné X, které leží v intervalu (30,50>, přiřadíme hodnotu středu intervalu, tedy 40 atd. až všem hodnotám proměnné X, které leží v intervalu (150,170>, přiřadíme hodnotu 160. Analogicky pro Y, tedy všem hodnotám proměnné Y, které leží v intervalu (50,70>, přiřadíme hodnotu středu intervalu, tj. 60 atd. až všem hodnotám proměnné Y, které leží v intervalu (170,190>, přiřadíme hodnotu 180. Podmínky pro překódování jsou uloženy v tzv. inicializačních souborech nazvaných ocel_X.ini a ocel_Y.ini. Návod: Vytvoříme dvě nové proměnné: Vložit – Přidat proměnné – 2 – Za Y – OK – přejmenujeme je na RX a RY. Nastavíme se kurzorem na RX – Data – Překódovat - Otevřít – ocel_X.ini – OK. Proměnná RX se vyplní středy třídicích intervalů pro mez plasticity. Poté se nastavíme kurzorem na RY - Data – Překódovat - Otevřít – ocel_Y.ini – OK. Proměnná RY se vyplní středy třídicích intervalů pro mez pevnosti. Úkol 9.: Sestavte kontingenční tabulky absolutních četností a relativních četností dvourozměrných třídicích intervalů pro (X,Y). Návod: Statistiky – Základní statistiky/tabulky – Kontingenční tabulky – OK – Specif. tabulky - List 1 RX, List 2 RY, OK, Výpočet. Kontingenční tabulky absolutních a relativních četností. Kontingenční tabulka (ocel.sta) Tab. : RX RY 60 RY 80 RY 100 RY 120 RY 140 RY 160 RY 180 Řádk. součty Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. 40 5 3 0 0 0 0 0 8 8,33% 5,00% 0,00% 0,00% 0,00% 0,00% 0,00% 13,33% 60 0 3 1 0 0 0 0 4 0,00% 5,00% 1,67% 0,00% 0,00% 0,00% 0,00% 6,67% 80 0 4 7 1 1 0 0 13 0,00% 6,67% 11,67% 1,67% 1,67% 0,00% 0,00% 21,67% 100 0 0 6 8 1 0 0 15 0,00% 0,00% 10,00% 13,33% 1,67% 0,00% 0,00% 25,00% 120 0 0 0 4 5 0 0 9 0,00% 0,00% 0,00% 6,67% 8,33% 0,00% 0,00% 15,00% 140 0 0 0 0 2 5 0 7 0,00% 0,00% 0,00% 0,00% 3,33% 8,33% 0,00% 11,67% 160 0 0 0 0 0 1 3 4 0,00% 0,00% 0,00% 0,00% 0,00% 1,67% 5,00% 6,67% Vš.skup. 5 10 14 13 9 6 3 60 8,33% 16,67% 23,33% 21,67% 15,00% 10,00% 5,00% Úkol 10.: Vytvořte stereogram pro (RX,RY). Návod: Statistiky – Základní statistiky/tabulky – Kontingenční tabulky – OK – Specif. tabulky - List 1 RX, List 2 RY – OK – OK – Detailní výsledky – zaškrtneme 3D histogramy. Dvourozměrné rozdělení: RX x RY 6080100120140160180RY406080100120140160RX123456789Početpozorování Úkol 11.: Nakreslete dvourozměrný tečkový diagram pro (X,Y). Návod: Grafy – Bodové grafy – Proměnné X,Y – OK - vypneme Lineární proložení – OK. Bodový graf z Y proti X ocel 4v*60c 20 40 60 80 100 120 140 160 180 X 40 60 80 100 120 140 160 180 200 Y Vidíme, že mezi oběma proměnnými existuje určitý stupeň přímé lineární závislosti – s růstem hodnot meze plasticity vesměs rostou hodnoty meze pevnosti a naopak.