Cvičení 2: Intervalové zpracování četností Příklad na intervalové zpracování četností: U 60 vzorků oceli byly zjišťovány hodnoty meze plasticity a meze pevnosti v kpcm-2 (viz skripta Popisná statistika, př. 2.5). Datový soubor se jmenuje ocel.sta. Proveďte intervalové zpracování četností. Úkol 1.: Načtěte soubor ocel.sta. Proměnným X a Y vytvořte návěští „mez plasticity“ a „mez pevnosti“. Úkol 2.: Pro X a Y použijeme intervalové zpracování četností. Podle Sturgesova pravidla je optimální počet třídicích intervalů 7. Musíme zjistit minimum a maximum, abychom vhodně stanovili třídicí intervaly. Návod: Statistiky - Základní statistiky/tabulky – Popisné statistiky - OK - Proměnné X,Y – OK – Detailní výsledky – ponecháme zaškrtnuté Minimum&maximum – Výpočet. Popisné statistiky (ocel.sta) Proměnná Minimum Maximum X Y 33,00000 160,0000 52,00000 189,0000 Pro X je minimum 33 a maximum 160, tedy vhodná volba třídicích intervalů je (30,50>, (50,70>, ..., (150,170>, pro Y je minimum 52 a maximum 189, tedy třídicí intervaly zvolíme (50,70>, (70,90>, ... , (170,190>. Úkol 3.: Vytvořte histogram pro X a pro Y. Návod: Grafy – Histogramy – Proměnné X – vypneme Normální proložení – Detaily – zaškrtneme Hranice – Určit hranice – zvolíme Zadejte hraniční rozmezí – Minimum: 30, Krok: 20, Maximum: 170 OK – Osa Y %. Po vykreslení histogramu lze 2 x klepnout na pozadí grafu a ve volbě Všechny možnosti měnit různé vlastnosti grafu. Histogram pro znak X Histogram z X ocel 4v*60c 50 70 90 110 130 150 170 X 0% 3% 7% 10% 13% 17% 20% 23% 27% Procentopozorování Histogram pro znak Y Histogram z Y ocel 4v*60c 70 90 110 130 150 170 190 Y 0% 3% 7% 10% 13% 17% 20% 23% 27% Procentopozorování Komentář: Rozložení četností jak pro mez plasticity tak pro mez pevnosti je lehce nesymetrické. Navíc v histogramu pro mez plasticity je vidět, že interval od 50 do 70 má velmi malé četnostní zastoupení. Vysvětlení této skutečnosti je ovšem mimomatematická záležitost. Úkol 4.: Proveďte zakódování hodnot proměnných X a Y do příslušných třídicích intervalů. Všem hodnotám proměnné X, které leží v intervalu (30,50>, přiřadíme hodnotu středu intervalu, tedy 40 atd. až všem hodnotám proměnné X, které leží v intervalu (150,170>, přiřadíme hodnotu 160. Analogicky pro Y, tedy všem hodnotám proměnné Y, které leží v intervalu (50,70>, přiřadíme hodnotu středu intervalu, tj. 60 atd. až všem hodnotám proměnné Y, které leží v intervalu (170,190>, přiřadíme hodnotu 180. Podmínky pro překódování jsou uloženy v tzv. inicializačních souborech nazvaných ocel_X.ini a ocel_Y.ini. Návod: Vytvoříme dvě nové proměnné: Vložit – Přidat proměnné – 2 – Za Y – OK – přejmenujeme je na RX a RY. Nastavíme se kurzorem na RX – Data – Překódovat - Otevřít – ocel_X.ini – OK. Proměnná RX se vyplní středy třídicích intervalů pro mez plasticity. Poté se nastavíme kurzorem na RY - Data – Překódovat - Otevřít – ocel_Y.ini – OK. Proměnná RY se vyplní středy třídicích intervalů pro mez pevnosti. Úkol 5.: Vytvořte graf intervalové empirické distribuční funkce pro X. Návod: Vytvoříme tabulku četností pro proměnnou RX. Před 1. případ vložíme dva řádky, u nichž do sloupce Kumulativní rel. četnost napíšeme 0. Do sloupce Kategorie napíšeme 10, 30, 50, …, 190: Tabulka četností:RX (ocel) Kategorie Četnost Kumulativní četnost Rel.četnost Kumulativní rel.četnost 10 30 50 70 90 110 130 150 170 190 0,0000 0,0000 8 8 13,33333 13,3333 4 12 6,66667 20,0000 13 25 21,66667 41,6667 15 40 25,00000 66,6667 9 49 15,00000 81,6667 7 56 11,66667 93,3333 4 60 6,66667 100,0000 0 60 0,00000 100,0000 Nastavíme se kurzorem na Kumulativní rel. četnost – klikneme pravým tlačítkem – Grafy bloku dat – Vlastní graf bloku podle sloupce – Spojnicové grafy (Proměnné) – OK. Ve vytvořeném grafu odstraníme značky a změníme rozsah hodnot na vodorovné ose od 1 do 10. Spojnicový graf z Kumulativní Tabulka15 1v*10c 30 50 70 90 110 130 150 170 -20 0 20 40 60 80 100 120 Kumulativní Úkol 6.: Sestavte kontingenční tabulky absolutních četností (relativních četností, sloupcově a řádkově podmíněných relativních četností) dvourozměrných třídicích intervalů pro (X,Y). Návod: Statistiky – Základní statistiky/tabulky –OK - Kontingenční tabulky – OK – Specif. tabulky - List 1 RX, List 2 RY, OK, Výpočet. Kontingenční tabulky absolutních a relativních četností. Kontingenční tabulka (ocel.sta) Četnost označených buněk > 10 (Marginální součty nejsou označeny) RX RY 1 RY 2 RY 3 RY 4 RY 5 RY 6 RY 7 Řádk. součty Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. Četnost Celková četn. 1 5 3 0 0 0 0 0 8 8,33% 5,00% 0,00% 0,00% 0,00% 0,00% 0,00% 13,33% 2 0 3 1 0 0 0 0 4 0,00% 5,00% 1,67% 0,00% 0,00% 0,00% 0,00% 6,67% 3 0 4 7 1 1 0 0 13 0,00% 6,67% 11,67% 1,67% 1,67% 0,00% 0,00% 21,67% 4 0 0 6 8 1 0 0 15 0,00% 0,00% 10,00% 13,33% 1,67% 0,00% 0,00% 25,00% 5 0 0 0 4 5 0 0 9 0,00% 0,00% 0,00% 6,67% 8,33% 0,00% 0,00% 15,00% 6 0 0 0 0 2 5 0 7 0,00% 0,00% 0,00% 0,00% 3,33% 8,33% 0,00% 11,67% 7 0 0 0 0 0 1 3 4 0,00% 0,00% 0,00% 0,00% 0,00% 1,67% 5,00% 6,67% Vš.skup. 5 10 14 13 9 6 3 60 8,33% 16,67% 23,33% 21,67% 15,00% 10,00% 5,00% Kontingenční tabulka řádkově podmíněných relativních četností. Kontingenční tabulka (ocel.sta) Četnost označených buněk > 10 (Marginální součty nejsou označeny) RX RY 1 RY 2 RY 3 RY 4 RY 5 RY 6 RY 7 Řádk. součty Četnost Řádk. četn. Četnost Řádk. četn. Četnost Řádk. četn. Četnost Řádk. četn. Četnost Řádk. četn. Četnost Řádk. četn. Četnost Řádk. četn. Četnost 1 5 3 0 0 0 0 0 8 62,50% 37,50% 0,00% 0,00% 0,00% 0,00% 0,00% 2 0 3 1 0 0 0 0 4 0,00% 75,00% 25,00% 0,00% 0,00% 0,00% 0,00% 3 0 4 7 1 1 0 0 13 0,00% 30,77% 53,85% 7,69% 7,69% 0,00% 0,00% 4 0 0 6 8 1 0 0 15 0,00% 0,00% 40,00% 53,33% 6,67% 0,00% 0,00% 5 0 0 0 4 5 0 0 9 0,00% 0,00% 0,00% 44,44% 55,56% 0,00% 0,00% 6 0 0 0 0 2 5 0 7 0,00% 0,00% 0,00% 0,00% 28,57% 71,43% 0,00% 7 0 0 0 0 0 1 3 4 0,00% 0,00% 0,00% 0,00% 0,00% 25,00% 75,00% Vš.skup. 5 10 14 13 9 6 3 60 Kontingenční tabulka sloupcově podmíněných relativních četností. Kontingenční tabulka (ocel.sta) Četnost označených buněk > 10 (Marginální součty nejsou označeny) RX RY 1 RY 2 RY 3 RY 4 RY 5 RY 6 RY 7 Řádk. součty Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost Sloupc. četn. Četnost 1 5 3 0 0 0 0 0 8 100,00% 30,00% 0,00% 0,00% 0,00% 0,00% 0,00% 2 0 3 1 0 0 0 0 4 0,00% 30,00% 7,14% 0,00% 0,00% 0,00% 0,00% 3 0 4 7 1 1 0 0 13 0,00% 40,00% 50,00% 7,69% 11,11% 0,00% 0,00% 4 0 0 6 8 1 0 0 15 0,00% 0,00% 42,86% 61,54% 11,11% 0,00% 0,00% 5 0 0 0 4 5 0 0 9 0,00% 0,00% 0,00% 30,77% 55,56% 0,00% 0,00% 6 0 0 0 0 2 5 0 7 0,00% 0,00% 0,00% 0,00% 22,22% 83,33% 0,00% 7 0 0 0 0 0 1 3 4 0,00% 0,00% 0,00% 0,00% 0,00% 16,67% 100,00% Vš.skup. 5 10 14 13 9 6 3 60 Úkol 7.: Vytvořte stereogram pro (RX,RY). Návod: Statistiky – Základní statistiky/tabulky – Kontingenční tabulky – OK – Specif. tabulky - List 1 RX, List 2 RY – OK – OK – Detailní výsledky – zaškrtneme 3D histogramy. Ve výsledném grafu 2x klikneme na pozadí, vybereme Graf – Vzhled – Mezery mezi sloupci – pro X zvolíme 0 a pro Y také zvolíme 0. Dvourozměrné rozdělení: RX x RY 1234567RY1234567RX123456789Početpozorování Upozornění: V našem pojetí je výška jxk-tého kvádru ve stereogramu rovna četnostní hustotě jxk-tého dvourozměrného třídicího intervalu, avšak systém STATISTICA vytváří stereogram tak, že výška jxk-tého kvádru je rovna absolutní četnosti jxk-tého dvourozměrného třídicích intervalu. Úkol 8.: Nakreslete dvourozměrný tečkový diagram pro (X,Y). Návod: Grafy – Bodové grafy – Proměnné X,Y – OK - vypneme Lineární proložení – OK. Bodový graf z Y proti X ocel 4v*60c 20 40 60 80 100 120 140 160 180 X 40 60 80 100 120 140 160 180 200 Y Vidíme, že mezi oběma proměnnými existuje určitý stupeň přímé lineární závislosti – s růstem hodnot meze plasticity vesměs rostou hodnoty meze pevnosti a naopak.