cvičení 02: popisná statistika šRobová, Hála, Calda: Komplexní čísla, kombinatorika, pravděpodobnost, statistika š šČást STATISTIKA: str. 148-194, neučte se pojem výběrového rozptylu a výběrové směrodatné odchylky na str. 180-182 š šJazyk R je pouze pro zájemce, všechno lze počítat i s kalkulačkou!! Příklady viz nová učebnice pro SŠ: Příklad A, str. 150: šJsou zadány četnosti jednotlivých typů SŠ, odkud jsou studenti š a) sestavte histogram četností z těchto dat š b) spočtěte relativní četnosti a zobrazte je v kruhovém diagramu š š Řešení v R: š Øbarplot(c(48,20,160,92)) # nakreslí obdélníčky dané výšky Øpie(c(48,20,160,92)) # nakreslí koláčový graf š Ørelc<- (1/320)* c(48,20,160,92) # relativní četnosti Øpie(relc) # nakreslí koláč četností relativních š Příklad B, str. 152: šJsou zadány velikosti prodaných obleků během jednoho týdne v dané prodejně … š š a) sestavte histogram četností a polygon četností z těchto dat, š b) sestavte tabulku relativních četností, kumulativních absolutních četností, kumulativních relativních četností pro tato data š c) určete modus a medián, průměr, rozptyl a směrodatnou odchylku velikostí obleku šd) Určete variační rozpětí a mezikvartilové rozpětí velikosti obleků še) Určete 0.45-kvantil, 0.57-kvantil, 0.869-kvantil … pomocí kumulativních relativních četností š v R: š Øobleky<- c(39,41,40,42,41,40,42,42,40,43,42,41,43,39,42,41,42,39,41,37,43, 41,38,43,42,41,40,41,38,40,40,39,41,40,42,40,41,42,40,43,38,39,41,41,42,45) š Øhist(obleky,col=6:7,breaks=36.5:45.5) # histogram, strida barvy 6-7 š# a středy obdélníčků umístí do celočíselných hodnot, hranice jsou posunuty Øtable(obleky) # spocte cetnosti š Øx<- c(37,38,39,40,41,42,43,45) # opiseme hodnoty znaku do vektoru x Øy<- c(1,3,5,9,12,10,5,1) # opiseme cetnosti do y Øplot(x,y,pch=16) # nakresli body v modu 16 = vyplnene kolecko Ølines(x,y) # spoji nakreslene body … najedeme na file – lze ulozit obrazek v jpg, pdf v R, pokračování příkladu: Ørely<- (1/length(obleky))*y # spocte rel cetnosti Økumy<- y # do promenne kumy si pripravime vektor cetnosti, Øfor (i in 2:length(kumy)) kumy[i]<- kumy[i]+kumy[i-1] # kum cetnosti jsou hotovy!!!! Ørelkumy<- (1/length(obleky))*kumy # rel kum cetnosti š šc) Modus = 41 = median … vidíme z tabulky četností Ømean(obleky) # vypocte prumer Ørozptyl <- function (x) ((length(x)-1)/length(x))*var(x) # definuje funkci rozptylu š Ørozptyl(obleky) # vypocte rozptyl merenych hodnot 2.534972 Øsqrt(rozptyl(obleky)) # vypocte smerodatnou odchylku mereni 1.592159 v R, dokončení příkladu: šd) Určete variační rozpětí a mezikvartilové rozpětí velikosti obleků: š Ømax(obleky)-min(obleky) # variacni rozpeti Øquantile(obleky, c(0.25,0.75),type=2) # najde dolni a horni kvartil š# odectenim obou hodnot mame mezikvartilove rozpeti š Příklad o 75 učitelích z Hindlse (str.23): tento příklad dělat nemusíte, je zde jen historicky a kvůli pokynům jazyka R šJsou zadány počty let praxe jednotlivých 75 učitelů… š a) sestavte intervalové rozdělení četností pro tato data, š b) vypočtěte vážený průměr, vážený rozptyl a směrodatnou odchylku jen zhruba pomocí těchto četností. š Příklad o 75 učitelích z Hindlse (str.23): tento příklad dělat nemusíte, je zde jen historicky a kvůli pokynům jazyka R šZadání tabulky dat: š Ømojedata<- data.frame(trida=numeric(0),praxe=numeric(0)) Ømojedata<-edit(mojedata) š# a) nadefinujeme sloupce „platová třída“ a „délka praxe“ š# b) edit(moje data) vyvolá tabulku, do které data napíšeme š> attach(mojedata) # tento příkaz aktivizuje práci s tabulkou Příklad o 75 učitelích z Hindlse (str.23): tento příklad dělat nemusíte, je zde jen historicky a kvůli pokunům jazyka R Øtable(praxe) # rozdeleni cetnosti je nedostatecne, protoze ve vetsine skupin je malo mereni … musime nektere cetnosti sloucit š Øhist(praxe) # program si sam slouci cetnosti do interval delky 5 jednotek Øhist(praxe, col=6:7, breaks= c(0,10,20,30,40,50)) š# slouci cetnosti do intervalu delky 10 š šAbychom získali i četnosti číselně, musíme „nasekat“ hodnoty do intervalů: Ømeze<- c(0,10,20,30,40,50) Øintervaly<- cut(praxe, meze) Øtable(intervaly] # získáme četnosti (21,29,15,8,2) A zbývá vypočíst průměr, rozptyl a odchylku: tento příklad dělat nemusíte, je zde jen historicky a kvůli pokunům jazyka R Příklad D, str. 159: př. na intervalové rozdělení četností … pečlivě prostudujte šJsou zadány kupní ceny bytů ve velkých městech v roce 2007 … š a) proveďte pro ně intervalové rozdělení četností š b) sestavte tabulku relativních četností, kumulativních absolutních četností, kumulativních relativních četností pro tato data š c) najděte jen pomocí tabulky relat četností dolní a horní kvartil, medián, 0,85-kvantil … str. 192 š Příklad D v jazyce R: Příklad D v jazyce R, druhá část - začátek: šUrčíme meze s krokem 5400, které pokrývají všechna měření: Øbmeze<- c(12700, 18100, 23500, 28900, 34300, 39700, 45100) š nasekáme hodnoty do daných intervalů pomocí funkce cut: Øbintervaly <- cut(byty,bmeze) Øtable (bintervaly) # ziskali jsme cetnosti (11,11,3,1,0,1) Øcetnost <- c(11,11,3,1,0,1) šRelativni a kumulativni cetnosti budou ted uz malina š š Příklad D v jazyce R, druhá část - konec: šRelativní četnosti v jazyku R: Ørcetnost <- (1/length(byty))* cetnost škumulativni cetnosti: Økcetnost <- cetnost # jen priprava vektoru na kum cetnosti Øfor (i in 2:length(kcetnost)) kcetnost[i]<-kcetnost[i]+kcetnost[i-1] Ørkcetnost <- (1/length(byty))*kcetnost škcetnost … vector kum cetnosti, š rkcetnost … vector rel kum cetnosti š š Poznámka: třetí část viz příprava vyučujícího; V jazyku R najdeme kvantily v soboru snadno: Øquantile(byty, c(0.25,0.50,0.75,0.85),type=2) š# najde dane kvantily snadno a přesně ROZDÍL MEZI POJMY průměr, medián, modus špříklad na průměr, medián, modus mzdy v ČR … jen histogram náhodně vybraných 200 osob š ROZDÍL MEZI POJMY průměr, medián, modus šTedy: modus = hodnota, která nastává nejčastěji (jakýsi bod nebo interval, ve kterém se veličina=znak vyskytuje nejčastěji) š šMedián … hodnota, která rozděluje soubor jednotek na dvě stejně početné skupiny š šPrůměr … může být zkreslený odlehlou hodnotou (extrémně malá životnost, velký plat) šDva střelci střílí do stejného terče – mají stejný průměr, stejný modus i stejný medián, a přece se něčím liší: jak je to možné? š šČím tedy porovnáme jejich výkon? Jakou hodnotou či veličinou? š š(variabilita … na ZŠ se neprobírá, jen snad otázka v olympiádě či jiných matematických soutěžích) š š š Skriptum MA0008, úloha 2.2: př. na intervalové rozdělení spojité veličiny šPro daná data a)Proveďte intervalové rozdělení četností, odhadněte jen pomocí četností jejich průměr a rozptyl b)Najděte 0,25-kvantil, 0,65-kvantil, 0,75-kvantil jen podle tabulky četností