# 03 Náhodný výběr, náhodná veličina # importuj z Excelu list "pastelky_velke", datovou tabulku pojmenuj "pv" # NÁHODNÝ VÝBĚR # výběr vzorku z datové tabulky sample(pv, size=15) # takhle to nefunguje, příkaz potřebuje jen vektor sample(pv$delka, size=15) # příkaz vrátí 15 náhodně vybraných hodnot, ale nevíme, na kterém byly řádku # chceme náhodně vybrat 15 řádků v tabulce, se kterými budeme dále pracovat: # kolik řádků má tabulka? Pozor, tabulka je dvourozměrná! dim(pv) # vrátí dvě čísla: počet řádků a počet sloupců sample(x=110, size=15) sample(dim(pv)[1], size=15) # příkaz SET.SEED umožňuje zopakovat výběr se stejných výsledkem set.seed(17) # funguje jen pro jeden další příkaz "sample" sample(pv$delka,15) # přiřazení jedince k typu zásahu (k=3 typy, m=5 opakování v jednom typu) zasah <- rep(1:3, times = 5) # čísla 1 až k zopakuje m-krát zasah sample(zasah) # náhodně vybere všechna čísla z vektoru zasah, tj. provede permutaci # permutace například: 3,3,1,2,3,2,2,1,3,1,1,3,2,1,2 # potom na prvním jedinci provedu zásah 3, na druhém zásah 3, na třetím zásah 1, atd. # NÁHODNÁ VELIČINA # BARVA PASTELKY: odhad pravděpodobnosti, že vyberu červenou pastelku: # POČET ČERVENÝCH: odhad pravděpodobnosti, že v mém výběru bude právě ...(k) červených pastelek choose(n,k) # kombinační číslo: kolik možností je pro umístění "k" červených pastelek mezi "n" všech pastelek? factorial(x) # příkaz pro výpočet faktoriálu z čísla "x" p= # definuj náš odhad pravděpodobnosti výběru červené pastelky q=1-p # dopočítám odhad pravděpodobnosti, že vybraná pastelka nebude červená choose(10,1)*p*q^9 # P(1 červená) choose(10,2)*p^2*q^(10-2) # P(2 červené) # zapiš vektor výsledných pravděpodobností: prsti<-c() cumsum(prsti) # nakresli graf: plot(prsti, xlab="počet červených pastelek ve výběru",ylab="pravděpodobnost") plot(prsti, xlab="počet červených pastelek ve výběru",ylab="pravděpodobnost",pch=16, col="red") plot(cumsum(prsti), xlab="počet červených pastelek ve výběru",ylab="kumulativní pravděpodobnost", pch=16) grid() # vše do jednoho grafu: plot(prsti, ylim=c(0,1),pch=16,col="red" ,xlab="počet červených pastelek ve výběru",ylab="pravděpodobnost") grid() points(cumsum(prsti),pch=2,col="blue") legend("right",legend=c("hustota", "distribuční fce"),pch=c(16,2),col=c("red","blue")) # DÉLKA PASTELKY hist(pv$delka)