tabulka <- read.csv2 (file = "rodiny.csv") summary (tabulka) t.j <- tabulka$pocet_chlapcu k <- length (t.j) # Z nahodneho vyberu mame empiricke cetnosti N.j <- tabulka$pocet_rodin n <- sum (N.j) # Dopocitame teoreticke cetnosti z predpokkladu binomickeho rozdeleni s n=5 a p=0.5 p.j <- dbinom (t.j, size = 5, prob = 0.5) sum (p.j) # kontrola: soucet psti = 1 # Sloupcove grafy empirickych a teoretickych cetnosti Matice <- rbind (N.j, n * p.j) # umistime empiricke i teoreticke cetnosti do jedne matice jako dva radky barplot (Matice, names.arg = t.j, beside = TRUE, xlab = "pocet chlapcu", ylab = "pocet rodin", col = c("orange", "cyan")) # 1. # Yarnoldovo kriterium q <- sum (n * p.j < 5) / k q n * p.j >= 5 * q # Yarnoldovo kriterium je splneno # Testovaci statistika K <- sum (N.j^2 / (n * p.j)) - n # Kvantil a porovnani K qchisq (0.95, df = k - 1) K >= qchisq (0.95, df = k - 1) # Anebo pomoci p-hodnoty 1 - pchisq (K, df = k - 1) # Anebo funkci chisq.test chisq.test (N.j, p = p.j) # Hypotezu o shode dat s rozdelenim Bi (5; 0.5) nezamitame # 2. # Podminka dobre aproximace n * p.j >= 5 # Prvni a posledni kategorie maji nizke teoreticke cestnosti # Sloucime tedy prvni 2 a posledni 2 kategorie t.j2 <- c ("0-1", t.j[3:4], "4-5") k2 <- length (t.j2) N.j2 <- c (sum (N.j[1:2]), N.j[3], N.j[4], sum (N.j[5:6])) p.j2 <- c (sum (p.j[1:2]), p.j[3], p.j[4], sum (p.j[5:6])) sum (N.j2) sum (p.j2) Matice <- rbind (N.j2, n * p.j2) # umistime empiricke i teoreticke cetnosti do jedne matice jako dva radky barplot (Matice, names.arg = t.j2, beside = TRUE, xlab = "pocet chlapcu", ylab = "pocet rodin", col = c("orange", "cyan")) n * p.j2 >= 5 # podminka uz je OK # Testovaci statistika K <- sum (N.j2^2 / (n * p.j2)) - n # Kvantil a porovnani K qchisq (0.95, df = k2 - 1) K >= qchisq (0.95, df = k2 - 1) # Hypotezu o shode dat s rozdelenim Bi (5; 0.5) nezamitame