setwd("C:/Jirka/Environment/Výuka/E7541 Analýza dat na PC/2022 podzim") #install.packages("xlsx") library("xlsx") ########################### # # # Fisherův exaktní test # # # ########################### sids<-data.frame("sids"=c(rep("ano", 29),rep("ano", 15),rep("ne", 7301),rep("ne", 11241)), "vek"= c(rep("do25",29),rep("nad25",15),rep("do25",7301),rep("nad25",11241))) sids.table<-table(sids$sids,sids$vek) fisher.test(sids.table) ############## # # # Korelace # # # ############## # Načtení dat data1.0<-read.xlsx("13_korelace_regrese_zadani.xlsx",2,startRow=4) data1.1<-data1.0[1:100,c("naphthalene","acenaphtylene","acenaphtene","fluorene","phenantrene","anthracene")] data1<-data1.1 # Vytvoření tabulky výsledků (Spearmanovy korelační koeficienty) ro<-as.data.frame(matrix(NA,length(colnames(data1)),length(colnames(data1)))) colnames(ro)<-colnames(data1) rownames(ro)<-colnames(data1) # Vnořené cykly pro výpočet koeficientů for(latka1 in colnames(data1)) { for(latka2 in colnames(data1)) { ro[latka1,latka2]<-cor.test(data1[,latka1],data1[,latka2],method="spearman")$estimate } } ############# # # # Regrese # # # ############# # Načtení dat data2.0<-read.xlsx("13_korelace_regrese_zadani.xlsx",3,startRow=8) data2.1<-data2.0[1:99,c("PCB.153","PCB.180")] colnames(data2.1)<-c("pcb153","pcb180") data2<-data2.1 # Vytvoření modelu model<-lm(pcb180~pcb153,data=data2) intercept<-model$coefficients[1] slope <-model$coefficients[2] # R2 summary(model)$r.squared # korelace cor.test(data2$pcb180,data2$pcb153) # Odhad chybějících hodnot odhady<-intercept+slope*data2$pcb153 odhady[which(is.na(data2$pcb180))]