#zaklady vizualizace #nactete tabulku podnety (oddelovac je carka) #prozkoumejte tabulku head(tabulka) str(tabulka) summary(tabulka) #cisteni dat v tabulce #ve sloupci zobrazeni a odpovedi je u kazdeho cisla navic slovo zobrazeni respektive odpovedi, nechte ve sloupci jen cislo tabulka$zobrazeni <- gsub(" Zobrazení", "", tabulka$zobrazeni) tabulka$odpovedi <- gsub(" Odpovědi", "", tabulka$odpovedi) #ze summary nebo str se zda, ze nektere sloupce nejsou cislo, to napravime nasledujicimi prikazy tabulka$pro <-as.numeric(as.character(tabulka$pro)) #as.character je zde velmi dulezite, pokud ho zrusite, nahradi se cislo za jeho poradi tabulka$proti <-as.numeric(as.character(tabulka$proti)) tabulka$zdrzelse <-as.numeric(as.character(tabulka$zdrzelse)) tabulka$zobrazeni <-as.numeric(as.character(tabulka$zobrazeni)) tabulka$odpovedi <-as.numeric(as.character(tabulka$odpovedi)) #celkem nemuzeme upravit na jeden prikaz, rychlejsi bude secist pro, proti a zdrzel se tabulka$celkem = tabulka$pro + tabulka$proti + tabulka$zdrzelse #spocitejte procentualni hodnotu hlasu pro tabulka$pro_proc = tabulka$pro/tabulka$celkem*100 #zobrazeni histogramu hist(tabulka$pro_proc) #histogram lze upravovat v nekolika parametrech hist(tabulka$pro_proc, main="Podil hlasu pro v clenskych podnetech", #hlavni nadpis xlab="podil hlasu (v %)", #popis osy x ylab="pocet", #popis osy y xlim=c(0,100), #rozsah zobrazeni na ose x ylim=c(0,150), #rozsah zobrazeni na ose y breaks=5, #kolik vznikne kategorii col="blue", #barva #odkaz na barvy v R http://www.stat.columbia.edu/~tzheng/files/Rcolor.pdf freq=TRUE) # pokud je false, tak zobrazi kolik procent z dat kazdy sloupec predstavuje #0odkaz na barvy v R http://www.stat.columbia.edu/~tzheng/files/Rcolor.pdf #lze pripsat popisky k sloupcum h <- hist(tabulka$pro_proc, ylim=c(0,150)) text(h$mids,h$counts,labels=h$counts, adj=c(0.5, -0.5)) #vytvorte histogram pro promenou odpovedi (promenna ukazuje pocet prispevku v diskusi o clenskem podnetu) # napiste nazev, popiste osy, zaridte, aby kategorie byly zhruba po deseti, aby nejvyssi sloupec histogramu nepresahoval osu y a aby sloupce byly cervene hist(tabulka$odpovedi, breaks=106, ylim=c(0,350), xlim =c(0,1060), main = "pocet prispevku v diskusich k celnskym podnetum", ylab="pocet", xlab="prispevky v diskusi", col="red") #scatterplot plot(tabulka$odpovedi, tabulka$pro_proc, main="Scatterplot", xlab="pocet zobrazeni fora ", ylab="podil hlasu pro ", pch=1) abline(lm(tabulka$pro_proc~tabulka$odpovedi), lty = 3, col="red") # pridani regresni cary (y~x) #symboly v R http://www.sthda.com/english/wiki/r-plot-pch-symbols-the-different-point-shapes-available-in-r # typy car http://www.sthda.com/english/wiki/line-types-in-r-lty #matice grafu pairs(~pro_proc+odpovedi+zobrazeni,data=tabulka, main="Scatterplot Matrix") ##ggplot - ukazka ukazuje vodstate totez co jsme udelali pomoci hist, ggpplot ale umoznuje delat mnohem peknejsi grafy, nez zakladni funkce #install.packages("ggplot2") library(ggplot2) qplot(tabulka$pro_proc, geom="histogram") ggplot(data=tabulka, aes(pro_proc)) + geom_histogram(breaks=seq(0, 100, by=10), # nebo lze pouzit binwidth = 10, col="orange", fill="blue", alpha = .5) + labs(title="Histogram", x="podil hlasu", y="pocet") + xlim(c(0,100)) + ylim(c(0,130))