library("dplyr") library("sqldf") # Data: University of California, Berkeley; 1973; pocty studentu hlasicich se na univerzitu data("UCBAdmissions") tab <- as.data.frame(UCBAdmissions) majors <- data.frame( major = c("math", "biology", "engineering", "computer science", "history", "architecture"), Dept = c(LETTERS[1:5], "Other") ) tab %>% str majors %>% str sqldf("select * from tab") sqldf("select * from majors") # Vsechny nasledujici ukoly reste pomoci prikazu knihovny "plyr" a pomoci SQL prikazu v "sqldf" # Vypiste vsechny unikatni departmenty # Zjistete pocet unikatnich departmentu tab %>% distinct(Dept) tab %>% distinct(Dept) %>% nrow sqldf("select distinct Dept from tab") sqldf("select count(distinct Dept) from tab") # Vypiste radky z "tab" odpovidajici zenam # Zjistete celkovy pocet zen hlasisich se na UCB # Vypiste radky z "tab" odpovidajici prijatym uchazecum # Zjistete celkovy pocet prijatych uchazecu # Vypiste tabulky poctu uchazecu rozdelenou podle pohlavi a prijeti/zamitnuti # Vypiste pohlavi, departmenty a pocty prijatych uchazecu, seradte sestupne podle poctu prijatych # Vypiste prumerne pocty prijatych v jednotlivych departmentech, seradte sestupne podle prumerneho poctu prijatych # Zjistete nejvetsi pocet prijatych uchazecu z tabulky "tab" # Naleznete kod departmentu s nejvetsim poctem prijatych uchazecu # Naleznete kod departmentu s nejvetsim poctem prijatych uchazecek-zen # Spojte (inner join) tabulky "tab" a "majors" podle sloupce "Dept" # Totez jako left join # Totez jako right join