LAB 01 - 26.9.2012 Spustite si R. Pozn.: R v ucebni alebo na Vasom pocitaci nemusi mat k dispozicii vsetky pridavne balicky (napr. rggobi alebo rgl). V tom pripade sa pokuste potrebne balicky doinstalovat. R umoznuje instalaciu v uzivatelskych adresaroch. V pripade problemov mozete pouzit pristup k R na pocitaci helix.fi.muni.cz pomocou ssh (alebo wo windows program Xlaunch). Uzivatelske meno a heslo Vam dam v cviceni Linux: ssh -X username@helix.fi.muni.cz Windows: Po spusteni programu Xlaunch (odklikajte nastavenia) spustite putty, nastavite v menu X11 "X forwarding" a pripojite sa k pocitacu. Tym ziskate moznost pracovat s R na helixe (a dalsimi programami) v grafickom rezime. Nacitajte si datovy subor cars.data, obsahujuci informacie o automobiloch zo 70-tych a 80-tych rokov minuleho storocia. (Windows: Pracovny adresar v grafickej verzii R mozete zmenit cez File -> Change dir) mpg - dojazd v milach na galon (prevratena hodnota spotreby) cylinders - pocet valcov displacement - objem motora horsepower - vykon motora weight - hmotnost acceleration - zrychlenie model.year - rok vyroby peleus> cardata <- read.table("cars.data") Pomenujeme stlpce: peleus> names(cardata) <- c("mpg","cylinders","displacement","horsepower","weight","acceleration","model.year","origin") Nacitame nazvy aut: peleus> carnames <- read.table("cars.names") peleus> names(carnames) <- c("name") Spojime tabulky do jednej: peleus> cars <- data.frame(c(carnames,cardata)) Zakladne informacie o datovom subore ziskame: peleus> summary(cars) Prvych 5 riadkov: peleus> cars[1:5,] K stlpcom tabulky mozno pristupovat tiez podla mena: peleus> cars$mpg Mozeme zistit, ktore auta maju v nazve "ford": peleus> fords <- grep("ford",cars$name) .. a vytvorit si novu tabulku ich spotreby: peleus> data.frame(cars$name[fords],cars$mpg[fords]) .. fordy, ktore maju 4 a 8 valcov: peleus> bigfords <- fords[which(cars$cylinders[fords] == 8)] peleus> smallfords <- fords[which(cars$cylinders[fords] == 4)] .. a ich vypis z tabulky aut a priemerna spotreba (sirku vypisovanych riadkov mozete upravit prikazom "options(width=128)") peleus> cars[bigfords,] peleus> mean(cars[bigfords,]$mpg, na.rm=TRUE) peleus> mean(cars[smallfords,]$mpg, na.rm=TRUE) Lepsiu predstavu o datach ziskame vytvorenim 2-rozmernych priemetov dat: peleus> plot(cars) ... a priemetov zaujimavych dvojic premmenych podmienenych dalsou premennou: peleus> library(lattice) peleus> xyplot(displacement ~ mpg | cylinders, data = cars) ... pripadne 3d zobrazenie troch premennych peleus> cloud(displacement ~ cylinders * mpg, data = cars) za pomoci OpenGL: peleus> library(rgl) peleus> plot3d(cars[,2:4]) interaktivne: peleus> library(sculpt3d) peleus> sculpt3d(cars[,2:4]) alebo peleus> library(rggobi) peleus> g <- ggobi(cars) - V tejto chvili by ste mali mat urcity cit pre pracu s datami v R. Urobte dalsie kroky, ktore by ste mohli potrebovat pri navrhovani vlastnych sposobov vizualizacie: - farba a tvar symbolov v prikazoch plot(), cloud() a plot3d() - farba pozadia, styl pisma - ine typy grafov (polarne suradnice, paralelne osi) - dokreslovanie objektov do grafu - ulozenie obrazku do suboru (pri hladani vhodnych funkcii Vam moze okrem ineho pomoct R wiki na adrese http://rwiki.sciviews.org/doku.php - pozri napr. http://rwiki.sciviews.org/doku.php?id=graph_gallery:graph38) alebo prikazy help() a help.search(). peleus> help(help) Moderne vizualizacie dat poskytuje balik ggplot2 (http://ggplot2.org/)