11.3 Nativní R-kové binární soubory
Textové tabulární datové formáty jsou výborné při předávání dat mezi lidmi. Při vlastním zpracování dat je však výhodnější použít vlastní binární datový formát R. Jeho výhodou je, že data zabírají na disku méně místa, načítají se rychleji, mohou jakékoli datové typy včetně složitých objektů, obsahovat metadata včetně atributů a jde v nich ukládat i jiná data, než jsou tabulky (např. seznamy, pole, různé objekty apod.).
K uložení jednotlivých proměnných slouží funkce save()
. Nejdříve se uvedou jména všech proměnných, které se mají uložit, a pak cesta k souboru, kam se mají uložit (další parametry jsou popsány v dokumentaci). Cestu je nutné zadat pojmenovaných parametrem file
. Data se do těchto souborů obvykle ukládají s koncovkami .RData
nebo .rda
.
save(bmi_data, file = "bmi_data.RData")
Pokud je proměnných více, oddělí se čárkou:
save(var1, var2, var3, var4, file = "somefile.RData")
Někdy chcete uložit všechny proměnné, které máte v paměti R. K tomu slouží funkce save.image()
(detaily viz dokumentace).
Data uložená pomocí funkcí save()
nebo save.image()
načteme do pracovního prostředí R pomocí funkce load()
. Funkce načte všechny proměnné obsažené v daném datovém soubory včetně metadat, tj. není možné si vybrat jen jednotlivé proměnné uložené v souboru. Proměnným zůstanou jejich původní jména, tj. není možné načíst vybranou proměnnou do nové proměnné. Funkce data načte do pracovního prostředí, tj. nevrací je jako hodnotu funkce. Jediným důležitým parametrem funkce load()
je cesta k datovému souboru:
load("bmi_data.RData")
Pokud chcete do nativního binárního souboru uložit jen obsah jedné proměnné a ten pak opět načíst do nové proměnné, můžete použít dvojici funkcí saveRDS()
a readRDS()
:
saveRDS(bmi_data, file = "bmi_data.RData")
<- readRDS("bmi_data.RData") bmi