11.7 Rychlá cesta k datům: balík rio
Pokud chcete rychle načíst data z datového souboru (lokálního nebo na webu, nekomprimovaného nebo komprimovaného) a nepotřebujete mít důkladnou kontrolu nad zpracováním dat, můžete použít balík rio. Tento balík představuje wrapper nad balíky, které načítají data včetně balíků readxl, haven, foreign a mnoha dalších, takže umí načíst všechna data, která umí načíst funkce implementované v těchto balících.
Balík implementuje především dvě funkce: import()
a export()
. Funkce import()
načte data z datového souboru a uloží je do proměnné třídy data.frame. Funkce export()
uloží data do datového souboru. Typ datového souboru odhadují obě funkce z koncovky dat. Načítání a ukládání některých méně obvyklých formátů může vyžadovat doinstalování potřebných balíků. Seznam všech podporovaných formátů obsahuje viněta k balíku.
Funkce import()
vyžaduje nutně jen jeden parametr: cestu k načítanému souboru. Pokud by se formát dat odhadl z koncovky souboru špatně, umožňuje parametr format
zadat typ dat ručně. Parametr setclass
umožňuje změnit datovou strukturu, kterou funkce vrátí. Implicitně je to data.frame, ale povolený je mimo jiné i tibble. Další parametry najdete v dokumentaci k funkci.
Funkce export()
vyžaduje nutně jméno ukládané tabulky a jméno souboru včetně cesty. Další parametry opět najdete v dokumentaci.
Několik příkladů použití:
library(rio)
<- import("data/reading_and_writing/bmi_data.csv.gz")
bmi <- import("data/reading_and_writing/chile.dta")
chile <- import("data/reading_and_writing/FebPwtExport9292016.xlsx")
xls export(bmi, "test.csv")
export(bmi, "test.sav")