4.5 Data z cizích formátů
4.5.1 Načítání dat z MS Excelu
Nejbezpečnější je načítat data z Excelu tak, že je vyexportujete do CSV souboru a načtete způsobem popsaným výše. Tak máte největší kontrolu nad tím, co se děje.
Data z Excelu je však v R možné načíst i přímo pomocí balíku readxl (umí načíst jak soubory.xls
, tak .xlsx
). Balík poskytuje dvě funkce: funkce excel_sheets()
vypíše seznam listů, které Excelový soubor obsahuje; funkce read_excel()
načte jeden list z Excelového souboru. Víc detailů viz dokumentace.
4.5.2 Data z jichých statistických programů
Někdy jsou data distribuovaná v nativním formátu některého statistického softwaru. K jejich načtení je možné použít zejména balíky haven a foregin.
Balík haven slouží k načítání souborů v nativních formátech programů SPSS, SAS a Stata (v některých případech i k jejich ukládání). K načítání dat poskytuje tyto funkce: read_dta()
a read_stata()
čtou soubory Stata DTA, read_por()
, read_sav()
a read_spss()
čtou soubory SPSS POR a SAV a funkce read_sas()
čte soubory SAS. Detaily viz dokumentace k balíku.
Balík foreign umí načítat mnoho dalších datových formátů (a do některých i zapisovat). Detaily viz dokumentace k balíku.
Pokud nějaký formát umí číst oba balíky, doporučuji jako první vyzkoušet balík haven.
Číst a ukládat data z a do formátu Gretlu snad umožňuje balík gretlReadWrite dostupný z GitHubu: https://github.com/dickoa/gretlReadWrite. Použití zcela bez záruky.
4.5.3 Připojení databází
Viz Spector: Data Manipulation with R, kap. 3.