# Transformace dat ------------------------------------------------------ library(tidyverse) library(nycflights13) library(janitor) # Pracujte s datasetem flights flights # Zjistěte, který přepravce (carrier) mívá největší průměrné zpoždění při # příletu (arr_delay) # Tj. rozdělte dataset podle přepravce, vypočtěte průměrné zpoždění pro # každého přepravce zvlášť a průměry seřaďte sestupně. # Pomocí vhodné funkce slice_ vyberte z každého letiště odletu (origin) # let z největším zpožděním (dep_delay) # Proměnná hour udává plánovanou denní hodinu odletu # Rozdělte dataset podle této proměnné # a vypočtěte průměrné zpoždění při odletu (dep_delay) pro každou denní # hodinu # Dobrovolná, obtížnější úloha: # Zkuste výsledek předchozího kroku poslat do funkce ggplot() a # Znázornit průměry pomocí sloupcového grafu # Pomocí funkce count() zjistěte, který přepravce měl nejvíce letů # (argumentem sort nastavte, ať jsou četnosti seřazeny sestupně). # Výsledek pak pošlete do funkce mutate a přidejte nový sloupec p # s relativními četnostmi. # Import dat ------------------------------------------------------------ # Importujte soubor hotdogs_1.txt do R jako nový objekt (hotdogs) # Jako oddělovače jsou v něm použity tabulátory. # Chtěli bychom zároveň, ať se první sloupce importuje jako proměnný # typu faktor a zbylé dva sloupce jako proměnné typu integer # Importujte soubor swimming_pools.csv do R jako nový objekt (pools) # Oddělovačem jsou zde čárky. # Pomocí funkce clean_names() z balíčku janitor nastavte vhodnější názvy # sloupců # Sloupec postcode převeďte na proměnnou typu integer # a sloupec state na proměnnou typu faktor (můžete to udělat už při importu # nebo dodatečně pomocí funkce mutate)