# Vizualizace dat ------------------------------------------------------------- # Pracujte s datasetem penguins # Pomocí sloupcového grafu zobrazte rozdělení proměnné island # Pomocí histogramu zobrazte rozdělení proměnné flipper_length_mm # a zkuste nastavit jinou šířku intervalů a graf rozdělit na fazety # podle proměnné species # Pomocí grafu hustoty pravděpodobnosti zobrazte rozdělení proměnné # flipper_length_mm a barevně rozlište jednotlivé druhy (species), # a to jak barvou obrysů (color), tak výplně (fill) # Argumentem linewidth zvyšte tloušťku křivek na jeden bod # a argumentem alpha učiňte výplň poloprůhlednou # Pomocí skládaného sloupcového grafu ověřte, zda je relativní rozdělení pohlaví # u každého druhu tučňáka přibližně 50:50 # Pomocí bodového grafu ukažte vztah mezi délkou (bill_length_mm) a # tloušťkou zobáku (bill_depth_mm) # barvou i tvarem odlište jednotlivé druhy tučňáků # a komentářem popište, čím se jednotlivé druhy vyznačují # (v grafu by to mělo být jasně vidět) # Pomocí boxplotu zobrazte vztah mezi druhem tučňáka a jeho tělesnou # hmotností. Pomocí barvy (color) rozlište pohlaví tučňáka. # Transformace dat -------------------------------------------------------- # Pracujte s datasetem flights # Pomocí funkce filter() vyberte lety, které # - letěly do Houstonu (destinace IAH nebo HOU) # - letěly v letních měsících (červenec až září) # - dorazily se zpožděním větším než dvě hodiny, i když odletěly bez zpoždění # Seřaďte dataset flights podle zpoždění při odletu (sestupně) a zároveň # podle zpoždění při příletu (vzestupně) # Pomocí funkce distinct() zjistěte, zda každý den v roce # proběhl aspoň jeden let # Pomocí funkce mutate() doplňte do datasetu novou proměnnou speed, # která bude udávat rychlost letadla v kilometrech za hodinu. # Udělejte to tak, aby nově vytvořená proměnná byla zařazena na začátek datasetu # a aby se změny uložily. # Pomocí funkce rename() přejmenujte tuto proměnnou speed na speed_km_h # aby byly jasné jednotky měření # Pomocí funkce relocate() přesuňte proměnnou speed_km_h za sloupce day # Pomocí funkce select() z datasetu vyberte čtyři proměnné: # dep_time, dep_delay, arr_time a arr_delay # Zkuste vymyslet více než jeden způsob, jak toho dosáhnout.