ISKM55 Nástroje a metody datové analytiky

Filozofická fakulta
podzim 2022
Rozsah
1/1/0. 5 kr. Ukončení: k.
Vyučující
Mgr. Pavel Klammert (přednášející)
Jan Kudělka (přednášející)
Mgr. Jan Mayer (přednášející)
Mgr. Tomáš Marek (pomocník)
Garance
PhDr. Petr Škyřík, Ph.D.
Katedra informačních studií a knihovnictví – Filozofická fakulta
Kontaktní osoba: Mgr. Alice Lukavská
Dodavatelské pracoviště: Katedra informačních studií a knihovnictví – Filozofická fakulta
Rozvrh
St 16:00–17:40 B2.33
Předpoklady
TYP_STUDIA(N)
Předmět nepředpokládá, žádné předchozí technické znalosti (mimo standardní počítačové gramotnosti). Není potřeba žádné speciální programové vybavení.
Tento předmět z nové akreditace nahrazuje B předmět s kódem VIKMB42. Pokud máte absolvován předmět VIKMB42, ISKM55 si nezapisujte.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Předmět si smí zapsat nejvýše 20 stud.
Momentální stav registrace a zápisu: zapsáno: 2/20, pouze zareg.: 0/20, pouze zareg. s předností (mateřské obory): 0/20
Mateřské obory/plány
Cíle předmětu
Cílem předmětu je poskytnutí studentům vhled do problematiky datové analýzy a nejpoužívanějších metod či nástrojů pro práci s daty.
Po absolvování předmětu bude student za pomoci rozličných nástrojů schopen:
Získat data z rozličných zdrojů,
Vyčistit a zpracovat data do strojem použitelné podoby,
Provést na datech základní analytické operace,
Prezentovat výsledná zjištění pomocí interaktivních vizualizací.
Osnova
  • Úvod do problematiky datové analýzy
  • Základní datové formáty a práce s nimi (binární, textové)
  • Stručný úvod do internetových technologií (API)
  • Analýza dat prostřednictvím Microsoft Excel a Google Sheets
  • Základní metody data miningu a web scrapingu
  • Běžně používané nástroje pro práci s webovými daty (regulární výrazy, xpath)
  • Transformace a vizualizace dat pomocí nástroje business intelligence PowerBI
  • Stručný úvod do Python knihovny Pandas
Literatura
    povinná literatura
  • AHMAD, Zeeshan. Learn Regex the easy way. Github.com [online]. 2017 [cit. 2018-06-09]. Dostupné z: https://github.com/zeeshanu/learn-regex/blob/master/README.md
  • Open Data Handbook [online]. United Kingdom [cit. 2018-06-09]. Dostupné z: http://opendatahandbook.org/glossary/en/
    doporučená literatura
  • FERRARI, Alberto. Analyzing data with Power BI and Power Pivot for Excel. Redmond, WA: Microsoft Press, 2016. ISBN 978-1509302765.
  • BARILLA, Jiří, Pavel SIMR a Květuše SÝKOROVÁ. Microsoft Excel 2016 : podrobná uživatelská příručka. První vydání. Brno: Computer Press, 2016, 456 stran. ISBN 9788025148389. info
  • MCKINNEY, Wes. Python for data analysis : [agile tools for real world data]. 1st ed. Sebastopol, Calif.: O'Reilly, 2013, xiii, 452. ISBN 9781449319793. info
Výukové metody
Týdenní výuka.
Předmět mohou absolvovat i kombinovaní studenti. Průběh studia si kombinovaný student domluví s přednášejícím.
Metody hodnocení
Pro úspěšné ukončení tohoto předmětu je nutné a) plnit průběžné úkoly a studovat doporučenou literaturu, b) dle zadání správně vypracovat a obhájit závěrečný projekt.
Předmět je určen i pro kombinované studenty. Podmínky ukončení si kombinovaný student domluví s přednášejícím.
Další komentáře
Studijní materiály
Předmět je zařazen také v obdobích podzim 2019, podzim 2020, podzim 2021, podzim 2023.