PA220 Databázové systémy pro datovou analytiku

Fakulta informatiky
podzim 2020
Rozsah
2/0/0. 2 kr. (plus ukončení). Ukončení: zk.
Vyučující
doc. RNDr. Vlastislav Dohnal, Ph.D. (přednášející)
RNDr. Miriama Jánošová (pomocník)
Garance
doc. RNDr. Vlastislav Dohnal, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky
Rozvrh
Út 12:00–13:50 A320
Předpoklady
Znalost relačních databázových systémů, zpracování dotazů a transakcí a problematiky optimalizace dotazů, nejlépe v rozsahu předmětu PA152.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 29 mateřských oborů, zobrazit
Cíle předmětu
Seznámit s možnostmi databázových systémů a jejich využití v datové analytice: návrh a realizace datových skladů; dotazovací jazyky a nástroje pro integraci s externími výpočetními a analytickými platformami (Apache Hive); analytické databáze (Apache Impala).
Výstupy z učení
Student bude po absolvování předmětu schopen: - rozumět principům datových skladů; - představit typické příklady použití datových skladů; - navrhnout vhodný datový sklad; - prakticky realizovat analytické úlohy.
Osnova
  • Úvod do datových skladů a business intelligence.
  • Modelování dat pro datové sklady: dimenze, fakta.
  • Životní cyklus datového skladu.
  • Procesy pro tvorbu datového skladu: ETL.
  • Aplikace datových skladů: prodejní systémy, CRM.
  • Analytické databáze.
  • Jazyky pro realizaci analytický úloh.
  • Analytika velkých dat.
Literatura
    doporučená literatura
  • KIMBALL, Ralph a Margy ROSS. Data warehouse toolkit : the definitive guide to dimensional modeling. Third edition. Indianapolis: John Wiley & Sons, 2013, xxxiv, 564. ISBN 9781118530801. info
  • INMON, William H. Building the data warehouse. 4th ed. Indianapolis: Wiley Publishing, 2005, xxviii, 54. ISBN 0764599445. info
    neurčeno
  • Microsoft Corporation. Implementing a Data Warehouse with Microsoft SQL Server 2012. 2012. info
  • Oracle Warehouse Builder 11gR2getting started : extract, transform, and load data to build a dynamic, operational data warehouse. Edited by Bob Griesemer. Olton, Birmingham: Packt Pub., 2011, v, 408 p. ISBN 9781849683456. info
Výukové metody
Přednášky s elektronickými materiály.
Metody hodnocení
písemná zkouška -- zahrnuje jak testové otázky (výběr z možností), tak i volné odpovědi.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2021, podzim 2022, podzim 2023, podzim 2024.