PV210 Kvantitativní analýza internetového provozu

Fakulta informatiky
podzim 2008
Rozsah
2/0/1. 3 kr. (plus ukončení). Ukončení: zk.
Vyučující
Ing. Ladislav Lhotka, CSc. (přednášející), doc. RNDr. Eva Hladká, Ph.D. (zástupce)
Garance
prof. RNDr. Václav Matyáš, M.Sc., Ph.D.
Katedra počítačových systémů a komunikací – Fakulta informatiky
Kontaktní osoba: doc. RNDr. Eva Hladká, Ph.D.
Rozvrh
Po 12:00–15:50 B411
Předpoklady
základní kurs matematické analýza, pravděpodobnost a statistika
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
předmět má 37 mateřských oborů, zobrazit
Cíle předmětu
Přednáška se zabývá matematickými a vizualizačními metodami analýzy agregovaných charakteristik datového provozu TCP/IP ve vysokorychlostních sítích. Kromě objemových veličin (počty přenesených paketů a bajtů, počty toků) budou studovány zejména datové toky se zaměřením na detekci anomálií (poruch v síti, masivních útoků apod.). Probírané metody budou ilustrovány na vzorcích provozu z páteřní sítě CESNET2.
Na konci kurzu bude student schopen:
porozumět struktuře dat přenášených na páteřních okruzích;
používat základní metody analýzy agregovaných dat o internetovém provozu;
Osnova
  • Principy komunikace TCP/IP a hlavní kvantitativní charakteristiky datového provozu.
  • Datové toky IP, způsoby měření, nástroje na jejich analýzu a vizualizaci.
  • Charakteristické rysy hlavních aplikačních protokolů (HTTP, FTP, SSH, P2P, XMPP aj.)
  • Objemové veličiny (počty bajtů a paketů), statistická analýza časových řad, metody predikce
  • Rozložení klíčových položek IP toků (adres a portů) v časových vzorcích: entropie a principal component analysis
  • Kvantitativní charakteristiky vícerozměrných vzorků: fraktální a korelační dimenze, multifraktální míry
Literatura
  • Quittek J. et al. Requirements for IP Flow Information Export (IPFIX). RFC 3917, IETF, 2004.
  • Cook D., Swayne D. F.: Interactive and Dynamic Graphics for Data Analysis. Springer, 2007.
  • Kohler E. et al. Observed structure of addresses in IP traffic. IEEE/ACM Trans. Networking 14(6):1400-1412, 2006.
  • Peitgen H.-O., Jürgens H., Saupe D.: Chaos and Fractals: New Frontiers of Science. Springer, 1992.
  • Venables W. N., Ripley B. D.: Modern Applied Statistics with S. Springer, 2002.
  • Lakhina A., Crovella M., Diot C. Mining anomalies using traffic feature distributions. In: Proc. ACM SIGCOMM'05, p. 217-228, 2005.
  • Wei W. W. S. Time Series Analysis, Second Edition. Pearson, 2006.
Metody hodnocení
Klasická přednáška s průběžnými domácími úkoly, písemná zkouška.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2009, podzim 2010, podzim 2011, podzim 2012, podzim 2013, podzim 2014, podzim 2015, podzim 2016, podzim 2017, podzim 2018, podzim 2019, podzim 2021, podzim 2022, podzim 2023, podzim 2024.