FI:PA154 Nástroje pro korpusy - Informace o předmětu
PA154 Nástroje pro korpusy
Fakulta informatikyjaro 2013
- Rozsah
- 2/0. 2 kr. (plus ukončení). Doporučované ukončení: zk. Jiná možná ukončení: k, z.
- Vyučující
- doc. Mgr. Pavel Rychlý, Ph.D. (přednášející)
RNDr. Miloš Jakubíček, Ph.D. (cvičící)
RNDr. Vojtěch Kovář, Ph.D. (cvičící)
RNDr. Vít Suchomel, Ph.D. (pomocník) - Garance
- prof. Ing. Václav Přenosil, CSc.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. Mgr. Pavel Rychlý, Ph.D.
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Út 8:00–9:50 B411
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Aplikovaná informatika (program FI, N-AP)
- Bezpečnost informačních technologií (program FI, N-IN)
- Bioinformatika (program FI, N-AP)
- Český jazyk a literatura (program FF, M-FI) (2)
- Český jazyk a literatura (program FF, M-HS)
- Informační systémy (program FI, N-IN)
- Informatika (program FI, M-IN)
- Informatika (program FI, N-IN)
- Paralelní a distribuované systémy (program FI, N-IN)
- Počítačová grafika (program FI, N-IN)
- Počítačové sítě a komunikace (program FI, N-IN)
- Počítačové systémy (program FI, N-IN)
- Programovatelné technické struktury (angl.) (program FI, N-IN)
- Programovatelné technické struktury (program FI, N-IN)
- Služby - výzkum, řízení a inovace (angl.) (program FI, N-AP)
- Služby - výzkum, řízení a inovace (program FI, N-AP)
- Sociální informatika (program FI, B-AP)
- Teoretická informatika (program FI, N-IN)
- Učitelství výpočetní techniky pro střední školy (program FI, M-SS)
- Učitelství výpočetní techniky pro střední školy (program FI, M-TV)
- Učitelství výpočetní techniky pro střední školy (program FI, N-SS) (2)
- Umělá inteligence a zpracování přirozeného jazyka (program FI, N-IN)
- Zpracování obrazu (program FI, N-AP)
- Cíle předmětu
- Cílem předmětu je seznámit studenty se soudobými, převážně statistickými metodami, algoritmy a nástroji, které se používají pro zpracování velkých textových korpusů při jejich vytváření a následné extrakci informací.
Tyto nástroje nacházející praktické využití v mnoha oblastech zpracování přirozeného jazyka (poloautomatická tvorba textových korpusů, morfologická analýza a desambiguace, syntaktická analýza, efektivní indexace a vyhledávání v textových korpusech, statistický strojový překlad, sémantická analýza aj.).
Na konci kurzu budou studenti nejen schopni tyto nástroje používat, ale zejména budou rozumět souvisejícím teoriím a algoritmům, což často představuje klíčovou kompetenci pro správné (efektivní a korektní) použití těchto nástrojů. - Osnova
- Sada nástrojů NLTK
- Základy pravděpodobnosti a informační teorie
- Jazykové modelování, Noisy Channel Model
- Vyhlazování, algoritmus Expectation-Maximization
- Markovovy modely, Skryté Markovovy modely (HMMs)
- Viterbiho algoritmus
- Značkovací metody, značkování pomocí HMM, značkování založené na statistických transformačních pravidlech
- Statistické zarovnávání a strojový překlad
- Kategorizace a shlukování textu
- Grafické modely
- Paralelizace, MapReduce
- Literatura
- Výukové metody
- přednáška
- Metody hodnocení
- Písemná zkouška.
- Další komentáře
- Studijní materiály
Předmět je vyučován každoročně.
- Statistika zápisu (jaro 2013, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/jaro2013/PA154