FI:PA107 Projekt z korp. nástrojů - Informace o předmětu
PA107 Projekt z korpusových nástrojů
Fakulta informatikyjaro 2022
- Rozsah
- 0/2. 2 kr. (plus ukončení). Ukončení: z.
- Vyučující
- doc. Mgr. Pavel Rychlý, Ph.D. (přednášející)
- Garance
- doc. Mgr. Pavel Rychlý, Ph.D.
Katedra strojového učení a zpracování dat – Fakulta informatiky
Kontaktní osoba: doc. Mgr. Pavel Rychlý, Ph.D.
Dodavatelské pracoviště: Katedra strojového učení a zpracování dat – Fakulta informatiky - Rozvrh
- Po 14. 2. až Po 9. 5. Po 12:00–13:50 C416
- Omezení zápisu do předmětu
- Předmět je nabízen i studentům mimo mateřské obory.
- Mateřské obory/plány
- Analýza a zpracování obrazu (program FI, N-VIZ)
- Aplikovaná informatika (program FI, B-AP)
- Bioinformatika a systémová biologie (program FI, N-UIZD)
- Bioinformatika (program FI, B-AP)
- Computer Games Development (program FI, N-VIZ_A)
- Computer Graphics and Visualisation (program FI, N-VIZ_A)
- Computer Networks and Communications (program FI, N-PSKB_A)
- Cybersecurity Management (program FI, N-RSSS_A)
- Český jazyk se specializací počítačová lingvistika (program FF, B-FI)
- Formální analýza počítačových systémů (program FI, N-TEI)
- Grafický design (program FI, N-VIZ)
- Graphic Design (program FI, N-VIZ_A)
- Hardware Systems (program FI, N-PSKB_A)
- Hardwarové systémy (program FI, N-PSKB)
- Image Processing and Analysis (program FI, N-VIZ_A)
- Informační bezpečnost (program FI, N-PSKB)
- Informatika a druhý obor (program FI, B-EB)
- Informatika a druhý obor (program FI, B-FY)
- Informatika a druhý obor (program FI, B-GE)
- Informatika a druhý obor (program FI, B-GK)
- Informatika a druhý obor (program FI, B-CH)
- Informatika a druhý obor (program FI, B-IO)
- Informatika a druhý obor (program FI, B-MA)
- Informatika a druhý obor (program FI, B-TV)
- Informatika ve veřejné správě (program FI, B-AP)
- Information Security (program FI, N-PSKB_A)
- Kvantové a jiné neklasické výpočetní modely (program FI, N-TEI)
- Počítačová grafika a vizualizace (program FI, N-VIZ)
- Počítačové sítě a komunikace (program FI, N-PSKB)
- Principy programovacích jazyků (program FI, N-TEI)
- Řízení kyberbezpečnosti (program FI, N-RSSS)
- Řízení vývoje služeb (program FI, N-RSSS)
- Řízení vývoje softwarových systémů (program FI, N-RSSS)
- Services Development Management (program FI, N-RSSS_A)
- Sociální informatika (program FI, B-AP)
- Software Systems Development Management (program FI, N-RSSS_A)
- Software Systems (program FI, N-PSKB_A)
- Softwarové systémy (program FI, N-PSKB)
- Strojové učení a umělá inteligence (program FI, N-UIZD)
- Vývoj počítačových her (program FI, N-VIZ)
- Zpracování a analýza rozsáhlých dat (program FI, N-UIZD)
- Zpracování přirozeného jazyka (program FI, N-UIZD)
- Cíle předmětu
- Seminář umožňuje hlubší seznámení s vybranou oblastí korpusové lingvistiky při zpracování samostatného projektu v laboratoři zpracování přirozeného jazyka.
- Výstupy z učení
- Student bude po absolvování předmětu schopen: vytvořit textový korpus z různých zdrojů; použít automatické nástroje pro anotaci korpusů; vyhodnotit úspěšnost automatických nástrojů; prezentovat výsledky vyhodnocení.
- Osnova
- Účelem pracovního semináře je hlubší seznámení s vybranou oblastí korpusové lingvistiky řešenou v laboratoři zpracování přirozeného jazyka a aplikace získaných poznatků při zpracování samostatného projektu.
- Studenti, kteří v předchozím semestru absolvovali první díl tohoto semináře (PB106 Projekt z korpusové lingvistiky), mohou pokračovat v práci na započatých projektech. Absolvování prvního dílu semináře však není podmínkou účasti.
- Základní informace o laboratoři zpracování přirozeného jazyka a korpusové lingvistice lze nalézt na adrese http://www.fi.muni.cz/nlp/.
- Literatura
- OAKES, Michael P. Statistics for corpus linguistics. Edinburgh: Edinburgh University Press, 1998, xvi, 287 s. ISBN 0-7486-0817-6. info
- PALA, Karel, Pavel RYCHLÝ a Pavel SMRŽ. DESAM - Annotated Corpus for Czech. In Proceedings of SOFSEM 97. Heidelberg: Springer Verlag, 1997, s. 523-530. ISBN 3-540-63774-5. URL info
- Corpus processing for lexical acquisition. Edited by Bran Boguraev - J. (James) Pustejovsky. Cambridge: Bradford Book, 1996, xi, 245 s. ISBN 0-262-02392-X. info
- ALLEN, James. Natural language understanding. 2nd ed. Redwood City: Benjamin/Cummings Publishing Company, 1995, xv, 654 s. ISBN 0-8053-0334-0. info
- SINCLAIR, John McHardy. Corpus, concordance, collocation. Edited by Ronald Carter. Oxford: Oxford University Press, 1991, xviii, 179. ISBN 0194371441. info
- Computational lexicography for natural language processing. Edited by Ted Briscoe - Bran Boguraev. London: Longman, 1989, xiv, 310 p. ISBN 0-470-21187-3. info
- Výukové metody
- přednášky, práce na samostatném projektu, osobní konzultace, prezentace
- Metody hodnocení
- Projekt. Hodnocení na základě prezentace výsledků dosažených při řešení projektu.
- Vyučovací jazyk
- Angličtina
- Další komentáře
- Předmět je vyučován každoročně.
- Statistika zápisu (jaro 2022, nejnovější)
- Permalink: https://is.muni.cz/predmet/fi/jaro2022/PA107