CJp022 Základy korpusové lingvistiky

Pedagogická fakulta
podzim 2022
Rozsah
0/2/0. 2 kr. Ukončení: z.
Vyučující
PhDr. Ivana Kolářová, CSc. (přednášející)
Garance
PhDr. Ivana Kolářová, CSc.
Katedra českého jazyka a literatury – Pedagogická fakulta
Kontaktní osoba: Petra Rozbořilová
Dodavatelské pracoviště: Katedra českého jazyka a literatury – Pedagogická fakulta
Rozvrh seminárních/paralelních skupin
CJp022/01: Út 16:00–17:50 učebna 72, kromě Út 25. 10., I. Kolářová
CJp022/02: Út 18:00–19:50 učebna 72, kromě Út 25. 10., I. Kolářová
CJp022/03: Po 15:00–16:50 učebna 72, kromě Po 24. 10., I. Kolářová
CJp022/04: Čt 16:00–17:50 učebna 72, kromě Čt 27. 10., I. Kolářová
Omezení zápisu do předmětu
Předmět je určen pouze studentům mateřských oborů.
Mateřské obory/plány
Cíle předmětu
Cílem kurzu je seznámit studenty s vyhledáváním v jazykovém korpusu a ukázat jim různé možnosti získávání a zpracovávání jazykových dat.
Předmět zohledňuje požadavky akreditace zaměřené na informační a komunikační technologie (ICT).
Výstupy z učení
Na konci kurzu je student schopen:
1. Prakticky užívat Český národní korpus; vyhledat v korpusu SYN2020 jevy hláskové/pravopisné, tvaroslovné a lexikální s využitím dotazů "základní", "slovní tvar", "lemma".
2. Sestavit složitější dotazy typu CQL např. pro vyhledání gramatického tvaru nebo fráze.
3. Zvolit vhodný postup vyhledávání jazykových jevů v ČNK při řešení konkrétního problému.
4. Utřídit vyhledané jevy pomocí korpusových nástrojů (frekvence, kolokace) a zpracovat je na základě lingvistických znalostí.
5. Využívat Intercorp;
6. Využívat další nástroje Českého národního korpusu: Morfio, Slovo v kostce.
Osnova
  • 1. Typy korpusů, reprezentativnost korpusů. KonText. Korpusy psané a mluvené češtiny. Atributy pro vyhledávání jevů v Českém národním korpusu.
  • 2. Pravopisné varianty v současné češtině, jejich typy. Vyhledávání pravopisných variant v korpusu SYN2020. Lemma, sublemma a word.
  • 3. Vyhledávání vybraných tvaroslovných variant, obzvláště dublet podstatných jmen. Dublety maskulinních substantiv. Posuzování jejich konkurence.
  • 4. Dublety femininních a neuterních substantiv. Posuzování jejich konkurence v Českém národním korpusu.
  • 5. Variantní slovesné tvary prézentní v Českém národním korpusu. Typy krýt, kupovat, mazat.
  • 6. Jiné variantní slovesné tvary v Českém národním korpusu.
  • 7. Adverbia, partikule a předložky v Českém národním korpusu.
  • 8. Vyhledávání vybraných slov a sousloví. Frazeologie v českém národním korpusu.
  • 9. Konkurenty slovotvorné v Českém národním korpusu. Hledání substantiv a adjektiv podle sufixů.
  • 10. Vyhledávání sloves podle sufixů a prefixů.
  • 11. Kombinace dotazů a další nástrojů webového rozhraní (pozitivní a negativní filtr).
  • 12. Tvorba vlastních subkorpusů. Využití Intercorpu.
  • 13. Morfio. Slovo v kostce.
Literatura
  • TUŠKOVÁ, Jana Marie. Deklinační systém femininních oikonym v češtině. Synchronní pohled na základě Českého národního korpusu. 1. vyd. Praha: Nakladatelství Lidové noviny, s. r. o. / Ústav Českého národního korpusu, 2011, 289 s. Studie z korpusové lingvistiky, sv. 17. ISBN 978-80-7422-138-5. info
  • ČERMÁK, František, Karel KUČERA a Vladimír PETKEVIČ. Korpusová lingvistika Praha 2011, 2 Výzkum a výstavba korpusů. Praha: Nakladatelství Lidové noviny, Ústav Českého národního korpusu, 2011. Studie z korpusové lingvistiky 15. ISBN 978-80-7422-115-6. info
  • ČERMÁK, František, Karel KUČERA, Vladimír PETKEVIČ a Alexander ROSEN. Korpusová lingvistika, Praha 2011. 3. Gramatika a značkování korpusů. Praha: Nakladatelství Lidové noviny, 2011, 225 s. Studie z korpusové lingvistiky 16. ISBN 978-80-7422-116-3. info
  • Grammar & Corpora 2007 :selected contributions from the conference Gramar and Corpora, Sept. 25-27, 2007, Liblice. Edited by František Štícha - Mirjam Fried. Vyd. 1. Praha: Academia, 2008, 443 s. ISBN 9788020016348. info
  • TUŠKOVÁ, Jana Marie. Variantní a dubletní tvary v současné deklinaci apelativních feminin. 1. vyd. Brno: Masarykova univerzita, 2006, 175 s. Spisy Pedagogické fakulty Masarykovy univerzity 58. ISBN 80-210-4138-2. info
  • Studie z korpusové lingvistiky. 1. vyd. Praha: Karolinum, 2000, 531 s. ISBN 80-7184-893-X. info
  • Manuál lexikografie. Edited by František Čermák - Renata Blatná. 1. vyd. Jinočany: H & H, 1995, 283 s. ISBN 80-85787-23-7. info
Výukové metody
Seminář - problémová metoda, řízený rozhovor o odborných problémech tohoto kurzu. Vyhledávání v Českém národním korpusu.
Analýza vyhledaných jazykových jevů.
Metody hodnocení
Podmínkou pro získání zápočtu je prokázání dovedností vyhledávat a zpracovávat jazykové jevy, které bude ověřeno testováním v závěrečném semináři. Studenti dostanou cca 15 úkolů zaměřených na vyhledání a zpracování vybraných jazykových jevů, z nichž musejí správně zvládnout minimálně 10. Předpokládá se též zpracovávání zadaných úkolů v průběhu semestru.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2018, podzim 2019, podzim 2020, podzim 2021, podzim 2023, podzim 2024.