CJp022 Základy korpusové lingvistiky

Pedagogická fakulta
podzim 2021
Rozsah
0/1/0. 1 kr. Ukončení: z.
Vyučující
PhDr. Ivana Kolářová, CSc. (přednášející)
Garance
PhDr. Ivana Kolářová, CSc.
Katedra českého jazyka a literatury – Pedagogická fakulta
Kontaktní osoba: Petra Rozbořilová
Dodavatelské pracoviště: Katedra českého jazyka a literatury – Pedagogická fakulta
Rozvrh seminárních/paralelních skupin
CJp022/01: Čt 23. 9. až Čt 16. 12. Čt 15:00–15:50 učebna 72, I. Kolářová
CJp022/02: Čt 23. 9. až Čt 16. 12. Čt 16:00–16:50 učebna 72, I. Kolářová
CJp022/03: Čt 23. 9. až Čt 16. 12. Čt 14:00–14:50 učebna 72, I. Kolářová
CJp022/04: Po 20. 9. až Po 13. 12. Po 15:00–15:50 učebna 72, I. Kolářová
Omezení zápisu do předmětu
Předmět je určen pouze studentům mateřských oborů.
Mateřské obory/plány
Cíle předmětu
Cílem kurzu je seznámit studenty s vyhledáváním v jazykovém korpusu a ukázat jim různé možnosti získávání a zpracovávání jazykových dat.
Předmět zohledňuje požadavky akreditace zaměřené na informační a komunikační technologie (ICT).
Výstupy z učení
Na konci kurzu je student schopen:
1. Prakticky užívat Český národní korpus; vyhledat v korpusu SYN2020 jevy hláskové/pravopisné, tvaroslovné a lexikální s využitím dotazů "základní", "slovní tvar", "lemma".
2. Sestavit složitější dotazy typu CQL např. pro vyhledání gramatického tvaru nebo fráze.
3. Zvolit vhodný postup vyhledávání jazykových jevů v ČNK při řešení konkrétního problému.
4. Utřídit vyhledané jevy pomocí korpusových nástrojů (frekvence, kolokace) a zpracovat je na základě lingvistických znalostí.
Osnova
  • 1. Typy korpusů, reprezentativnost korpusů. KonText. Korpusy psané a mluvené češtiny.
  • 2. Vyhledávání vybraných tvaroslovných variant, obzvláště dublet. Posuzování jejich konkurence.
  • 3. Vyhledávání vybraných slov a sousloví. Frazeologie v českém národním korpusu.
  • 4. Konkurenty slovotvorné v Českém národním korpusu.
  • 5. Vytváření dotazů pro zjišťování zvolených syntaktických struktury v korpusu SYN2020. Kombinace dotazů a další nástrojů webového rozhraní (pozitivní a negativní filtr).
  • 6. Tvorba vlastních subkorpusů.
  • 7. Zhodnocení jazykových jevů nalezených v korpusu z různých hledisek.
Literatura
  • TUŠKOVÁ, Jana Marie. Deklinační systém femininních oikonym v češtině. Synchronní pohled na základě Českého národního korpusu. 1. vyd. Praha: Nakladatelství Lidové noviny, s. r. o. / Ústav Českého národního korpusu, 2011, 289 s. Studie z korpusové lingvistiky, sv. 17. ISBN 978-80-7422-138-5. info
  • ČERMÁK, František, Karel KUČERA a Vladimír PETKEVIČ. Korpusová lingvistika Praha 2011, 2 Výzkum a výstavba korpusů. Praha: Nakladatelství Lidové noviny, Ústav Českého národního korpusu, 2011. Studie z korpusové lingvistiky 15. ISBN 978-80-7422-115-6. info
  • ČERMÁK, František, Karel KUČERA, Vladimír PETKEVIČ a Alexander ROSEN. Korpusová lingvistika, Praha 2011. 3. Gramatika a značkování korpusů. Praha: Nakladatelství Lidové noviny, 2011, 225 s. Studie z korpusové lingvistiky 16. ISBN 978-80-7422-116-3. info
  • Grammar & Corpora 2007 :selected contributions from the conference Gramar and Corpora, Sept. 25-27, 2007, Liblice. Edited by František Štícha - Mirjam Fried. Vyd. 1. Praha: Academia, 2008, 443 s. ISBN 9788020016348. info
  • TUŠKOVÁ, Jana Marie. Variantní a dubletní tvary v současné deklinaci apelativních feminin. 1. vyd. Brno: Masarykova univerzita, 2006, 175 s. Spisy Pedagogické fakulty Masarykovy univerzity 58. ISBN 80-210-4138-2. info
  • Studie z korpusové lingvistiky. 1. vyd. Praha: Karolinum, 2000, 531 s. ISBN 80-7184-893-X. info
  • Manuál lexikografie. Edited by František Čermák - Renata Blatná. 1. vyd. Jinočany: H & H, 1995, 283 s. ISBN 80-85787-23-7. info
Výukové metody
Seminář - problémová metoda, řízený rozhovor o odborných problémech tohoto kurzu. Vyhledávání v Českém národním korpusu.
Analýza vyhledaných jazykových jevů.
Metody hodnocení
Podmínkou pro získání zápočtu je prokázání dovedností vyhledávat a zpracovávat jazykové jevy, které bude ověřeno testováním v závěrečném semináři. Studenti dostanou cca 10 úkolů zaměřených na vyhledání a zpracování vybraných jazykových jevů, z nichž musejí správně zvládnout minimálně 7. Předpokládá se též zpracovávání zadaných úkolů v průběhu semestru.
Další komentáře
Studijní materiály
Předmět je vyučován každoročně.
Předmět je zařazen také v obdobích podzim 2018, podzim 2019, podzim 2020, podzim 2022, podzim 2023, podzim 2024.