Základy využití korpusu v praxi cjbb75_LS_2021 Pondělí: 8.00-9.30. G13 Od 8. 3. 2020 dále – kontaktní výuka jednou za 14 dní. V týdnech bez kontaktní výuky budou zadány úkoly, které studenti individuálně zpracují formou písemného referátu, v němž popíšou pracovní postup (získání dat z korpusu k zadanému lingvistickému problému). K referátům mohou klást vyučující dotazy (písemně e-mailem). Na začátku následující hodiny vyučující stručně shrne úroveň referátů. Odevzdání 5 zadaných referátů je podmínkou ukončení kurzu. Na konci kurzu napíší studenti test on-line. Cvičný test bude k dispozici 10. 5. 2021. 1. 3. Úvodní hodina (definice korpusu, korpusová pracoviště a dostupné korpusy, korpus a internet, korpusové manažery, ÚČNK, webové rozhraní Kontext, registrace uživatele). 8. 3. Kontext – příkazový řádek – vyhledávání podle atributů (word, lemma, tag, lc), cql, regulární výrazy, KWIC, konkordanční seznam a frekvenční seznam jako zdroj poznání o jazykových vlastnostech vyhledaných jednotek (způsob psaní/pravopis: přejatá slova /mailovat/mejlovat/majlovat/, aplikace pravidel – varianty /ismus/izmus/, varianty pravopisu zdrobnělin vlastních jmen – Terinka/Terynka). 15. 3. Dú: Jaká jsou lemmata/tvary adaptovaných slov a jaké je frekvenční rozložení variantních způsobů jejich grafické realizace (slovesa utvořená od anglických základů: použí(va)t Skype= ????, použí(va)t google = ???, použí(va)t twitter = ???). 22. 3. Korpus jako slovník – počítačová lexikografie. Slovníky založené na korpusech. Využití korpusu jako on-line slovníku. 29. 3. Dú: cvičení na hledání významů slov – prezentace. 12. 4. Korpus jako zdroj dat pro výzkum slovotvorby. Jak zadat dotaz pro hledání slov, která mají společné slovotvorné vlastnosi. Adjektiva od sloves typu lyžující. Slovní formulace – tvrzení, která musí platit, podmínka nutná/dostačující, využití regulárních výrazů a logických operací, využití filtrů, pozorování dat a úprava dotazu. 19. 4. Dú: Jak lze v korpusu vyhledat substantiva tvořená ze sloves příponou –ní/-tí, která označují substantivizovaný děj základového slovesa (např. hrát na klavír/karty → hraní na klavír/karet). 26. 4. Korpus jako zdroj dat pro výzkum tvarosloví. Tvary substantiv. Slovní formulace – tvrzení, která musí platit, podmínka nutná/dostačující, využití regulárních výrazů a logických operací, využití filtrů, pozorování dat a úprava dotazu. 3. 5. Dú: V dativu singuláru mají feminina typu žena koncovku –e realizovanou jako [eě], kdežto feminina typu růže mají v dativu singuláru (stejně jako feminina typu píseň, kost) koncovku –i. Vzpomenete si na nějakou výjimku z tohoto pravidla? Svůj jazykový cit ověřte v korpusu a popište, jak byste doklady výjimky z tohoto pravidla hledali v korpusu. 10. 5. Korpus jako zdroj dat pro výzkum syntaxe. Syntaktické kritérium určení slovnědruhové platnosti slovního t varu. Jakou slovnědruhovou platnost může mít slovo hnát, popravčí, pila? Které syntaktické vlastnosti můžeme využít, abychom v korpusu našli chyby v disambiguaci? Od 10. 5. bude možné v IS vyplnit cvičnou písemku on-line. 17. 5. Dú: Sleduj v korpusu slovnědruhové značkování tvaru díky, které lze interpretovat vícero způsoby a pokus se navrhnout, jak postupovat při odhalení chyb v disambiguaci. 24. 5. Písemka : praktické zvládnutí formulace dotazu v cql Podmínky udělení zápočtu: 1. Odevzdání všech (5) domácích úkolů. Úkoly je třeba dodávat průběžně. Na začátku každé hodiny může být kdokoli požádán, aby vysvětlil, oč v úkolu šlo. Vyučující zodpoví případné nejasnosti. 2. Písemný test.