FF:VIK31A07 Úvod do počítačové lingvistiky - Informace o předmětu
VIK31A07 Úvod do počítačové lingvistiky
Filozofická fakultapodzim 2001
- Rozsah
- 1/1/0. 3 kr. Ukončení: z.
- Vyučující
- prof. PhDr. Klára Osolsobě, Dr. (přednášející)
- Garance
- PhDr. Pavla Kánská
Ústav českého jazyka – Filozofická fakulta
Kontaktní osoba: PhDr. Pavla Kánská - Omezení zápisu do předmětu
- Předmět je otevřen studentům libovolného oboru.
Předmět si smí zapsat nejvýše 100 stud.
Momentální stav registrace a zápisu: zapsáno: 0/100, pouze zareg.: 0/100, pouze zareg. s předností (mateřské obory): 0/100 - Osnova
- Informační technologie a jazykové korpusy. & Vznik korpusové lingvistiky a k čemu jsou korpusy. & Budování korpusů, korpusová data. Typy korpusů a standardizace, SGML, TEI. Sběr dat pro korpusy a reprezentativnost korpusů. Údržba korpusů. & Korpusové nástroje -- manažery. Korpusový administrátor (CQP, CUE). Programy pro tvorbu konkordancí (KWIC) -- OCP. Využití regulárních výrazů. Statistické programy (absolutní, relativní četnosti, M/I, T-score). Třídicí programy pro konkordance. Konverzní programy mezi různými kódy. Práce s atributy a značkami (tagy). & Anotované korpusy a značkování. Základní úroveň značkování -- metastruktura textu -- SGML. Gramatické značkování na úrovni slovních druhů (LEMMA). Syntaktické značkování na úrovni větných struktur -- Pražský závislostní stromový korpus. Paralelní korpusy. & Využití korpusů a korpusových dat. Ukázky práce s korpusem -- ČNK. Studium kolokací a slovních spojení. Aplikace v oblasti teorie komunikace. & Počítačová lexikografie. & Co je to lexikografie a lexikologie. & Způsoby popisu významů slov (sémantické komponenty). & Typy elektronických slovníků. Výkladové -- heslo, struktura hesla a výběr hesel. Překladové -- vícejazyčné, vztah ke strojovému překladu. & Data pro tvorbu slovníků -- korpusy. & Softwarové nástroje pro lexikografy. Lexikografické stanice. Lemmatizátory. Desambiguátory (zpracování homonymií a frazeologických spojení). & Lexikografické standardy v rámci EU. & Možné experimenty s tvorbou lexikografického software.
- Další komentáře
- viz CJBB43 Úvod do korpusové lingvistiky I.
- Statistika zápisu (podzim 2001, nejnovější)
- Permalink: https://is.muni.cz/predmet/phil/podzim2001/VIK31A07