Počítačová lexikografie Úvod Adam Rambousek ➢ study (verb) the act of texting, eating, and watching TV with an open textbook nearby ➢ účast nepovinná ➢ zápočet o písemný test (60 %) o projekt - vytvořte si vlastní slovník o pravděpodobně 15. prosince ➢ (29. září volno) Podmínky ukončení Lexikografie Jak být lexikografem? Historie ➢ hliněné tabulky z Ebla (Sýrie) ➢ sumerština - eblaština ➢ cca 2500-2250 př.n.l. Historie ➢ Sir Thomas Elyot: Dictionary (Bibliotheca Eliotae), 1538 ➢ John Withals: A Shorte Dictionarie for Yong Begynners, 1553 ➢ Robert Cawdrey: A Table Alphabeticall, 1604 o první výkladový slovník angličtiny o "hard wordes, borrowed from... for the benefit & helpe of Ladies, Gentlewomen, or any other unskilfull persons" Historie ➢ moderní slovníky, 17. století ➢ Samuel Johnson o 1747, Plan of a Dictionary of the English Language • analýza a žádost o peníze o 1755, A Dictionary of the English Language o 42 773 hesel o "to preserve the purity and ascertain the meaning our English idiom" "to fix the English language" Historie ➢ 19. století ➢ Noah Webster o An American Dictionary of the English Language, 1828 o 70 000 hesel, srovnání britské a americké angličtiny o odmítal zařazovat do slovníků neslušná slova ➢ Joseph Worcester o A Dictionary of the English Language ➢ 1830-1864 "válka slovníků" o přepracovaný Websterův slovník • Merriam-Webster Historie ➢ The Oxford English Dictionary (A New English Dictionary) o 1857, Philological Society, R. C. Trench, kritika slovníků o 1859, začátek sběru dat, dobrovolní čtenáři o 1879, James A. H. Murray jmenován hlavním editorem o 1882-1928, vychází 12 svazků o 15 487 stran, 240 000 hesel Historie ➢ Bartoloměj z Chlumce, Klaret, 14. století o latinsko-české slovníky o Vokabulář (gramatický) - odborná terminologie o Bohemář o Glosář - 7000 dvojic o Raro sequens gesta de bestiis cernis honesta. Lew leo wlkque lupusque le[e]na lwicze, nedvied ursus Ursaque nedviedicze, lupa wlczicze, dic ovis owcze, Koza capra, vulpes lyskaque canicula tysta. o Padenye sit casus, gmenowanecz nominativus, Ast vocativus wolanek danekque dativus, Accusativus wynowanek primaque prwa. Historie ➢ Daniel Adam z Veleslavína, 16. století o Dictionarium linguae latinae - latina-čeština o Nomenclator tribus linguis - latina-čeština-němčina o Nomenclator quadrilinguis + Silva quadrilinguis čeština-latina-řečtina-němčina, 958+300 stran, řazeno česky, zárodek hnízdování ➢ Jan Amos Komenský, 17. století o Thesaurus linguae Bohemicae - latinsko-český, česko-latinský, synchronní, diachronní, lexikální, gramatické informace, frazeologie o 20 let příprav... požár Lešna Historie ➢ Josef Jungmann, 19. století o Slovník česko-německý o 1815-1833, vydáno 1835-1839 o 5 svazků, 4694 stran, 120000 hesel o popisný výkladový slovník Historie ➢ Slovník spisovného jazyka českého, 1960-1971, 1989 o plán na menší slovník -> 4 500 stran, 192 908 hesel o první slovník s kodifikačním statutem o více terminologie (učebnice) o novinky: hnízdování, původ přejatých slov Historie? ➢ diachronní: Elektronický slovník staré češtiny ➢ nářeční: Český jazykový atlas ➢ slang: Slovník nespisovné češtiny ➢ onomastický: Slovník pomístních jmen na Moravě a ve Slezsku, Jak se bude vaše dítě jmenovat? ➢ frazeologie: Slovník české frazeologie a idiomatiky ➢ frekvenční řazení: Frekvenční slovník češtiny ➢ gramatický: Slovesa pro praxi, ➢ neologizmy: Nová slova v češtině 1+2 Různé Počítačová lexikografie ➢ 60. léta - používají se počítače, lexikografové píší na papír, specialisté přepisují do databáze, Brown Corpus ➢ 1978, Longman Dictionary of Contemporary English o první s omezeným slovníkem definicí, kontrolováno strojově o kódování pro NLP výzkum Slovníky a počítače ➢ 1980, COBUILD, University of Birmingham + Collins o korpus současných textů (Bank of English) o 1987, Collins COBUILD English Language Dictionary o první slovník založený na korpusových datech o nový styl definice - celé věty o If a person, animal, or other living thing is killed, something or someone causes them to die. ➢ 90. léta - vývoj specializovaných systémů pro tvorbu slovníků ➢ 1987, Text Encoding Initiative ➢ 1990, TEI Guidelines Slovníky a počítače Slovníky Jazyk: jednojazyčné, dvoujazyčné (směr), vícejazyčné➢ Obsah: obecný jazyk, terminologie, encyklopedie, oblast➢ Čas: synchronní, diachronní➢ Velikost (počet hesel)➢ Médium: tisk, CD, web➢ Řazení: abecední, frekvenční, věcné➢ Uživatelé: lingvisté, veřejnost, studenti, děti, studenti jazyka➢ Rozdělení slovníků