Počítačová lexikografie PLIN059 Mgr. Dana Hlaváčková, Ph.D. Klasická lexikografie – tvorba slovníků • 1891 – Česká akademie věd a umění • 1911 – Kancelář slovníku jazyka českého • započal sběr slovníkového materiálu – excerpční lístky (próza, poezie, odborná literatura, publicistika) – z textů od r. 1770 – Lístkový lexikální archiv – 1911–1991 8 696 850 excerpt – v 2007 dokončeno skenování Klasická lexikografie – tvorba slovníků • 1935–1957 Příruční slovník jazyka českého (PSJČ) – v té době je k dispozici již 5 500 000 lístků – 9 svazků, 250 000 hesel • 1946 založen Ústav pro jazyk český • 1958–1970 Slovník spisovného jazyka českého (SSJČ) – kodifikační – 4 svazky, přes 190 000 hesel – v r. 1989 v 8 svazcích • 1978 Slovník spisovné češtiny pro školu a veřejnost (SSČ) – kodifikační – téměr 50 000 slov Klasická lexikografie – tvorba slovníků • excerpta – výběr heslových slov, uvádění příkladů použití • psaní slovníku podle abecedy různými autory • slovníky pouze v tištěné podobě v několika vydáních • až SSČ vzniká v elektronické podobě • struktura slovníkového hesla, často nekonzistentní Slovníkové heslo SSČ (1978) • zámek1, -mku m 1. zařízení (ovládané klíčem) umožňující něco zamknout, zavřít: z. na dveřích; patentní, visací, dozický z.; zavřít na z. ♦ (zavřít, být zavřen) na tři z-y, na pět, devět, desatero z-ů důkladně, nedobytně 2. jiné zařízení sloužící k uzavření, upevnění, spojení ap.: z. lovecké pušky; zámkový příd.: z-é pero; zámeček1, -čku m zdrob. • zámek2, -mku m rozlehlá výstavná budova, někdejší šlechtické sídlo: renesanční z.; z. Hluboká ♦ (stavět si) vzdušné, větrné z-y (dělat si) plané naděje; zámecký příd.: z-á věž; z. park; bývalí z-čtí páni; zámeček2, -čku m zdrob. Počítačová lexikografie • využití počítačů a elektronických zdrojů jazykových dat • tvorba a editace slovníků – webová rozhraní, formuláře – lexikografické stanice • jazyková data – korpusy, výběr heslových slov, příklady užití, frazeologie, sémantické informace • prohlížení slovníků – webová rozhraní Počítačová lexikografie – typické rysy • velké množství dat • rychlost zpracování • orientace na užívání slov v reálném kontextu • multimediální slovníky • zachycení aktuálního stavu jazyka • proměna struktury slovníkového hesla • vysoká konzistence • uživatelské rozhraní – GUI (Graphical User Interface) • XML – eXtensible Markup Language (rozšiřitelný značkovací jazyk) • multiplatformnost • možné převody do dalších formátů (pdf, html) terorismus [-iz-] (dř. též -ism), -mu m. (z lat.) způsob vlády vymáhající terorem poslušnost; hrůzovláda, krutovláda, despotismus: vojenský t.; nesnesitelný t.; demagogie a t.; přen. expr. to je t., nedejte si to líbit terorismus způsob vlády vymáhající terorem poslušnost hrůzovláda krutovláda despotismus vojenský terorismus nesnesitelný terorismus demagogie a terorismus přen.expr. to je terorismus, nedejte si to líbit Počítačová lexikografie • XML – počáteční a ukončovací značky – možnost zanořené struktury • DTD (Document Type Definition) – popis použitých značek • heslové slovo – headword – lemma • lemma = základní tvar slova (substantiva – nom. sg., adjektiva – nom. sg. masc., slovesa – infinitiv) Současné slovníkové platformy • DEB II (Dictionary Editor and Browser) – http://deb.fi.muni.cz – CZPJ FI MU Brno – Martin Povolný, Aleš Horák, Adam Rambousek – klient-server, servlety, webové rozhraní, XML – klienti – ruský heslář, TeDi, DEBVisDic, DEBDict, DEBWrite, NESČ • LEXIKO – webové hnízdo ÚJČ AV ČR – www.lexiko.ujc.cas.cz • Elektronické slovníky a zdroje ÚJČ AV ČR – http://ujc.cas.cz/