Slovotvorná analýza PUN059 Mgr. Dana Hlaváčková, Ph.D. Tvoření slov v češtině • derivace - odvozování, tvoření slov pomocí slovotvorných formantů (kombinace morfémů) • kompozice - skládání na úrovni slovních základů — konekt - život-o-pis, knih-tisk • abreviace - zkracování Segmentace slova • slovotvorný základ (kmen, kořen) • prefix - před základem slova (při-jít) • sufix - za základem slova (uči-tel) • koncovka - součástí sufixu, sama sufixem, mění se při flexi (zdrav-í) • postfix - za koncovkou, při flexi se nemění (jakýsi, jakéhosi) Slovotvorné postupy • derivace - prefixace/deprefixace - připojení prefixu [dělot- při-dělot) - sufixace/desufixace - připojení sufixu [tábor-ník) - resufixace - náhrada jednoho sufixu druhým (vlos-otý -vlos-áč) - postup prefixačně-sufixační [při-hloup-lý) - diskrétní formant (reflexivní zájmena se, si) • hláskové alternace v kmenovém základu - změna kvality konsonantů, změna kvantity vokálů - plech - plíšek, brát - branec Typologie změn - změna významu nebo slovního druhu • mutace - významová změna a změna slovního druhu {bílit - bělidlo) • transpozice - pouze změna slovního druhu [bílit -bílení) • modifikace - změna významového příznaku [bílit -obílit) Počítačové zpracování • slovo a jeho segmenty = řetězce znaků • derivace - připojení/odpojení, záměna části řetězce (prefix, sufix) • při automatickém zpracování nezáleží na směru převodu (slovo základové - odvozené) • možnost pracovat s hláskovými alternacemi • sloVOtVOmá Ajka (CZPJ; 90. léta 20. st, Radek Sedláček) • zachyceny jednoduché případy derivace [učit - učitel, boj-bojiště) • bez alternací, významově chybné dvojice [míč-mít) Deriv • webové rozhraní - Deriv • autor Pavel Šmerk (1. verze Radek Sedláček) • generování seznamů slov (prefix, sufix) • generování dvojic slov (až n-tic) na základě přidání, odebrání, záměny prefixu/sufixu • omezení pomocí morfologické značky (atributivní systém) • hláskové alternace - regulární výrazy (Klára Osolsobě) • propojení s DEBDictem, KonTextem a SketchEnginem (SYN2000, czTenTenl2) • Derivanče (derivační analyzátor češtiny) • https://nlp.fi.muni.cz/projektv/derivance/ DeriNet • http://ufal.mff.cuni.cz/derinet/search • vizualizace slovotvorných vztahů a slovotvorného hnízda • Zdeněk Žabokrtský, Magda Ševčíková, Jonáš Vidra • vyhledává v 1 mil. slovních jednotek z MorfFlexu • není zahrnuto skládání slov • podporováno korpusovými daty • zapojen morfologický analyzátor, derivační a gramatická pravidla Morfio • UCNK, https://morfio.korpus.cz/ • autoři - Václav Cvrček, Pavel Vondřička • vyhledávání přímo v korpusu SYN2005/SYN2010/SYN2015/Araneum • společná báze, specifické formanty • omezení pomocí morfologické značky (poziční systém) • možnost hledání alternací (uživatelské rozhraní) SLAN, CZEDD • využití pro výuku češtiny jako cizího jazyka • CZEDD - Český elektronický derivační slovník - Erik Citterberg, Adrana Válkové - https://czedd.netlify.app/insert • SLAN - Slovotvorný analyzátor pro výuku češtiny pro cizince - https://slan.ped.muni.ez/#/