Slovotvorná analýza PLIN059 Mgr. Dana Hlaváčková, Ph.D. Tvoření slov v češtině • derivace – odvozování, tvoření slov pomocí slovotvorných formantů (kombinace morfémů) • kompozice – skládání na úrovni slovních základů – konekt – život-o-pis, knih-tisk • abreviace – zkracování Segmentace slova • slovotvorný základ (kmen, kořen) • prefix – před základem slova (při-jít) • sufix – za základem slova (uči-tel) • koncovka – součástí sufixu, sama sufixem, mění se při flexi (zdrav-í) • postfix – za koncovkou, při flexi se nemění (jaký-si, jakého-si) Slovotvorné postupy • derivace – prefixace/deprefixace – připojení prefixu (dělat – při-dělat) – sufixace/desufixace – připojení sufixu (tábor-ník) – resufixace – náhrada jednoho sufixu druhým (vlas-atý – vlas-áč) – postup prefixačně-sufixační (při-hloup-lý) – diskrétní formant se, si • hláskové alternace v kmenovém základu – změna kvality konsonantů, změna kvantity vokálů – plech – plíšek, brát – branec Typologie změn – změna významu nebo slovního druhu • mutace – významová změna a změna slovního druhu (bílit – bělidlo) • transpozice – pouze změna slovního druhu (bílit – bílení) • modifikace – změna významového příznaku (bílit – obílit) Počítačové zpracování • slovo a jeho segmenty = řetězce znaků • derivace – připojení/odpojení, záměna části řetězce (prefix, sufix) • při automatickém zpracování nezáleží na směru převodu (slovo základové – odvozené) • možnost pracovat s hláskovými alternacemi • slovotvorná Ajka (CZPJ) • zachyceny jednoduché případy derivace (učit – učitel, boj – bojiště) • bez alternací, významově chybné dvojice (míč – mít) Deriv • webové rozhraní – Deriv deb.fi.muni.cz/deriv • autor Pavel Šmerk (1. verze Radek Sedláček) • generování seznamů slov (prefix, sufix) • generování dvojic slov (až n-tic) na základě přidání, odebrání, záměny prefixu/sufixu • omezení pomocí morfologické značky (atributivní systém) • hláskové alternace – regulární výrazy • propojení s DEBDictem, KonTextem a SketchEnginem (SYN2000, czTenTen12) • Derivanče (derivační analyzátor češtiny) • https://nlp.fi.muni.cz/projekty/derivance/ DeriNet • http://ufal.mff.cuni.cz/derinet/search • vizualizace slovotvorných vztahů a slovotvorného hnízda • Zdeněk Žabokrtský, Magda Ševčíková, Jonáš Vidra • vyhledává v 1 mil. slovních jednotek • není zahrnuto skládání slov • podporováno korpusovými daty • zapojen morfologický analyzátor, derivační a gramatická pravidla • největší hnízdo – 31 lexémů (hrát, řezat) • největší hloubka – 7 úrovní (vědět) Morfio • ÚČNK • autoři – Václav Cvrček, Pavel Vondřička • vyhledávání přímo v korpusu SYN2010/SYN2005 • společná báze, specifické formanty • omezení pomocí morfologické značky (poziční systém) • možnost hledání alternací (uživatelské rozhraní)