Úvod do kvantitativní lingvistiky ZS 2022 Kvantitativní lingvistika • co to je? • co je cílem lingvistiky obecně? Kvantitativní lingvistika • Wikipedia • https://cs.wikipedia.org/wiki/Kvantitativn%C3%AD_lingvistika • https://en.wikipedia.org/wiki/Quantitative_linguistics • Nový encyklopedický slovník češtiny • https://www.czechency.org/slovnik/KVANTITATIVN%C3%8D%20LINGVISTIKA • Glottopedia • http://www.glottopedia.org/index.php/Aims_and_methods_of_quantitative_linguistics Kvantitativní lingvistika – základní východisko • frekvence jako fenomén, který má významný vliv na vlastnosti jazyka Kvantitativní lingvistika vs. základní lingvistické koncepty • frekvence jako fenomén, který má významný vliv na vlastnosti jazyka • frekvence vs. langue • frekvence vs. jazyková kompetence Kvantitativní lingvistika • frekvence jako fenomén, který má významný vliv na vlastnosti jazyka • teoretické předpoklady • srov. G. K. Zipf: The Psycho-Biology Of Language • Preface + Introduction Kvantitativní lingvistika • pokuste se najít nejbližší obory KL a charakterizujte vztahy mezi KL a těmito obory Kvantitativní lingvistika • korpusová lingvistika • NLP • komputační lingvistika • psycholingvistika • sociolingvistika • stylistika • strukturalismus • generativní lingvistika Kvantitativní lingvistika – úvodní shrnutí • teoretické předpoklady • metodologie Kvantitativní lingvistika - perspektivy • srov. např. Stefanowitsch, Anatol. (2020). Corpus linguistics: A guide to the methodology. Metodologie (teorie) ↓ verbální formulace hypotézy + operacionalizace ↓ matematická formalizace ↓ experiment ↓ matematické vyhodnocení experimentu ↓ lingvistická explanace Teorie • Co je teorie? • Jak poznat, která teorie je lepší než jiná? • Plyne něco z teorie? • Lingvistické teorie? Hypotéza • Co je hypotéza? • Formální vlastnosti hypotézy? • Lingvistické hypotézy… „Hypotéza“ v lingvistice • „V hláskosloví ani v jiných rovinách vodňanského herbáře nejsou prokazatelné další nářeční jevy z oblasti, kde nedošlo ke vzniku vibranty ř (východomoravské území), dáváme proto přednost hypotéze, že se jedná o nedbalý zápis“ (Černá 2005, s. 76); • „V nich se překlad Františka Vrby jeví jako silně zatížený mužským genderovým úhlem pohledu a estetikou vnímání; potvrzuje se tak původní hypotéza, že se spíše „staví na stranu“ mužského hrdiny, resp. autorského tvůrce a erotické líčení prezentuje spíše z jeho perspektivy…“ (Širokovská 2004, s. 23); • „Proč není samo slovo plémě ve staročeských textech doloženo v očekávaném významu, o tom lze vznášet různé hypotézy.“ (Šimandl 2007, s. 238); • „Hypotéza 2.1: Co-text je věrným zrcadlem (situačního) kontextu v tom smyslu, že všechny pro danou komunikační situaci relevantní kontextové vlastnosti jsou co-textem explicitně reflektovány, a mají tedy nějaký textový korelát. (…) Hypotéza 2.2: (Textový) kontext věrně reflektuje všechny vlastnosti jazykových jevů relevantní pro jejich užití. (Cvrček 2013, s. 24)“; • „Vycházeje z toho, že teorie valence i přes zjevná slabá místa představuje dobrý konstrukt lingvistické teorie, pokusím se nyní představit hypotézu modifikované valenční teorie (MVT) a formulovat základní principy této teorie.“ (Karlík 2001, s. 171n). Od popisu k hypotéze • předpokládaný vztah mezi dvěma vlastnostmi = působení mechanismu • zaměříme-li na vztahy mezi vlastnostmi, překračujeme hranice popisu jednotek směrem k odhalování toho, proč jsou sledované vlastnosti oněch jednotek takové, jaké jsou • nástrojem analýzy tohoto typu je empiricky testovatelná hypotéza Hypotéza • hypotéza (Greis 2009, s. 11) • tvrzení, které se týká více než jednoho jevu či případu; • má alespoň implicitně strukturu podmínkového souvětí, tj. „jestliže…, pak…“, případně „čím…, tím…“ (např. čím je slovo frekventovanější, tím je kratší); • je falzifikovatelné (tj. vyvratitelné) prostřednictvím experimentu, který dovoluje rozhodnout, zda predikce formulovaná prostřednictvím hypotézy je vyvrácena, či ne (vyhodnocení se většinou experimentu pomocí statistických testů). Hypotéza • která tvrzení jsou/nejsou testovatelnými hypotézami? 1. hodně mužů má pleš 2. pokud se v knize vyskytují biblický příběh, je to apokryf 3. jestli se zavedou řidičáky „na zkoušku“, může se snížit nehodovost mladých řidičů a řidiček 4. muži mají častěji pleš než ženy 5. jestliže se je sloveso dokonavé, častěji se na něj váže přímý akuzativní předmět než na sloveso nedokonavé 6. ženy jsou citlivé 7. čím je slovo frekventovanější, tím je větší jeho polysémie 8. jestli se zavedou řidičáky „na zkoušku“, sníží se nehodovost mladých řidičů a řidiček 9. nářečí často ovlivňují podobu mluveného jazyka obyvatel dané nářeční oblasti Hypotéza • pokuste se formulovat lingvistické hypotézy