Kritická práce s daty 1 Radek Čech Program • data v lingvistice • deskriptivní statistika • hypotézy a jejich testování • možnosti textových analýz Data v lingvistice • povaha lingvistických dat • k jakým datům mámě přístup? • na základě jakých metod je můžeme získat? Data v lingvistice • data získána metodami (přehledně u Chromý 2020) • introspektivními • korpusovými (textovými) • behaviorálními • neurozobrazovacími Introspektivní metody • co je introspekce? Introspektivní metody • osobní povědomí mluvčího • analýza vlastních přesvědčení • „nahlížení“ od vlastního vědomí Introspektivní metody v lingvistice • k čemu se používá? • příklady? Introspektivní metody v lingvistice • dokumentace „typických“ příkladů • gramatičnost Dokumentace „typických“ příkladů • stojí na předpokladu (často implicitním), že na základě introspekce se popisují vlastnosti jazyka jako objektivní reality • důvody? Dokumentace „typických“ příkladů • stojí na předpokladu (často implicitním), že na základě introspekce se popisují vlastnosti jazyka jako objektivní reality • dichotomický pohled na jazyk • langue – parole • competence – performance • normativní pohled na jazyk(?) Dokumentace „typických“ příkladů • problémy? Dokumentace „typických“ příkladů • problémy? • interpersonální shoda (či její absence) • vliv teorie, expertní zkušenosti • otázka, co se takto vlastně popisuje • většinou se opírá o teoretické východisko • strukturalismus • generativní gramatika Gramatičnost • gramatičnost • inherentní vlastností jazykové struktury, tzn. věta (či jiný jazykový prostředek) je správný, je-li vytvořen v souladu s gramatickými pravidly daného jazyka Hrál jsem dva roky na flétnami Nerad se dívám televizi na Pavel daroval mamince Včera Petra česala dvě hodiny před plesem se Včera Petra dvě hodiny se před plesem česala Včera Petra česala se dvě hodiny před plesem Gramatičnost • gramatičnost • inherentní vlastností jazykové struktury, tzn. věta (či jiný jazykový prostředek) je správný, je-li vytvořen v souladu s gramatickými pravidly daného jazyka *Hrál jsem dva roky na flétnami *Nerad se dívám televizi na *Pavel daroval mamince *Včera Petra česala dvě hodiny před plesem se ?Včera Petra dvě hodiny se před plesem česala ?Včera Petra česala se dvě hodiny před plesem Gramatičnost • kategoriální, nebo škálová proměnná? Gramatičnost • kategoriální, nebo škálová proměnná? • jak vyhodnocovat, pokud škála? Gramatičnost & akceptabilita věty • akceptabilita • termín nadřazený gramatičnosti, věta je akceptovatelná podle zvolených kritérií (mohou se někdy dokonce vylučovat): gramatičnost, sémantická a pragmatická adekvátnost. Do sféry pragmatické (komunikační) adekvátnosti náleží mnohá mimolingvistická kritéria #Petr má rád rajčata a maminku #Jaro uvařilo Měsíc a paneláky nachystaly botičky • více viz heslo gramatičnost v NESČ • https://www.czechency.org/slovnik/GRAMATI%C4%8CNOST#akceptabilita Introspektivní metody v lingvistice (podle Chromý 2020) • expertní introspekce • laická introspekce Expertní introspekce • domnělá analýza „nezávislé“ entity • problémy • potenciál absence interpersonální shody • shoda dána stejnými východisky • introspekce zaměřená na analýzu užívaní jazyka Expertní introspekce • domnělá analýza „nezávislé“ entity • problémy • potenciál absence interpersonální shody • shoda dána stejnými východisky • introspekce zaměřená na analýzu užívaní jazyka • introspekce jako prostředek formulace hypotéz Laická introspekce • většinou se zkoumá větší počet respondentů • ideálně lidé neovlivněni teorií Laická introspekce • většinou se zkoumá větší počet respondentů • ideálně lidé neovlivněni teorií • výhody • zkoumání řídkých jevů • tzv. negativní evidence • analýza jazyka jako mentálního systému • srov. vliv dichotomií (langue-parol, kompetence-performace) • „eliminace“ nežádoucích projevů (přeřeknutí atp.) • souvisí s teoretickým rámcem Laická introspekce • pokud se zkoumá větší počet respondentů, jedná se de facto o empirickou analýzu • metodologické důsledky: výběr vzorku, povaha výzkumu, interpretace výsledků, statistika Laická introspekce – ilustrativní příklad Označte subjekt Praha byla hlavní město ČSR Hlavní město ČSR byla Praha To byla škola To byla hlavní města říše Laická introspekce • výsledky a důsledky takového přístupu (zpravidla) • absence kategorických výsledků → tendence • možnost detailnější analýzy výsledků • míra korelace různých způsobů vyhodnocení • faktory ((věk, pohlaví, vzdělání…) Introspekce • v psychologii od druhé pol. 19. stol. • vědomí jejích nedostatků • introspekce jako předmět výzkumu v psychologii • nemožnost přesně nahlížet své vnitřní procesy • introspekce zřejmě není přímým odrazem mentálních procesů • při introspektivním hodnocení vliv implicitních apriorních předpokladů • rozdílnost postoje k vlastní a cizí introspekci • tendence vnímat vlastní jako spolehlivou, ale u druhých ne • vliv vnějšího prostředí, viz následující slide Introspekce • Meili et al. (1967, s. 130): „Srovnáme-li výpovědi p. o. [pokusných osob] získané při různých výzkumech, vycházejících z divergentních teoretických základních názorů, nelze popřít, že p. o. hovoří řečí teorie, která udává tón výzkumu, i když se mluví o tzv. neovlivňujících pokynech.“ Introspekce • „With the decline of structuralism, introspective methods lost favor as a source of psychological data. Then, gone but not forgotten, introspection re-emerged in the 1960s with the rise of cognitive science, in which verbal protocols were a major source of data and a basis for much theorizing on problem solving. But despite their new popularity, introspective methods continued to exhibit the same weakness that had aroused critics in the structuralist period – the lack of effective means of obtaining interpersonal agreement among scientists on the interpretation of introspective data.“ Estes (2000, s. 21) Introspektivní metody v lingvistice - shrnutí • limity • i když nemůžeme jasně říct, že introspekce interpretuje kognitivní procesy „správně“, nemůžeme tvrdit ani opak • experimentální výzkum tzv. laické introspekce • obecně: introspekce často „prvním“ krokem analýz Korpusové (textové) metody • analýza pozorovatelného verbálního chování • usage-based models/grammars Korpusové (textové) metody • analýza pozorovatelného verbálního chování • co nám to vlastně umožňuje zkoumat? Modely jazykového chování a jejich interpretace jazykové chování (texty, promluvy) Modely jazykového chování a jejich interpretace jazykové chování (texty, promluvy) modely (např. gramatiky) Modely jazykového chování a jejich interpretace jazykové chování (texty, promluvy) modely (např. gramatiky) Modely jazykového chování a jejich interpretace langue / kompetence jazykové chování /parole (texty, promluvy) modely (např. gramatiky) Modely jazykového chování a jejich interpretace langue / kompetence jazykové chování /parole (texty, promluvy) modely (např. gramatiky) Modely jazykového chování a jejich interpretace langue / kompetence jazykové chování /parole (texty, promluvy) modely (např. gramatiky) Modely jazykového chování a jejich interpretace • jazykové chování • dynamika, „nestabilita“ • náhodné fluktuace Modely jazykového chování a jejich interpretace • jazykové chování • dynamika, „nestabilita“ • náhodné fluktuace • počínající tendence (srov. jazyková změna a její evoluce) Korpusové (textové) metody • výhody? Korpusové (textové) metody • výhody • nezávislost na postoji badatele • množství dat • rychlé zpracování • replikovatelnost Korpusové (textové) metody • výhody • nezávislost na postoji badatele • množství dat • rychlé zpracování • replikovatelnost • nevýhody Korpusové (textové) metody • výhody • nezávislost na postoji badatele • množství dat • rychlé zpracování • replikovatelnost • nevýhody • absence některých jevů • omezené možnosti sémantické analýzy Korpusové (textové) metody • korpus vs. text • Čech, R., Kosek, P., Mačutek, J., Navrátilová, O. (2020). Proč (někdy) nemíchat texty aneb Text jako výchozí jednotka lingvistické analýzy. Naše řeč, 103, 24-36. • blíže na některé z dalších přednášek Behaviorální metody • analýza chování jedince (resp. skupiny lidí) • záměrné ovlivňování faktorů • typicky psycholingvistika Behaviorální metody • velké množství metod • měření reakční časů • sledování očních pohybů • elicitace jazykové produkce Priming • priming poukazuje na to, jak jsou slova v mysli uspořádána → nejde o prostý soubor, ale o uspořádání do sítí • stimul aktivuje nejen dané slovo, ale i slova, která jsou podobná (sémanticky → pes, kočka; foneticky → den, sen; ortograficky atd.) • při akustickém vstupu do systému aktivujeme všechna lexikální hesla, která odpovídají tomu, co jsme slyšeli → jakmile vstup začne určité alternativy vylučovat, dochází k jejich deaktivaci více viz Altmann (2005, s. 84nn) • srov. J. Chromý: https://www.youtube.com/watch?v=n9ZReisTcoA&list=PLZDL1lmScljEoQ se65LEG2-bv9PIe_Ey8&index=32 Time-Reading Experiment • reflexe syntaktické struktury věty • vnímání plnovýznamových slov časově náročnější než slov s významem gramatickým (ta tvoří uzavřenou skupinu, frekvence atd.) • čas se prodlužuje i na konci jednotlivých vět Behaviorální metody - shrnutí • zpravidla analyzovány skupiny mluvčích → statistické vyhodnocení dat • replikovatelnost • dovoluje provádět analýzy jiného typu než analýzy jazykového chování Data v lingvistice - shrnutí • kromě expertní (individuální) introspekce • možnost komplexnějšího vyhodnocení → statistika • intersubjektivita • replikovatelnost Kritická práce z daty - poznámka • tento kurz = analýza jazykového chování (korpusy, texty) Modely jazykového chování a jejich interpretace • jazykové chování • dynamika, „nestabilita“ • náhodné fluktuace • počínající tendence (srov. jazyková změna a její evoluce) • pravidlo • tradičně pojato v deterministickém smyslu • jediná instance v rozporu s pravidlem = pravidlo neplatí Pravidlo – deterministické pojetí • slovesný přísudek se shoduje se subjektem Petr zpíval × *Petr zpívala Marie tancovala x *Marie tancoval Pravidlo – nedeterministické/stochastické pojetí • heslo SLOVOSLED NOMINÁLNÍ SKUPINY v NESČ“ Prepozice neshodného přívlastku je v principu negramatická Koupil mi nůžky na papír × *Na papír mi koupil nůžky (správná struktura ve čtení, při němž je na papír příslovečné určení). Poměrně běžná je však prepozice genitivních přívlastků přivlastňovacích, a to zvláště v hovorovém stylu: Mého pradědečka bratr padl v první světové válce Našeho souseda zahrádka je plná krásných květin Pravidlo – nedeterministické/stochastické pojetí • heslo SLOVOSLED NOMINÁLNÍ SKUPINY v NESČ“ Prepozice neshodného přívlastku je v principu negramatická Koupil mi nůžky na papír × *Na papír mi koupil nůžky (správná struktura ve čtení, při němž je na papír příslovečné určení). Poměrně běžná je však prepozice genitivních přívlastků přivlastňovacích, a to zvláště v hovorovém stylu: Mého pradědečka bratr padl v první světové válce Našeho souseda zahrádka je plná krásných květin Modely jazykového chování a jejich interpretace • jazykové chování • dynamika, „nestabilita“ • náhodné fluktuace • počínající tendence (srov. jazyková změna a její evoluce) • stochastické pojetí pravidel (a jazyka) • tendence • příklady? Modely jazykového chování a jejich interpretace • jazykové chování • dynamika, „nestabilita“ • náhodné fluktuace • počínající tendence (srov. jazyková změna a její evoluce) • stochastické pojetí pravidel (a jazyka) • tendence • deterministické pravidlo je pak de facto extrémním případem stochastického pravidla -> vyskytuje se s pravděpodobností = 1 • pravděpodobnost Frekvence • popis jazykového systému, tak jak se projevuje v jazykovém chování • frekvenční charakteristiky jako další informace o povaze jazyka • Cvrček et al. 2010 • Cvrček et al. 2010 • Cvrček et al. 2010 Biber et al. (1999): Longman Grammar of Spoken and Written English Stochastické pojetí jazyka • popis jazykového systému, tak jak se projevuje v jazykovém chování • frekvenční charakteristiky jako další informace o povaze jazyka • distribuční rozdíly a jejich důvody (viz níže) Stochastické pojetí jazyka • popis jazykového systému, tak jak se projevuje v jazykovém chování • frekvenční charakteristiky jako další informace o povaze jazyka • distribuční rozdíly a jejich důvody (viz níže) • pravděpodobnostní modely reflektují charakter pozorovaných jevů (viz níže) Stochastické pojetí jazyka • popis jazykového systému, tak jak se projevuje v jazykovém chování • frekvenční charakteristiky jako další informace o povaze jazyka • distribuční rozdíly a jejich důvody (viz níže) • pravděpodobnostní modely reflektují charakter pozorovaných jevů (viz níže) • modely mechanismů řídících jazykové chování • jejich platnost ověřována prostřednictvím empiricky testovatelných hypotéz Stochastické pojetí jazyka • popis jazykového systému, tak jak se projevuje v jazykovém chování • frekvenční charakteristiky jako další informace o povaze jazyka • distribuční rozdíly a jejich důvody (viz níže) • pravděpodobnostní modely reflektují charakter pozorovaných jevů (viz níže) • modely mechanismů řídících jazykové chování • jejich platnost ověřována prostřednictvím empiricky testovatelných hypotéz • stochastické pojetí hypotéz • statistika Stochastické pojetí jazyka • teoretické rámce a jazykové teorie: • G. K. Zipf • emmergent grammar • synergetická lingvistika • relativně běžná současná praxe • ověřování mechanismů bez hlubšího teoretického rámce • komputační lingvistika • ad hoc analýzy Frekvence • smysluplná pouze jako „vztahová“ veličina • distribuce jednotek určitého typu • ranková frekvenční distribuce • frekvence délek slov/vět… • … • vztah frekvence a jiných vlastností • frekvence slovních druhů vs. typ textu • frekvence vs. délka slova • frekvence vs. polysémie • … Distribuce jednotek • Havel 1990: ranková frekvenční distribuce slov Distribuce jednotek • Skácel: Odvaha k tomu: ranková frekvenční distribuce slov Distribuce jednotek • SYN2005: : ranková frekvenční distribuce primárních předložek Distribuce jednotek • SYN2010: : ranková frekvenční pádů Distribuce – modely a interpretace • diverzifikovanost sytému: • type-token ratio • repeat rate • entropie • výsledkem jedna hodnota Příklad • V = 10 jednotek • N = 50 výskytů • dvě různé distribuce Příklad pořadí f pořadí f 1 23 1 40 2 10 2 2 3 5 3 1 4 3 4 1 5 2 5 1 6 2 6 1 7 2 7 1 8 1 8 1 9 1 9 1 10 1 10 1 Příklad Příklad – type-token poměr • diverzifikovanost/slovní bohatství 𝑇𝑇𝑅 = 𝑉 𝑁 • jaká bude teoreticky nejvyšší a nejnižší hodnota TTR u textu (souboru), který bude mít délku N = 50 slov? Příklad – type-token poměr • nejvyšší hodnota = každé slovo pouze jednou 𝑇𝑇𝑅 𝑚𝑎𝑥 = 𝑉 𝑁 Příklad – type-token poměr • nejvyšší hodnota = každé slovo pouze jednou 𝑇𝑇𝑅 𝑚𝑎𝑥 = 𝑉 𝑁 = 50 50 = 1 Příklad – type-token poměr • nejvyšší hodnota = každé slovo pouze jednou 𝑇𝑇𝑅 𝑚𝑎𝑥 = 𝑉 𝑁 = 50 50 = 1 • nejnižší hodnota = jedno slovo v celém texu Příklad – type-token poměr • nejvyšší hodnota = každé slovo pouze jednou 𝑇𝑇𝑅 𝑚𝑎𝑥 = 𝑉 𝑁 = 50 50 = 1 • nejnižší hodnota = jedno slovo v celém texu 𝑇𝑇𝑅 𝑚𝑖𝑛 = 𝑉 𝑁 = 1 50 = 0.02 Příklad – type-token poměr • a co naše hypotetická data? • liší se jejich TTR? pořadí f pořadí f 1 23 1 40 2 10 2 2 3 5 3 1 4 3 4 1 5 2 5 1 6 2 6 1 7 2 7 1 8 1 8 1 9 1 9 1 10 1 10 1 Příklad – type-token poměr • a co naše hypotetická data? • liší se jejich TTR? 𝑇𝑇𝑅 𝑝ří𝑘𝑙𝑎𝑑 = 𝑉 𝑁 = 10 50 = 0.2 pořadí f pořadí f 1 23 1 40 2 10 2 2 3 5 3 1 4 3 4 1 5 2 5 1 6 2 6 1 7 2 7 1 8 1 8 1 9 1 9 1 10 1 10 1 Příklad – index opakování (repeat rate) • míra koncentrace jednotek (např. slov) v souboru 𝑅𝑅 = ෍ 𝑟=1 𝑉 𝑝 𝑟 2 𝑝 𝑟 = 𝑓𝑟 𝑁 𝑅𝑅 = 1 𝑁2 ෍ 𝑟=1 𝑉 𝑓𝑟 2 Příklad – index opakování (repeat rate) • nejvyšší koncentrace = jedno slovo v celém texu 𝑅𝑅 𝑚𝑎𝑥 = 𝑓𝑟 2 𝑁2 = 502 502 = 2500 2500 = 1 • nejnižší koncentrace = každé slovo pouze jednou 𝑅𝑅 𝑚𝑖𝑛 = 𝑓𝑟 2 𝑁2 = 12 + 12 + 12 … + 12 502 = 50 2500 = 0.02 Příklad – repeat rate • a co naše hypotetická data? • liší se jejich RR? pořadí f pořadí f 1 23 1 40 2 10 2 2 3 5 3 1 4 3 4 1 5 2 5 1 6 2 6 1 7 2 7 1 8 1 8 1 9 1 9 1 10 1 10 1 Příklad – repeat rate • a co naše hypotetická data? • liší se jejich RR? • Excel pořadí f pořadí f 1 23 1 40 2 10 2 2 3 5 3 1 4 3 4 1 5 2 5 1 6 2 6 1 7 2 7 1 8 1 8 1 9 1 9 1 10 1 10 1 Distribuce – modely a interpretace • distribuční funkce • diskrétní veličiny • spojité veličiny Model – mocninná funkce • bohatý slovník • většina slov se neopakuje • chudší slovník • slova se častěji opakují • nejchudší slovník (z prezentovaných příkladů) • slova se opakují ještě častěji Distribuce příslovečných určení • Čech, Uhlířová (2014) Case study • Radek Čech, Emmerich Kelih, Jan Mačutek: Impact of semantics on case diversification Porovnání délek – a jeho interpretace • problémy • délka slova (S) délka mluvního taktu (MT) • délka slova (S) a vliv typu textu • délka mluvního taktu (MT) a vliv typu textu Slovo vs. mluvní takt • v čem je rozdíl? Slovo vs. mluvní takt • stůl • na stole • v domě • napil se • napil jsem se • podali jsme jim ho • řekl, že přijde Slovo vs. mluvní takt • stůl • na stole • v domě • napil se • napil jsem se • podali jsme jim ho • řekl, že přijde • stůl • nastole • vdomě • napilse • napiljsemse • podalijsmejimho • řekl žepřijde Porovnání délek – a jeho interpretace • problémy • délka slova (S) délka mluvního taktu (MT) • délka slova (S) a vliv typu textu • délka mluvního taktu (MT) a vliv typu textu • jazykový materiál • Ukradený kaktus (K. Čapek) • Žánrové a stylové proměny veřejné jazykové komunikace (J. Kraus) Porovnání délek – a jeho interpretace • problémy • délka slova (S) délka mluvního taktu (MT) • délka slova (S) a vliv typu textu • délka mluvního taktu (MT) a vliv typu textu • jazykový materiál • Ukradený kaktus (K. Čapek) • Žánrové a stylové proměny veřejné jazykové komunikace (J. Kraus) • segmentace • S jako grafická jednotka, délka (L) měřena v počtu slabik • MT vymezen podle Palkové (2004), délka (L) měřena v počtu slabik Porovnání délek – a jeho interpretace • očekávání • S budou kratší než MT • délka S a MT bude delší v odborných textech než v beletrii Porovnání délek – a jeho interpretace • očekávání • S budou kratší než MT • délka S a MT bude delší v odborných textech než v beletrii • jak měřit? Výsledky – průměrné délky LS LMT bel 2 2,89 odb 2,83 3,51 Průměr ҧ𝑥 = (𝑥1+𝑥2 + 𝑥3+. . . +𝑥 𝑛) 𝑛 Průměr ҧ𝑥 = (𝑥1+𝑥2 + 𝑥3+. . . +𝑥 𝑛) 𝑛 ! citlivý na od odlehlé hodnoty {2,2,3,3,4,5} průměr = 3,17 Průměr ҧ𝑥 = (𝑥1+𝑥2 + 𝑥3+. . . +𝑥 𝑛) 𝑛 ! citlivý na od odlehlé hodnoty {2,2,3,3,4,5} průměr = 3,17 {2,2,3,3,4,20} Průměr ҧ𝑥 = (𝑥1+𝑥2 + 𝑥3+. . . +𝑥 𝑛) 𝑛 ! citlivý na od odlehlé hodnoty {2,2,3,3,4,5} průměr = 3,17 {2,2,3,3,4,20} průměr = 5,67 Průměr ҧ𝑥 = (𝑥1+𝑥2 + 𝑥3+. . . +𝑥 𝑛) 𝑛 ! citlivý na od odlehlé hodnoty {2,2,3,3,4,5} průměr = 3,17 {2,2,3,3,4,20} průměr = 5,67 {5,5,6,6,6,6} průměr = 5,67 Variabilita dat – směrodatná odchylka • rozptyl • střední hodnota kvadrátů odchylek od střední hodnoty 𝜎2 = 1 𝑁 ෍ 𝑖=1 𝑁 𝑥𝑖 − ҧ𝑥 2 = 𝑥1 − ҧ𝑥 2 + 𝑥2 − ҧ𝑥 2+. . . + 𝑥 𝑁 − ҧ𝑥 2 𝑁 − 1 Variabilita dat – směrodatná odchylka {2,2,3,3,4,5} průměr = 3,17 𝜎2 = 2 − 3,17 2 + 2 − 3,17 2 + 3 − 3,17 2 + 3 − 3,17 2 6 − 1 + + 4 − 3,17 2 + 5 − 3,17 2 5 = = 1,3689 + 1,3689 + 0,0289 + 0,0289 + 0,6889 + 3,3489 5 = 6,8334 5 = = 1,367 Variabilita dat – směrodatná odchylka směrodatná odchylka {2,2,3,3,4,5} průměr = 3,17 𝜎 = 1 𝑁 − 1 ෍ 𝑖=1 𝑁 𝑥𝑖 − ҧ𝑥 2 = 1,169 Variabilita dat – směrodatná odchylka {2,2,3,3,4,5} průměr = 3,17 SD =1,17 {2,2,3,3,4,20} průměr = 5,67 SD = 7,06 {5,5,6,6,6,6} průměr = 5,67 SD = 0,52 Variabilita dat – směrodatná odchylka {2,2,3,3,4,5} průměr = 3,17 SD = 1,17 {2,2,3,3,4,20} průměr = 5,67 SD = 7,06 {5,5,6,6,6,6} průměr = 5,67 SD = 0,52 SD v Excelu více viz https://support.office.com/cs-cz/article/stdeva-funkce- 5ff38888-7ea5-48de-9a6d-11ed73b29e9d Výsledky – průměrné délky a SD LS SDS LMT SDMT bel 2 1,05 2,89 1 odb 2,83 1,4 3,51 1,23 Porovnání délek – jeho interpretace & grafické znázornění Porovnání délek – jeho interpretace & grafické znázornění • Kr_01 – MT Porovnání délek – jeho interpretace & grafické znázornění Medián • rozděluje soubor na dvě stejné poloviny • není ovlivněn extrémními hodnotami Medián • rozděluje soubor na dvě stejné poloviny • není ovlivněn extrémními hodnotami {2,2,3,3,4,5} průměr = 3,17 medián = 3 {2,2,3,3,4,20} průměr = 5,67 medián = 3 {5,5,6,6,6,6} průměr = 5,67 medián = 6 Výsledky – průměrné délky, SD, medián LS SDS MS LMT SDMT MMT bel 2 1,05 2 2,89 1 3 odb 2,83 1,4 3 3,51 1,23 3 Vztah délky syntaktické fráze a pozice enklitik • délka fráze měřena v počtu písmen • enklitika sě, mi • fráze s enklitikem v postiniciální pozici by měla být v průměru kratší než fráze bez enklitika Vztah délky syntaktické fráze a pozice enklitik Vztah délky syntaktické fráze a pozice enklitik 134 Lk Sir Isa Gen Mt Rev Act Job mean sd LiP 6.94 6.41 6.23 5.91 5.58 5.45 5.4 4.9 5.9 2.6 LiN 9.1 9.02 10 10.45 11.01 10.01 9.96 8.02 10 6.7 LnN 5.75 6.52 8.18 6.48 6.23 7.77 7.06 6.74 6.9 3.1 Table 10 Average length of analyzed phrases of sě Figure 2 Average length of phrases of sě presented in Table 4. Vztah délky syntaktické fráze a pozice enklitik 135 Lk+Sir+Isa+Gen+Mt+Rev+Act+Job mean sd LiP 4.82 2.43 LiN 9.54 6.23 LnN 6.42 2.04 Table 11 Average length of analyzed phrases of mi Figure 3 Average length of phrases of mi presented in Table 11 136 137 138 139 140 141 Za hranice popisu… Za hranice popisu… k testování hypotéz • teoretická zdůvodnění • hypotéza: čím je iniciální fráze delší, tím menší je pravděpodobnost, že se za ní vyskytne enklitikon Results - letters Results - words Porovnání délek – jeho interpretace • test…