1 Využití korpusů při výuce češtiny jako cizího jazyka PLIN022 2. 2 Opakování klíčových pojmů 1. Čeština jako mateřský jazyk (L1) 2. Čeština jako druhý jazyk (L2) Zděděný jazyk 3. Čeština jako cizí jazyk 4. Čeština pro cizince 5. SERR 6. Korpus 7. Data-driven learning (DDL) 3 Jazykový korpus „Rozsáhlý soubor autentických textů (psaných nebo mluvených) převedený do elektronické podoby v jednom formátu tak, aby v něm bylo možné jednoduše vyhledávat jazykové jevy (zejména slova a slovní spojení / kolokace) ...“ F. Čermák (2017): KORPUS. NESČ. URL: https://www.czechency.org/slovnik/KORPUS 4 Korpusy a výuka 1. nepřímé využití lingvisté, autoři učebních materiálů = analýza dat a aplikace na výukové materiály 2. přímé využití studenti, lektoři = vlastní aktivity s korpusy 3. popularizace 5 Hlavní motivace 6 Výuka podložená daty Jak se může korpusový výzkum projevit ve výuce? Vědecká gramatika (popis; corpus-based, corpus-driven) X Pedagogická gramatika (užití) 7 Pedagogická gramatika ... je pro ni příznačný vědecký odborný styl? ... popisuje mluvnici daného jazyka v celé její šíři? ... je určena poučenému uživateli – filologovi? ... přináší netradiční pohled na mluvnici daného jazyka? ... by měla odrážet potřeby vyučovací praxe? ... popis pravidel je orientován především prakticky? ... mluvnice daného jazyka musí být zjednodušována? ... je často kritizovaná pro neodbornost, přílišné zobecnění či výběrovost? ANO/NE 8 Pedagogická gramatika Pedagogická gramatika pokyny, co musíme nebo nesmíme v cizím jazyce dělat X stigma zjednodušené vědecké gramatiky jazyková úroveň kompetence a znalosti žáka výukový materiál výzkum tradice výukové metody vliv dalších vědních disciplín popis gramatiky jazyka pro účely výuky a učení druhého jazyka 10 Zajímavosti ze světa pedagogické gramatiky Imperfektum x perfektum Vlastní vzory a modely Signální gramatika (Např. Signální slova jako včera, dnes, zítra signalizují použití správného gramatického času.) Sémantika prefixů (Holá 2006, s. 137) 11 Signální gramatika obvykle chodit/jezdit dneska jít/jet Vysvětlete studentům češtiny Gramatický rod v češtině Slovesný vid v češtině Akuzativ podstatných jmen L. Holá: New Czech Step by Step (2004) L. Holá: Česky krok za krokem (2016) 5 nejfrekventovanějších substantiv mužského rodu životného (Ma) na –a: [tag="N.M.*"&lemma=".+a"] 5 nejfrekventovanějších substantiv mužského rodu životného (Ma) na -e: [tag="N.M.*"&lemma=".+e"] středního rodu (N) na -e: [tag="N.N.*"&lemma=".+e"] Nebo jsem viděla zajímávý věc, taky jsem fotografovala (A2) Mobil je nedaležity věc pro mě . (A2) Jíný věc je že v Finsku všichní zujou se boty , když vystoupíme na domu . (B1) Ale každý věc má druhou stranu , taký je tam nějaká falešná reklama. (B1) Nepřímé využití nové přístupy evidence-based koncept (založený na „tvrdých“ datech, v praxi ověřených) frekvence ustálené souvýskyty slov Frekvence co je v jazyce časté? hlavním zdrojem o frekvenci jsou korpusy je základní stavební kámen korpusové lingvistiky lze ji sledovat na všech jazykových úrovních bychom x bysme; televizor x televize; měli bychom si koupit televizi, protože televize jsou teď za dobrou cenu (…) Frekvence ve výuce jazyků aplikace především v oblasti slovní zásoby a gramatiky předpoklad: častěji používaná slova jsou součástí všech (?) typů konverzací, jejich znalost tedy usnadní porozumění v angličtině velice populární seznamy nejčastěji používaných slov General Service List (West 1953), British National Corpus List (Nation 2006), new-General Service List (Brezina; Gablasova 2015), Essential Word List (Dang; Webb 2016) frekvence gramatických struktur a jejich revize pro učební materiály (např. pasivum přesunuto na vyšší jazykové úrovně a zasazeno do patřičného kontextu) slovní zásoba akademické češtiny seznam nejčastějších akademických slov a víceslovných jednotek databáze (materiál pro další výzkum) pomůcka při výuce či při psaní akademických textů (diplomních prací apod.) https://www.korpus.cz/akalex/ Ustálené souvýskyty slov údaje o frekvenci slouží k identifikaci souvýskytu slov opakování/opakovatelnost X nahodilost Korpusová lingvistika kolokace (slovní spojení) tratoliště krve, Červený kříž, praní špinavých peněz koligace (typ kolokace, princip předurčeného výběru) jezdit do školy každý den X teď; stojí to 100 korun X koruny; mluvit česky X čeština n-gram(y) (víceslovné výrazy, řetězce) to je v pořádku; jak se ...?; myslím, že; na druhou stranu 24 Kolokace a kolokační paradigma seznam kolokátů jednoho slova kolokační paradigma slova hlavní: V. Cvrček (2017): KOLOKACE. NESČ https://www.czechency.org/slovnik/KOLOKACE Ustálené souvýskyty slov 1. Před použitím léku si pečlivě přečtěte příbalový . 2. Hliník se odstěhoval do . 3. jarní 4. Tato změna je dána *, jak se mění poloha planety Země. 5. Na závěr přidáme sůl a . 6. Kdo jinému jámu kopá, 7. Chtěl jsem, se na to podívala ještě jednou. Ustálené souvýskyty slov ve výuce podpora dalších vědeckých disciplín psycholingvistika: když mluvíme využíváme kapacitu krátkodobé paměti, obměňujeme struktury, netvoříme struktury nové osvojování L1/L2: dítě si osvojuje celé struktury, s postupující znalostí je schopno strukturu rozklíčovat = konec izolování jednotlivých slov; doplňování nejen gramatického kontextu pro jednotlivá slova look forward (to) Have you ever .... ? (been / seen / had / heard / tried) modrý, modrá, modré = modré křeslo, modrý koberec, modrá deka Ustálené souvýskyty slov ve výuce →konec izolování jednotlivých slov (Korpusová) revoluce v ELT “people who have never heard of a corpus are using the products of corpus research.” (McEnery/Xiao/Tono, 2006) ELT – English Language Teaching https://www.slovnikafixu.cz/ Korpusové gramatiky a slovníky češtiny SMARTOOL: nástroj na výuku lexika a morfologie TWIRLL: Targeting wordforms in russian language learning (2018) Spolupráce: TheArtic University of Norway, Tromsø; Higher school of Economics, Moskva; Norwegian Agency for International Cooperation and Quality Enhancement in Higher Education Laura A. Janda (slavistika, korpusová lingvistika, kognitivní lingvistika) SlaviCorp 2018: navázání spolupráce s ÚČNK a jinými zahraničními institucemi Janda, L. A.; Tyers, F. (2018): Less is More: Why All Paradigms are Defective, and Why that is a Good Thing. Corpus Linguistics and Linguistic Theory 14(2). SMARTOOL – principy a teoretická východiska rodilý mluvčí (osvojené paradigma) X nerodilý mluvčí (naučené paradigma) podstatná jména –14 tvarů 1–3 slovní formy pro každý lexém distribuce se mění lexém od lexému kompletní paradigma = nefunkční model x usage-based model výuka L2 by měla cílit na tyto formy, nikoli na zvládnutí celého paradigmatu korpus jako vhodný zdroj dat pro usage-based model https://smartool.github.io/smartool-rus-eng/ 33 https://zasinaa.github.io/smartool_cs/ Definujte zápatí - název prezentace / pracoviště34 Nepřímé využití obecných korpusů Česká čítanka prezentace lexikálních a gramatických prostředků se opírá o statistická data ČNK Nepřímé využití obecných korpusů Aplikace Ten Ta To