1 Využití korpusů při výuce češtiny jako cizího jazyka PLIN022 6. Co je to chyba? Hned vedle základní školi se nachází i gymnásium. Kdo se rád věnuje domácím pracem? Češi pořád jí smažený sír. Studenti musejí zapsat předměty do informačního systému, po prvé s tím mívají problémy. Rádi by jsme Vás a vaše rodiče pozvali na slavnostní zahájení. Obě mé nejlepší kamarádky jsou lékařky, jedna je chiruržka, druhá psychiatryně. Co je to chyba? Rád piju pivo a rád jím eggs. Musela jsem včera vyhodit chleba, byl úplně čerstvý. Omlouvám se, že jsem pozdě. Dobry den Musim jet do Prahy. Budu tam od utery do sobotu a chtela bych se zeptat pokud máte volny pokoj a taky kolík ten pokoj stoj. Nevím jestly muzu snídat v hotelu. Taky chtěla jsem se zeptat pokud máte parkoviště protože přijdu s autem. Potřebuju najit lyžařskou škola. muzete my taky napsat pokud má takovou školu blizko hotelu. seděla jsem a vzpomněla mému prvnímu přítelu Co je to chyba? L1 • nesprávné užití jazykového prostředku • odchylka od platné kodifikace L2 • odchylka od normy i intuice rodilých mluvčích Co je to chyba? Larry Selinker (1972): interlanguage • chyba = evidence o vývoji • bezchybný projev nepodává dostatek informací Pit Corder (60. léta 20. století): mistake x error • mistake (chyba performanční, nesystémová; rodilí i nerodilí mluvčí, oprava mluvčím možná) • error (chyba kompetenční, systémová – nepochopení pravidla, nedostatečná automatizace; nerodilí mluvčí; oprava mluvčím není možná) Co je to chyba? M. Hrdlička • negativní transfer (interference) – vliv mateřského jazyka na jazyk cílový Chybová anotace Chyby v korpusech: mistakes and errors, metadata, interpretace, taxonomie = chybová anotace Typy anotací: • žádná x částečná x celková • manuální x automatická • lineární model x víceúrovňový distanční model CzeSL – chybová anotace • kombinace manuální a automatické • vlastní anotační program FEAT, korpusový manažer SeLaQ • víceúrovňový model, zásada postupné emendace (R0, R1, R2) R0: dvá další musea – R1: dva další musea – R2: dvě (agr→musea) další musea • pravidlo kontextu a pravidlo minimálního zásahu (někdy nestačí, např: má hezkou tužky – má hezké (←) tužky (x má hezkou tužku) • na základě porovnání původní a opravené podoby tvarů je stanoven druh chyby → možné nepřesnosti Definujte zápatí - název prezentace / pracoviště9 https://jakobson.korpus.cz/ ~rosen/public/anotace.pdf Anotační program FEAT Definujte zápatí - název prezentace / pracoviště10 R1 • výsledkem opravy je posloupnost správných tvarů existujících spisovných českých slov • opravy týkající se jednotlivých slov a slovních tvarů • chyby hláskové, slovotvorné, tvarotvorné https://jakobson.korpus.cz/ ~rosen/public/anotace.pdf Definujte zápatí - název prezentace / pracoviště11 R2 • výsledkem je gramaticky správná věta • opravy týkající se více slov, anotují se chyby plynoucí ze vztahů mezi (izolovaně) správnými tvary na R1 • důvodem chyby je narušení vztahu se slovem jiným (shoda, valence, slovosled, dlouhá forma osobního zájmena v příklonkové pozici ap.) https://jakobson.korpus.cz/ ~rosen/public/anotace.pdf 12 • složitější vztah, tzv. pavouk • jednomu (více slovům) odpovídá jedno (více slov) na rovině sousední https://jakobson.korpus.cz/ ~rosen/public/anotace.pdf Štindlová, B. (2013), s. 129. Manuální anotace Štindlová, B. (2013), s. 130. Manuální anotace CzeSL-SGT (korpus češtiny nerodilých mluvčích s automaticky provedenou anotací) 2 sady atributů: • word, lemma a tag • word1, lemma1 a tag1 • pokud původní tvar word byl vyhodnocen jako chybný • vztahují se k cílové hypotéze – tj. tomu tvaru, který se pravděpodobně pokusil nerodilý mluvčí vytvořit https://jakobson.korpus.cz/~rosen /public/2014-czesl-sgt-cs.pdf CzeSL-SGT • word, lemma a tag • word1, lemma1 a tag1 • gs (pravopisná nebo gramatická chyba) • err (typ chyby) https://jakobson.korpus.cz/~rosen /public/2014-czesl-sgt-cs.pdf https://jakobson.korpus. cz/~rosen/public/Sezna mAutoChybR0R1.html Automatická anotace seděla jsem a vzpomněla mému prvnímu přítelu Problémy 1 chybová analýza, kontrastní analýza = cílení na jeden typ chyby X korpusový výzkum mezijazyka = komplexní pohled 2 Oprava chyby = interpretace, pohled jiného mluvčího Korpusy pro výuku Korpusy z výuky Korpusy z výuky Žákovské korpusy Učebnicové korpusy Jiné (TTT) Učebnicové korpusy ● po roce 2000, Ute Römer ● nahrazení klasické analýzy učebnic ● obsah • struktura • design • čtení, psaní, mluvení, poslech • metajazykové informace ● učebnicový jazyk 22 Učebnicové korpusy – využití 1) deskriptivní – učebnicový jazyk jako specifický žánr 2) didaktické – zkoumají typy cvičení German English as a Foreign Language Textbook Corpus (GEFL TC, 2004) Ute Römer(ová) (2004, 2006) srovnává tento učebnicový jazyk s autentickým jazykem z britských nár. korpusů 23 Učebnicové korpusy – využití 1) deskriptivní – učebnicový jazyk jako specifický žánr • German English as a Foreign Language Textbook Corpus (GEFL TC, 2004) Ute Römer(ová) (2004, 2006): srovnává učebnicový jazyk s autentickým jazykem z britských nár. korpusů • metajazyk – instrukce ke cvičením, lingv. terminologie • podíl mluvenosti/psanosti (resp. v č.j. spis.j./obecná čeština/dialekty) 24 Učebnicové korpusy – využití 2) didaktické – zkoumají typy cvičení (podle jevu, tématu, referenční úrovně) • Gouverner(ová) (2008): studie ukázala, že učebnice obsahují málo pozorovacích cvičení Analýza učebnic Účko1, Účko2 ● Mgr. Pavlína Vališová (Meta, o.p.s) ● Sketch Engine ● 18 učebnic pro úrovně A1–B1 ● modelové věty, přepisy nahrávek, delší texty ze cvičení ● Co se učí cizinci? Korpusy pro výuku Korpusy z výuky Korpus do každé třídy Přeneste platformu MERLIN do vaší třídy: • Můžete nechat své (pokročilé) studenty vyhledávat jazykové jevy v subkorpusu MERLIN, aby se s tímto nástrojem seznámili a zároveň podpořili svou samostatnost v učení se cizího jazyka. • Mohou společně analyzovat jak příklady chyb nalezené v databázi MERLIN, tak své vlastní texty. • Můžete je také nechat porovnat výsledky vyhledávání v platformě MERLIN s národním korpusem, aby tak získali představu o rozdílech v užívání různých jazyků. Pozorování řízené objevování Převzato z Vališová, P. (2017), dizertační práce. Doplňování Produkce 33 Literatura Návod k anotaci chybového korpusu, verze 5.1 (9.3.2012). Dostupné z: https://jakobson.korpus.cz/~rosen/public/anotace.pdf (cit. 10. 9. 2024) Štindlová, B. (2013). Žákovský korpus češtiny a evaluace jeho chybové anotace. Univerzita Karlova v Praze, Filozofická fakulta, Praha.