Mgr. Barbora Hrabalová Využití korpusů ve výuce češtiny jako cizího jazyka FF MU, 7.12. 2020 2 Co se dnes dozvíte? ̶ jaké korpusy se ve výuce používají ̶ jakým způsobem je možné korpusy ve výuce využívat ̶ co je to metoda data-driven learning ̶ co je to SKeLL nebo SmartTool Specializované korpusy pro výuku L22 3 Korpusy ve výuce 1 2 3 Specializované korpusy pro výuku L23 Korpusy ve výuce 1. přímé využití - studenti pracují přímo s korpusy 2. nepřímé využití - korpusy jsou využívány pro tvorbu studijních materiálů, učebnic aj. 3. popularizace - workshopy, prezentace o možnostech korpusového přístupu4 Historie 80. léta 20. století ▪ John Sinclair: COBUILD projekt ▪ Tim Johns: data-driven learning ▪ Dave Willis: The new lexical syllabus ▪ Jane Willis: Collins COBUILD English Course 90. léta 20. století ▪ první MLD slovník ▪ Teaching and Language Conference (TaLC) po roce 2000 ▪ učebnice Touchstone, program TestBuilder ▪ práce s korpusy jako součást vzdělávání učitelů Specializované korpusy pro výuku L25 Hlavní motivace 6 autentická datareálné užití jazyka výzkum podložený daty 7 Korpusová typologie Specializované korpusy pro výuku L27 OBECNÉ KORPUSY SPECIALIZOVANÉ KORPUSY 8 Korpusová typologie Specializované korpusy pro výuku L28 korpusy řady SYN KSK, NET, ČAPEK 9 Korpusová typologie: výuka Specializované korpusy pro výuku L29 KORPUSY PRO VÝUKU (OBECNÉ KORPUSY) KORPUSY Z VÝUKY (SPECIALIZOVANÉ KORPUSY) Specializované korpusy pro L2 1. akviziční korpusy (žákovské korpusy) 2. korpusy jazyka pro specifické účely (např. akademický jazyk, profesní mluva) 3. pararelní korpusy 4. jiné (např. korpus vyučovacích hodin, učebnicový korpus) Specializované korpusy pro výuku L210 Zajímavosti z učebnicových korpusů - učebnicový jazyk - obsah (nadužívání slov / stereotypizace) - P. Vališová: Účko1, Účko2 11 Hana: Teď mám žízeň. Jan: Ty máš štěstí! Mám tady pivo. Hana: To je problém. Bohužel nemám ráda pivo. Jan: No ne!!! Nemáš ráda pivo? Tak... To je tvůj problém! Chutná vám české pivo, pane Nováku? Ano, české pivo mi chutná. Chutná ti české pivo, Samire? Ne, české pivo mi nechutná. 12 Žákovské korpusy G. Leech (1998): Užitečný nástroj pro každého, kdo chce zkoumat, jak se lidé učí jazyky a jakým způsobem by se je mohli učit lépe. Specializované korpusy pro výuku L212 Sběr dat pro výzkum L2 spojitost se sběrem dat pro L1 4 etapy (B. MacWhinney) 1.etapa impresionistických studií 2.etapa deníkových zápisů (od 70. let 19. století) 3.etapa transkriptů (od 50. let 20. století) 4.etapa moderních technologií vč. korpusů (od 80. let 20. století) Child Language Data Exchange System (1984), TalkBank (2001) Specializované korpusy pro výuku L213 14 Žákovské korpusy ̶ angl. learner corpus ̶ studijní korpus (Čermák) = žákovský korpus ̶ snaha shromáždit objektivní data pro 1. popis žákovského jazyka (interlanguage /mezijazyk ) 2. popis odchylek a rozdílů (contrastive interlanguage analysis (S. Granger); computer aided error analysis) 3. popis mimojazykových vlivů na L2 (metadata) Specializované korpusy pro výuku L214 Jak vznikají data pro žákovské korpusy? 15 Jak vznikají data pro žákovské korpusy? 1. řízené projevy 2. strukturované projevy 3. elicitace 4. improvizace 16 Jak vznikají data pro žákovské korpusy? 1. certifikované zkoušky 2. jazykové školy 3. univerzity !!! minimum přirozených promluv 17 Jak vznikají data pro žákovské korpusy? 18 19 Žákovské korpusy ̶ typologie podle různých kritérií ̶ velikost, dostupnost ̶ povaha dat a povaha sběru dat ̶ L1, cílový jazyk ̶ metadata a anotace ̶ Štindlová (2013): přehled 57 žákovských korpusů ̶ dominují psané korpusy střední velikosti (do 1 mil slov) pokročilejších studentů s angličtinou jako cílovým jazykem ̶ Learner Corpus Association (2018): 167 žákovských korpusů Specializované korpusy pro výuku L219 20 Žákovské korpusy ve světě ̶Komerční korpusy ̶ CLC: Cambridge Learner Corpus, část přístupná přes Sketch Engine ̶Lovaňské korpusy ̶ ICLE: International corpus of learner English ̶ LINDSEI: Louvain International Database of Spoken English Interlanguage ̶ LONGDALE: Longitudinal Database of Learner English ̶ VESPA: Varieties of English for Specific Purposes Database ̶ Korpusy slovanských jazyků ̶ RLC: Russian Learner Corpus; CroLTeC: Croatian Learner Text Corpus Specializované korpusy pro výuku L220 21 Žákovské korpusy u nás ̶ projekt AKCES (2005) • Ústav českého jazyka a teorie komunikace FF UK + další pracoviště • prof. PhDr. Karel Šebesta, CSc. • osvojování češtiny různými skupinami mluvčích (L1 i L2) • žákovský korpusy – CZESL–PLAIN, CZESL–SGT, CZEFL–LONG ̶ mezinárodní žákovský korpus MERLIN (2012-2014) ̶ databáze CHRUP (2013) • prof. Ph.Dr. Hana Gladkova, CSc., FF UK • didaktický cíl: specifika osvojování L2, který je blízký L1 Specializované korpusy pro výuku L221 22 Žákovské korpusy ̶ angl. learner corpus ̶ studijní korpus (Čermák) = žákovský korpus ̶ snaha shromáždit objektivní data pro 1. popis žákovského jazyka (interlanguage /mezijazyk ) 2. popis odchylek a rozdílů (contrastive interlanguage analysis (S. Granger); computer aided error analysis) 3. popis mimojazykových vlivů na L2 (metadata) Specializované korpusy pro výuku L222 Výzkum žákovského jazyka 23 Cílový jazyk L2 Výchozí jazyk L1 Mezijazyk Jak probíhá osvojování druhého/cizího jazyka? L. Selinker (70. léta 20. století) žákovský jazyk, mezijazyk, interlangue svébytný jazykový útvar proměnlivý a dynamický systém, který obsahuje řadu nestandardních prvků ➔ míšení kódů ➔ chyby ➔ jazykový transfer, pozitivní (kognáty) a negativní (false friends) ➔ naučené fráze versus improvizace Výzkum je zaměřen na popis procesů a utváření mezijazyka či mimojazykové vlivy (např. věk). 25 Čeština Andreje Babiše ● 2014: žádost o tlumočníka při projevech Andreje Babiše ve sněmovně ● Karel Oliva: Babišova úroveň je C2, žádost zamítnuta ● Vít Benešovský (2018): Analýza Babišova mezijazyka ➜ analýza přepisu rozhovorů z let 2011, 2014, 2017 ➜ případová studie projevu nerodilého mluvčího češtiny v českojazyčném prostředí ➜ interferenční chyby (výslovnost, morfologie), slovakismy a střídání jazykového kódu ➜ mírné zlepšení po roce 2014 (mimojazykové vlivy) 26 Nepřímé využití: žákovské korpusy 27 Nepřímé využití: žákovské korpusy 28 Nepřímé využití: žákovské korpusy 29 Nepřímé využití: obecné korpusy L. Holá: Czech Step by Step, 2004 30 Nepřímé využití: obecné korpusy L. Holá: Česky krok za krokem, 2016. 31 Nepřímé využití: obecné korpusy 32 33 Korpusy pro školy ➔ 2006, ÚČNK ➔ repozitář různých korpusových cvičení ➔ popularizace korpusových nástrojů, workshopy na ZŠ i SŠ ➔ listopad 2016 – červenec 2017: cca 3000 stáhnutí od 244 unikátních IP 34 35 Metoda DDL - studenti sami hledali v korpusu - vybírali vhodné příklady - sami určili význam učení řízené daty (data-driven learning) 36 Metoda DDL 1. řešení problémů 2. práce s autentickými daty 3. generalizace a kategorizace výsledků autonomní učení, induktivní přístup 37 Metoda DDL ̶ Tim Johns, 1991 ̶ u nás po roce 2000 - J. Thomas, P. Vališová, A. Zasina ̶ student jako “Sherlock Holmes”, student jako výzkumník ̶ korpus jako autorita ̶ 2 typy: hands-on / hands-off 38 SkELL ̶ Sketch Engine - nástroj pro budování, správu a analýzu korpusových dat ̶ for Learning Languages: adaptace hlavních funkcí pro studium jazyka dostupných bez registrace ̶ slovníkové příklady, slovní profil, podobná slova 39 40 41 Popularizace 42 Korpus do každé třídy Přeneste platformu MERLIN do vaší třídy: Můžete nechat své (pokročilé) studenty vyhledávat jazykové jevy v subkorpusu MERLIN, aby se s tímto nástrojem seznámili a zároveň podpořili svou samostatnost v učení se cizího jazyka. Mohou společně analyzovat jak příklady chyb nalezené v databázi MERLIN, tak své vlastní texty. Můžete je také nechat porovnat výsledky vyhledávání v platformě MERLIN s národním korpusem, aby tak získali představu o rozdílech v užívání různých jazyků. Specializované korpusy pro výuku L243 Současný stav obecně přijímané výhody korpusového přístupu X nevyužívání korpusů ve výuce, kritika ze strany pedagogů možné řešení: • U. Römer (2006): user-friendly software, spolupráce mezi lingvisty a učiteli, popularizace • S. Braun (2007): pedagogicky orientovaný korpus • A. Boulton (2010): DDL součástí kurikula/učebnic Specializované korpusy pro výuku L244 Kvíz 45 1. Korpus je ve výuce nejčastěji využíván: a. přímo b. nepřímo 46 1. Korpus je ve výuce nejčastěji využíván: a. přímo b. nepřímo 47 2. Korpus, který zachycuje projevy nerodilých mluvčích, se nazývá: a. vyučovací korpus b. studentský korpus c. žákovský korpus 48 2. Korpus, který zachycuje projevy nerodilých mluvčích, se nazývá: a. vyučovací korpus b. studentský korpus c. žákovský korpus 49 3. Data pro žákovské korpusy nejčastěji vznikají: a. v přirozených a autentických podmínkách b. v uměle vytvořených podmínkách 50 3. Data pro žákovské korpusy nejčastěji vznikají: a. v přirozených a autentických podmínkách b. v uměle vytvořených podmínkách 51 4. Zkratka DDL znamená: a. deep learning b. data driven learning c. data and definitions learning 52 4. Zkratka DDL znamená: a. deep learning b. data driven learning c. data and definitions learning 53 5. První propagátoři korpusového přístupu John Sinclair a Tim Johns působili a. na univerzitě v Birminghamu b. na univerzitě v Bostonu c. na Masarykově univerzitě 54 5. První propagátoři korpusového přístupu John Sinclair a Tim Johns působili a. na univerzitě v Birminghamu b. na univerzitě v Bostonu c. na Masarykově univerzitě 55 Kam dál? CJJ31: Tvorba elektronických výukových materiálů PLIN022: Využití korpusů při výuce češtiny jako cizího jazyka PLIN054: Projekt z češtiny jako cizího jazyka 56 Děkuji za pozornost! 57