FC2011 Kompendium fyziky s didaktikou Jan Válek 2 Prototyp didaktického testu ̶ Navrhované úlohy musí testovat to, co je v daném učivu nejdůležitější. ̶ Nejsou vynechány nějaké podstatné testy? ̶ Jsou očekávané odpovědi jednoznačné? ̶ Posoudit obtížnost navrhovaných úloh. ̶ Posoudit časovou náročnost navrženého testu. 3 Prototyp didaktického testu Orientační určení času, který je třeba testovaným poskytnout k vyplnění testu: Test nejprve vyplní sám jeho autor (autoři) – získá se čas t0 na základní škole: t = t0 · 3 na střední škole: t = t0 · 2 4 Etapa optimalizace testu, ověřování a úprava úloh 1. Analýza celkových výsledků 2. Analýza odpovědí na testové úlohy 3. Analýza chybných odpovědí 4. Analýza vlastností testových úloh 5 Didaktický test – druhy didaktických testů Klasifikační hledisko Druhy testů Měřená charakteristika výkonu rychlostní (speed) výkonu (power) Dokonalost přípravy testu a jeho příslušenství standardizované kvazistandardizova né nestandardizované Povaha činnosti testovaného kognitivní psychomotorické Míra specifičnosti učení zjišťovaného testem výsledků výuky studijních předpokladů Interpretace výkonu testovaného relativního výkonu (rozlišující) absolutního výkonu (ověřující) Časové zařazení do výuky vstupní formativní (průběžné) sumativní (výstupní) Tematický rozsah monotematické polytematické Míra objektivity skórování objektivně skórovatelné subjektivně skórovatelné 14 Jednorozměrná obsahově-operační matice Určení počtu a druhu úloh v testu V testu požadujeme 25 úloh Koeficient pro výpočet počtu úloh na téma = plánovaný počet úloh (25) : suma váhy (v) · váha tématu (vx) Téma Počet hodin věnovaných tématu ve výuce Váha tématu vx I. 6 2 II. 3 1 III. 12 4 IV. 9 3 Suma 30 10 Počet úloh (25 : 10 · 2 = ) 5 5 (25 : 10 · 1 = ) 2,5 ↑ 3 (25 : 10 · 4 = ) 10 10 (25 : 10 · 3 = ) 7,5 ↓ 7 ––– 25 15 Dvourozměrná obsahově-operační matice Určení počtu a druhu úloh v testu Obvykle preferujeme aplikaci poznatků před prostým zapamatováním. Volíme poměr úloh na zapamatování a aplikaci 1:2 Téma Počet úloh Operační úroveň Zapamatování Aplikace I. 5 1,7 ↑ 3,3 ↓ II. 3 1 2 III. 10 3,3 ↓ 6,7 ↑ IV. 7 2,3 ↓ 4,7 ↑ Suma 25 Počet úloh Zapamatování Aplikace 2 3 1 2 3 7 2 5 8 17 16 Konstrukce testu - Testové úlohy vhodné pro zjišťování dosažených vzdělávacích výsledků Úroveň kognitivních cílů Široká otevřená Stručná Dichotomická S výběrem odpovědi Přiřazovací Uspořádací Znalost +++ +++ +++ +++ +++ Porozumění +++ +++ +++ +++ Aplikace ++ +++ +++ ++ ++ Analýza ++ ++ – +++ Syntéza ++ +++ +++ Hodnocení +++ – Posouzení +++ – +++ 17 Konstrukce testu - základní druhy testových úloh Otevřené Se širokou odpovědí Nestrukturovan é Se strukturou Vymezenou Danou konvencí Se stručnou odpovědí Produkční Doplňovací Uzavřené Dichotomické / Alternativní S výběrem odpovědí Přiřazovací Uspořádací Subjektivně skórovatelné Objektivně skórovatelné 18 Hodnocení didaktických testů 19 Příklad vyhodnocovací matice 1 2 3 4 5 6 7 8 9 10 skór Jarda / / / / / 0 / / / / 9 Michal / C / / / A / / 0 / 7 Jana / / / / / B / D 0 0 6 Honza / C / / / B A / 0 0 5 Petra / 0 / / / B D 0 0 0 4 Broňa / A / / B A 0 0 0 0 3 Suma 6 2 6 6 5 0 3 3 1 2 / = správná odpověď, 0 = chybějící odpověď A, B, C, D – písmena označující chybnou odpověď udanou žákem 20 Vlastnosti testových úloh – obtížnost ̶ Nejdůležitějšími vlastnostmi testových úloh, resp. jejich výsledků jsou obtížnost a citlivost ̶ Charakteristiky pomocí nichž lze korigovat a optimalizovat testové položky a tím i celý test ̶ Při vyhodnocování výsledků testu je nejlépe používat tzv. binární skórování 21 Index obtížnosti testové položky Vlastnosti testových úloh – obtížnost ̶ Udáván v procentech xs – počet žáků, kteří položku zodpověděli správně x – celkový počet odpovídajících žáků ̶ Vhodné úlohy: p = <20; 80> ̶ Podezřelé úlohy: p < 20 a p > 80 obtížná snadná ̶ Zakázané úlohy: p → 0 ̶ Doporučuje se na začátek testu nasadit jednu extrémně snadnou úlohu s p blížící se 100 % ̶ Taková úloha žáky uklidní a přispěje k vytvoření potřebného pocitu sebejistoty ̶ U rozlišujících testů jsou nejvhodnější úlohy s p = 50 % 𝑝 = 𝑥 𝑠 𝑥 ∙ 100 22 Hodnota obtížnosti testové položky Vlastnosti testových úloh – obtížnost ̶ Udávána v procentech xn – počet žáků, kteří položku zodpověděli nesprávně, nebo ji neřešili vůbec x – celkový počet odpovídajících žáků ̶ Vhodné úlohy: q = <80; 20> ̶ Podezřelé úlohy: q < 80 a q > 20 obtížná snadná ̶ Zakázané úlohy: q → 100 𝑞 = 𝑥 𝑛 𝑥 ∙ 100 𝑞 = 100 − 𝑝 𝑝 = 100 − 𝑞 23 Index obtížnosti testu Vlastnosti testových úloh – obtížnost ̶ Udáván v procentech x0 – aritmetický průměr všech hrubých skórů dosažených žáky v testu x – celkový počet odpovídajících žáků ̶ Nebo BEXP – suma všech dosažených bodů všemi žáky v celém testu BMAX – maximálně dosažitelný součet bodů všemi žáky v celém tesu 𝑃 = 100 ∙ 𝑥0 𝑥 𝑃 = 100 ∙ 𝐵 𝐸𝑋𝑃 𝐵 𝑀𝐴𝑋 Zápatí prezentace24 Hodnota obtížnosti testu Vlastnosti testových úloh – obtížnost ̶ Udávána v procentech ̶ Pak lze také spočítat ̶ Mezní hodnoty nejsou exaktně vymezeny ̶ Může se stát, že test sestavený z vhodných úloh může vykázat vysokou obtížnost proto, že výsledek srazí slabí nebo pomalí žáci 𝑄 = 100 − 𝑃 𝑃 = 100 − 𝑄 25 Vlastnosti testových úloh – obtížnost ̶ Podstatnějším kritériem je analýza obtížnosti jednotlivých úloh v testu ̶ Jsou-li úlohy analyzovány jako vhodné, není třeba se znepokojovat vysokou obtížností celého testu ̶ Znamená to, že test je v pořádku, ale žáci nezvládli dobře učivo, tento případ je spíše extrémní K tomu dojde, pokud je v testované skupině vzhledem k ostatním několik opravdu velmi slabých nebo pomalých žáků ̶ Test, který obsahuje úlohy s vhodným indexem obtížnosti, má zpravidla dobrou obtížnost 26 Vlastnosti testových úloh – citlivost ̶ Citlivost je poměrně složitě utvářená vlastnost jednotlivých úloh (citlivost úlohy) nebo celých didaktických testů (citlivost testu) ̶ Citlivost má význam rozlišovací hodnoty, diskriminační hodnoty, rozlišovací ostrosti ̶ Vysokou citlivost má úloha, kterou úspěšně řeší dobří žáci a neúspěšně špatní žáci ̶ Citlivá úloha, stejně jako citlivý didaktický test má zvýhodňovat žáky s lepšími vědomostmi 27 Vlastnosti testových úloh – citlivost ̶ Existuje několik způsobů, jak citlivost určovat. ̶ V běžné pedagogické praxi jsou nejběžnější následující způsoby: ̶ Směrodatná odchylka ̶ Koeficient citlivosti ULI 28 Směrodatná odchylka Vlastnosti testových úloh – citlivost ̶ Nejjednodušší a nejméně přesnou možností určení citlivosti ̶ Ve statistice představuje nejčastěji používanou hodnotou rozptylu ̶ Při výpočtu této hodnoty jsou větší odchylky od středu zohledňovány více než malé ∑ x2 – součet druhých mocnin hrubých skórů N – počet studentů řešících test z2 – druhá mocnina průměrného skóru ̶ Udává jak jsou data rozptýlena kolem středové hodnoty ̶ Nejčastěji se jako středová hodnota používá aritmetický průměr, medián, případně modus ̶ Směrodatná odchylka se však vztahuje k aritmetickému průměru 𝑠 = σ 𝑥2 𝑁 − 𝑧2 29 Koeficient ULI (upper-lower index) Vlastnosti testových úloh – citlivost ̶ Vyjadřuje, jak úloha zvýhodňuje žáky s lepšími vědomosti před žáky s horší vědomosti ̶ Pro výpočet ULI je třeba: ̶ Nejprve seřadit žáky podle výsledku hrubého skóru v testu od nejlepšího výsledku po nejhorší ̶ Rozdělit žáky na dvě stejně velké poloviny • Je-li žáků lichý počet, ten prostřední se škrtá a k dalším výpočtům není na jeho výsledek brán zřetel. • Dostaneme dvě skupiny o stejném počtu členů, které označíme jako L (lepší) a H (horší) 30 Koeficient ULI (upper-lower index) Vlastnosti testových úloh – citlivost ̶ ULI = < –1; 1> ̶ Čím vyšší hodnotu koeficient ULI má, tím lépe úloha rozlišuje mezi žáky lepšími a horšími ̶ Úlohy se zápornou hodnotou koeficientu citlivosti řeší lépe žáci s horšími vědomostmi než žáci s lepšími vědomostmi • např. tehdy, když zadání úlohy je formulováno příliš složitě, dobří žáci o řešení úlohy přemýšlejí a docházejí k nesprávným výsledkům, zatímco horší žáci odpověď typují bez jakékoliv znalosti. 31 Koeficient ULI (upper-lower index) Vlastnosti testových úloh – citlivost ULI – citlivost, koeficient ULI nL – počet žáků z lepší skupiny, co odpověděli správně nH – počet žáků z horší skupiny, co odpověděli správně N – celkový počet testovaných f – poměr četnosti kontrastní skupiny k četnosti testovaných, většinou je f = 0,5 ̶ Vhodné úlohy: pro p = <30; 70> má být ULI > 0,25 pro p = <20; 30> a <70; 80> má být ULI > 0,15 ̶ Podezřelé úlohy: ULI = <0; 0,15> až <0; 0,25> ̶ Zakázané úlohy: ULI < 0 𝑈𝐿𝐼 = 𝑛 𝐿 − 𝑛 𝐻 𝑓 ∙ 𝑁 32 Otázka 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Správná odpověď A D A B D C A B D B C A - A Body 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 Dosažené body 18 21 24 15 15 24 9 19 19 20 15 23 20 16 12 Max. počet bodů 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 p (%) 75 87,5 100 62,5 62,5 100 37,5 79,2 79,2 83,3 62,5 95,8 83,3 66,7 50 ULI -0,17 0,25 0 0,42 0,42 0 0,42 0,25 0,42 0,33 0,42 0,08 0,33 0,33 0,67 Červeně označené úlohy jsou zakázané Žlutě označené úlohy podezřelé Zeleně označené úlohy jsou vhodné Komplexní vyhodnocení otázek je uvedeno shodným barevným kódem v řádku „Otázka“ Pokud vezmeme v úvahu index obtížnosti p a koeficientu citlivost ULI, pak v daném testu je nutné – 4 otázky vyřadit bezpodmínečně jako zakázané (1, 3, 6, 12) – 4 je dobré rovněž vyřadit jako podezřelé (2, 8, 10, 13) – Pouze 7 otázek v testu jsou otázky vhodné a je možné je v testu ponechat. Položky 13 a 15 nebyly položky uzavřené s výběrem odpovědi, proto není uvedena správná odpověď. 33 Korekce na hádání (multiple-choice) x – korigovaný výsledek testu, R – počet správných odpovědí, W – počet nesprávných odpovědí a výraz a – 1 – je počet nabízených odpovědí v jedné úloze zmenšený o 1 Př: Vdidaktickém testu, který byl sestaven z 30 dichotomických úloh, žák K uvedl R = 18 správných odpovědí a W = 10 nesprávných odpovědí (v 2 úlohách neodpověděl) v testu byly a = 3 alternativy nabízených odpovědí. Dosadíme-li tyto hodnoty do vztahu dostáváme Pozn.: kdyby žák nevolil nesprávné odpovědi, neproběhla by korekce na hádání Žákovi K tedy přisoudíme, přestože odpověděl v 18 úlohách správně, pouze 13 bodů Pokud se provádí korekce na hádání, je nutno na tuto skutečnost žáky v úvodní informaci upozornit. Je třeba jim vysvětlit, že ve sporných případech je pro ně výhodnější neodpovídat vůbec. Naopak v testech, kde se korekce na hádání neprovádí, je pro zkoušeného výhodnější zodpovědět všechny úlohy 𝑥 = 𝑅 − 𝑊 𝑎 − 1 𝑥 = 𝑅 − 𝑊 𝑎 − 1 = 18 − 10 3 − 1 = 13 34 Korekce na hádání (multiple-choice) ̶ Vztah je použitelný pouze pro případ, kdy je u všech úloh použitých v testu stejný počet nabízených variant odpovědí ̶ Z didaktického hlediska se však tento vztah pro výpočet korekce na hádání příliš nedoporučuje používat ̶ Vzhledem k matematické definici vztahu je totiž lépe hodnocen žák, který vynechává úlohy než žák, který pracuje a který se snaží úlohy vyřešit, ale dělá přitom chyby 35 Validita ̶ Odpovídá na otázku, zda skutečně měříme to, co se domníváme, že chceme měřit ̶ Např. z výsledku vědomostního testu nemůžeme usuzovat na schopnost žáka učit se, takové výsledky nejsou validní ̶ Existuje několik druhů validity, je to např.: ̶ Obsahová validita ̶ Konstruktová validita ̶ Kriteriální validita 36 Validita ̶ Obsahová validita ̶ Do jaké míry je test reprezentativním výběrem učiva, jehož znalost měříme ̶ Např.: • Test, který má měřit vědomosti z anatomie, potom při zjišťování, zda má dostatečnou obsahovou validitu, je třeba odpovědět na otázky: • Jsou v něm všechny důležité prvky učiva z anatomie, které učitel probral? • Jsou tyto prvky učiva zastoupeny v testu proporcionálně? Pokud je odpověď na tyto otázky „ano“, můžeme o testu usuzovat, že má dostatečnou obsahovou validitu. Pokud se naopak zjistí, že test nepokrývá některé prvky anatomického učiva, potom se můžeme domnívat, že obsahová validita tohoto testu není dostatečná. 37 Validita ̶ Konstruktová (teoretická) validita ̶ Nakolik je didaktický test v souladu s teoriemi, ze kterých vychází výzkumný nástroj (např. obecná teorie testů) ̶ Název této validity je odvozen od slova „konstrukt“. • Konstrukt je abstraktní pedagogický nebo psychologický pojem, například vědomost, dovednost, schopnost, inteligence, postoj apod. ̶ Při konstruktové validitě se můžeme zeptat: Zjišťuje výzkumný nástroj ten konstrukt, který mě zajímá? Např.: Měří tento test z anatomie vědomosti anebo spíše schopnosti potřebné pro učení se anatomii (např. prostorové vidění)? 38 Validita ̶ Kriteriální validita ̶ Jaká je míra shody mezi výsledky testovacího nástroje a výsledky jiného měření (hodnocení) udělaného podle známého a ověřeného kritéria? ̶ Kriteriální validita souběžná • Porovnávací kritérium je k dispozici ihned (výsledky ve dvou nezávislých testech) • Např. korelace mezi výsledkem kratšího a delšího testu téhož učiva ̶ Kriteriální validita predikční • Srovnávací kritérium je k dispozici až v budoucnosti • Např. u testů studijních předpokladů se koreluje výsledek přijímacího testu s úspěšností studenta při studiu, která je vyjádřená např. průměrným prospěchem, počtem opravných termínů na zkoušky, výsledkem státní závěrečné zkoušky atd. 39 Reliabilita ̶ Reliabilita testu = spolehlivost ̶ Do jaké míry je výsledek testu ovlivněn náhodnými, subjektivními faktory a vlivy ̶ Test může mít vysokou reliabilitu a nízkou validitu • Znamená to, že sice měří přesně a spolehlivě, ale něco jiného, než chceme, aby měřil. ̶ Nízká reliabilita a vysoká validita nastat nemůže ̶ Test s vysokou reliabilitou má spolehlivé a tedy reprodukovatelné výsledky ̶ Výsledek didaktického testu je totiž určován dvěma složkami: • Fixní složka jsou skutečné vědomosti a dovednosti žáka • Náhodná složka – na ní se podílí okamžitá kondice, vnější podmínky (nadměrný hluk, příliš nízké osvětlení atd.), psychický stav žáků atd. ̶ Test má vysokou reliabilitu, jsou-li jeho výsledky minimálně ovlivněny náhodnou složkou. Exaktním posouzením reliability je koeficient reliabilty 40 Koeficient reliability Reliabilita ̶ Je exaktní mírou posouzení reliability ̶ KR = <0, 1> 0 = naprostá nespolehlivost a nepřesnost 1 = dokonalá spolehlivost a přesnost ̶ Způsobů jeho výpočtu je několik, v praxi se pro binárně skórovatelné úlohy často používá Kuder-Richardsonův koeficient reliability k – počet úloh v testu p – index obtížnosti úloh od 1 do k q – hodnota obtížnosti úloh od 1 do k s2 – rozptyl (druhá mocnina směrodatné odchylky). 𝐾 𝑅 = 𝑘 𝑘 − 1 ∙ 1 − σ 𝑝 ∙ 𝑞 𝑠2 41 Koeficient reliability Reliabilita ̶ Kuder-Richardsonův koeficient reliability ̶ vhodný pro didaktické testy úrovně, které jsou složeny z obsahově homogenních úloh. ̶ Krajní meze obvykle nejsou v praxi dosahovány, protože vliv náhodné složky nelze nikdy eliminovat. ̶ Pro individuální didaktické testy je obvykle požadováno r >= 0,8 • Didaktický test o méně než deseti úlohách dosahuje zpravidla koeficient reliability maximálně 0,6 42 Klasifikace podle procenta správných odpovědí Procento správně vyřešených úloh v testu Klasifikační stupeňKlasifikace běžná Klasifikace přísná Klasifikace velmi přísná 100–91 100–96 100–95 1 90–81 95–88 94–90 2 80–71 87–82 89–85 3 70–61 81–70 84–80 4 60–0 69–0 79–0 5 43 Klasifikace na základě normálního rozdělení ̶ Vycházíme z Gaussovy křivky ̶ nejvíce výkonů je vždy průměrných = nejvíce žáků klasifikujeme stupněm Počet žáků s daným klasifikačním stupněm A Počet žáků s daným klasifikačním stupněm B Počet žáků s daným klasifikačním stupněm C Klasifikační stupeň 7 % 10 % 15 % 1 24 % 20 % 20 % 2 38 % 40 % 30 % 3 24 % 20 % 20 % 4 7 % 10 % 15 % 5 44 Ukázky možností grafického znázornění výsledků testů (obtížnost, citlivost) A je obtížnější, oba málo citlivé A je málo citlivé, oba stejně obtížné B je obtížnější ale citlivější A B hrubý skór f A B hrubý skór f A B hrubý skór f 45 Co by si měl klást za otázky začínající učitel? 1. Měří můj test to, co skutečně měřit má? 2. Nezjišťuje můj test především formálnosti a nepodstatné věci? 3. Obsahuje můj test alespoň deset a více položek? 4. Jsou mnou navržené úlohy navzájem nezávislé? 5. Neobsahují úlohy mého testu nezamýšlené odpovědi? 6. Vyhýbají se úlohy mého testu neadekvátním zdrojům obtížnosti? 7. Konzultoval jsem svůj test se zkušenějším kolegou 8. Mám vytvořenou dostatečnou zásobu úloh 9. Mají všechny varianty testu stejné vlastnosti (zejména obtížnost a citlivost)? 10.Neobsahují moje testy chytáky? 11.Jsou zadání mých úloh srozumitelná nejen pro mě, ale i pro vaše žáky? 12.Je můj test primárně určen opravdu k měření výsledků výuky? 13.Přikládám výsledkům mých testů adekvátní význam? 46 Co by si měl klást za otázky začínající učitel? Měří můj test to, co skutečně měřit má? ̶ Didaktický test nemá měřit schopnost rychločtení a rychlopsaní, nemá měřit schopnost žáka opisovat od souseda, ani jeho úroveň tvořivého myšlení aplikovaného na důmyslné ukrytí taháku. ̶ Didaktický test není kratochvíle pro zasloužilé členy Klubu hádankářů. ̶ Neměly by se v něm proto vyskytovat úlohy kvízového typu. 47 Co by si měl klást za otázky začínající učitel? Nezjišťuje můj test především formálnosti a nepodstatné věci? ̶ Kvalitu života člověka podstatně neovlivňuje neschopnost žáka vyjmenovat prvních dvacet členů homologické řady alkanů a napsat jejich chemické vzorce se všemi izomery. ̶ Nejdůležitější částí slohové práce není osnova a dvoucentimetrový okraj na vnější straně papíru. 48 Co by si měl klást za otázky začínající učitel? Obsahuje můj test alespoň deset a více položek? ̶ Didaktický test s méně než deseti položkami má tak nízkou reliabilitu a tak vysokou relativní chybu měření, že známku testem získanou, by mohl učitel klidně získat náhodným hodem hrací kostkou. 49 Co by si měl klást za otázky začínající učitel? Jsou mnou navržené úlohy navzájem nezávislé? ̶ Vyřešení jedné úlohy nesmí podmiňovat řešení dalších úloh. ̶ Stejně tak správná odpověď v jedné úloze nesmí záviset na správné odpovědi v jiné úloze. 50 Co by si měl klást za otázky začínající učitel? Neobsahují úlohy mého testu nezamýšlené odpovědi? ̶ V textu zadání předcházejících nebo následujících úloh nesmí být obsažena nápověda pro řešení dané úlohy. 51 Co by si měl klást za otázky začínající učitel? Vyhýbají se úlohy mého testu neadekvátním zdrojům obtížnosti? ̶ Text kmene polynomu např. v multiple-choice redundantně nadužívá kvantitativně neadekvátní penzum terminus technicus, neologismů či extraordinálních verbálních konjunkcí v implicitních intencích syntakticky precizních formulací, což problematizuje explicitní anticipovanou psychologickou odezvu ze strany edukovaných individuí. 52 Co by si měl klást za otázky začínající učitel? Konzultoval jsem svůj test se zkušenějším kolegou? ̶ Několik prvních didaktických testů začínajících učitelů připomíná svojí obtížností vysokoškolské zápočtové písemky a na jejich vypracování by žáci potřebovali několik hodin. ̶ Korekce takového tvůrčího počinu ze strany zkušenějšího učitele je naprosto nezbytná!!! 53 Co by si měl klást za otázky začínající učitel? Mám vytvořenou dostatečnou zásobu úloh? ̶ Po korekci vytvořeného testu se může stát, že přijdete až o 90 % svých vytvořených úloh. ̶ Doporučuje se proto mít připravenou databanku úloh a nevhodné úlohy v testech jimi operativně nahrazovat. 54 Co by si měl klást za otázky začínající učitel? Mají všechny varianty testu stejné vlastnosti (zejména obtížnost a citlivost)? ̶ Vytváříte-li variantu A a B jednoho didaktického testu, žákům ze skupiny A se zdá lehčí varianta B a žákům ze skupiny B varianta A. ̶ Obvykle mají pravdu. ̶ Korektní postup vytvoření paralelní varianty testu tkví maximálně ve změně pořadí jednotlivých distraktorů nebo ve změně pořadí úloh. 55 Co by si měl klást za otázky začínající učitel? Neobsahují moje testy chytáky? ̶ Didaktické testy jsou nástroji měření výsledků výuky. ̶ Nemají testovat schopnost žáků vyhýbat se vámi nastraženým „pastičkám“. ̶ Opravdu nemá smysl ptát se žáků, ve kterém moři leží Langerhansovy ostrůvky. Oblasti slinivky břišní 56 Co by si měl klást za otázky začínající učitel? Jsou zadání mých úloh srozumitelná nejen pro mě, ale i pro moje žáky? ̶ Porozumět smysluplně psanému textu dělá žákům stále větší potíže. ̶ Zadání úloh by proto měla být jasná, stručná, srozumitelná a neměla by umožňovat dvojí výklad. • Tam, kde je možné dvojí výklad nalézt, ho žáci vždy najdou. ̶ I v řadě dalších případů, u kterých jste byli přesvědčení, že to možné není. 57 Co by si měl klást za otázky začínající učitel? Je můj test primárně určen opravdu k měření výsledků výuky? ̶ Didaktický test • není nástrojem pomsty učitele svým žákům • není výchovným opatřením • není trestem a není to „vycpávka“ volného času v hodině 58 Co by si měl klást za otázky začínající učitel? Přikládám výsledkům mých testů adekvátní význam? ̶ Měření výsledků výuky uskutečňované prostřednictvím teacher-made testů je vždy zatíženo mnoha chybami. • Výsledky testů je tedy třeba „brát s rezervou“. • Další chyby přibývají převodem výsledků testů na známky. ̶ Známky z testů nemají absolutní a nezpochybnitelnou platnost a nelze k nim takto přistupovat. 59 Literatura ̶ Byčkovský, P.: Základy měření výsledků výuky. Tvorba didaktického testu. Praha, ČVUT 1982. ̶ Gavora, P. Akí sú moji žiaci? Pedagogická diagnostika žiaka. Práca: Bratislava, 1999. ̶ Hrabal, V. Pedagogicko-psychologická diagnostika žáka. Praha: SPN, 1989. ̶ Hraba, V. st., Hrabal, V. ml. Diagnostika. Pedagogickopsychologická diagnostika žáka s úvodem do diagnostické aplikace statistiky. Praha: Karolinum, 2002. ̶ Chráska, M. Metody pedagogické diagnostiky. Olomouc: PedF UK, 1988. ̶ Chráska, M. Didaktické testy. Brno: Paido, 1999. ̶ Průcha, J., Walterová, E. Mareš J. Pedagogický slovník. Praha: Portál, 2003. ̶ Krykorková, H., Chvál, M. Pedagogicko-psychologická diagnostika a očekávané proměny jejího pojetí. In Vališová, A., Kasíková, H. a kol. Pedagogika pro učitele. Praha: Grada, 2007. ̶ Škoda, J., Doulík, P. Zásady správné tvorby použití a hodnocení didaktických testů v přípravě budoucích učitelů. Ústí nad Labem. Pedagogická fakulta UJEP, 2006 (http://cvicebnice.ujep.cz/cvicebnice/FRVS1973F5d/) ̶ Zelinková, O. Pedagogická diagnostika a individuální vzdělávací program. Praha: Portál, 2001