COOPER, John O, Timothy E HERON a William L HEWARD. Applied behavior analysis. 2nd ed. Upper Saddle River, N.J.: Pearson/Merrill-Prentice Hall, c2007, xxvii, 770 p. ISBN 978-013-1421-134. Kapitola 4 Měření chování Klíčová slova: Artefakt Změna rychlosti Období změny rychlosti Křivka změny rychlosti Počet Jednotlivý výskyt Trvání, doba trvání Frekvence Reakční doba Důležitost Měření Měření pomocí trvalého produktu Okamžikové vzorkování Záznam části intervalu Procentní sazba Plánovaná kontrola činnosti Míra Opakovatelnost Latence v odpovědi Časový rozsah Časové centrum Časové vzorkování Topografie Počet pokusů potřebných k úspěchu Záznam celého intervalu. Oblast 6: měření chování 6-1 Identifikace měřitelných dimenzí chování (např. míru, dobu trvání, latenci, čas odezvy) 6-3 Stanovení výhod a nevýhod užití procedur spojitého měření a vzorkovacích technik (např. zaznamenávání časti a celého intervalu, okamžikové vzorkování) 6-4 Výběr vhodných měřících procedur, které postihují dimenzi chování a jsou logické pro pozorování a zaznamenávání) 6-6 Užití frekvence (např. počet) 6-7 Užití podílu (např. počet výskytu v čase) 6-8 Užití doby trvání 6-9 Užití latence 6-10 Užití vnitřního času odezvy – čas mezi odpověďmi 6-11 Užití procenta výskytu 6-12 Užití trials-to-criterion (počtu pokusů potřebných ke splnění cíle) 6-13 Užití metod záznamu intervalu Lord Kelvin, britský matematik a fyzik, údajně řekl: „Dokud můžete vyjádřit, o čem mluvíte v číslech a můžete to měřit, vaše znalost je skrovná a neuspokojivá.“ Měření (připisování kvantitativních značek k popisu a rozlišení přirozených událostí) poskytuje základy pro všechny vědecké objevy, pro vývoj a aplikaci technologií odvozených z těchto objevů. Přímé a časté měření poskytuje základ pro aplikovanou analýzu chování. Aplikovaná analýza chování užívá měření k tomu, aby odhalila a porovnala účinky různých nastavení prostředí na přírůstek, udržení a generalizaci (zobecnění)sociálně významného chování. Ovšem jaké chování aplikovaná analýza chování má a měla by měřit? Jak by se tato měření měla provádět? Jak bychom měli s měřením naložit, když už jej máme? Tato kapitola pojednává o dimenzích, ve kterých může být chování měřeno a popisuje metody, jež se běžně užívají k měření chování. Ovšem jako první nastíníme definici a funkci měření v aplikované analýze chování. Definice a funkce měření v aplikované analýze chování Měření je „proces připisování čísel a jednotek určitým charakteristikám objektů nebo událostí… Dovoluje přiřadit číslo reprezentující pozorovaný rozsah rozměrové (dimenzionální) kvantity určité jednotce. Číslo a jednotka dohromady tvoří měření objektu nebo události (Johnson a Pennypacker, 1993a, s. 91,95). Dimensionální, rozměrová kvantita (dimensional quantity) je určitá charakteristika objektu či události, která je měřena. Například, jediný výskyt fenoménu – řekněme odpověi k-o-č-k-a na otázku: „Jak hláskuješ slovo kočka“ bude připsáno číslo 1 a označení jednotky „správně“. Pozorujíc další příklad stejné třídy odpovědi může změnit označení na „2 správě“. Na základě přijatého názvosloví můžeme aplikovat další označení. Například, jestli 8 z 10 pozorovaných odpovědí získají definici „správně“, správnost odpovídání může být popsána označením „80 % správně“. Jestli jsme získali 8 správných odpovědí v jedné minutě, poměr nebo frekvence správných označení je 8 za minutu. Bloom, Fischer a Orne (2003) popsali měření jako akt či proces aplikování kvantitativních nebo kvalitativních označení na události, fenomény, pozorované vlastnosti. Měření užívá standardní sadu pravidel (odsouhlasených), kterými se přiřazují označení k daným událostem a výskytům. Tímto autoři ukázali, že koncept měření zahrnuje také charakteristiky toho, co je měřeno, kvalitu a přiměřenost měřícího nástroje, technické dovednosti měřitele a způsob využití získaného měření. Nakonec, měření dává výzkumníkům, zpracovatelům a spotřebitelům (zákazníkům)běžný prostředek pro popis a porovnání chování sadou označení, které vyjadřují běžný význam. Výzkumníci potřebují měření Měření je to, jak vědci operacionalizují empirii. Objektivní měření vědcům umožňuje (dokonce vyžaduje) popsat fenomén, který sledují. A to precizním, důsledným a veřejně ověřitelným způsobem. Bez měření by všechny tři stupně vědecké znalosti – deskripce, predikce a kontrola – byly odsunuty jako předmět dohadů „individuálních předsudků, vkusu a soukromých názorů vědců“ (Zuriff, 1985, s. 9). Žili bychom ve světě, kde by domněnky alchymistů o elixíru na dlouhověkost měly převahu nad výzkumnými zjištěními chemiků vzešlými z experimentů. Aplikovaná analýza chování měří chování, aby získala odpovědi na otázky o existenci a povaze funkčních vztahů mezi sociálně významným chováním a environmentálními proměnnými. Měření umožňuje porovnání lidského chování uvnitř a mezi rozdílnými environmentálními podmínkami. Tím umožňují navrhnout závěry o efektu těchto podmínek na chování., které stojí na emirii. Například abychom zjistili, zda možnost vybrat si úkol, na kterém se bude pracovat, může ovlivnit zapojení žáků s potížemi v emocích a chováních do daného úkolu. Dunlap a kolektiv (1994) měřil plnění úkolů a rušivé chování v podmínkách, kdy studenti měli a neměli právo výběru úkolu. Měření odhalilo stupeň cílových typů chování během obou daných podmínek, a také zda a jak moc se chování měnilo, když se podmínky změnili na možnost vybrat si úkol a zákaz vybrat si úkol, a jak bylo chování proměnné nebo stabilní za každé dané podmínky. Schopnost výzkumníků získat vědecké pochopení chování se odvíjí od jejich schopnosti ho měřit. Měření umožňuje odhalit a ověřit téměř cokoli, co bylo objeveno o selektivním působení prostředí na chování jedince. Empirické databáze různých odvětví analýzy chování tvoří organizované sbírky měření chování. Téměř každý graf v Journal of the Experimental Analysis of Behavior a v Journal of Applied Behavior Analysis vyobrazuje probíhající záznam nebo shrnutí měření chování. Jednoduše, měření poskytuje samotný základ pro studování a vyprávění o chování vědecky a smysluplně.[1] Praktici potřebují měření Behaviorální praktici se věnují zlepšení života jejich klientů, tím že mění jejich sociálně významné chování. Praktici zpočátku měří chování, proto aby posoudili jeho stávající úroveň a případnou potřebu další intervence. Jestli je intervence potřebná, praktici dále měří, nakolik byla jejich intervenční snaha účinná. Měření pomáhá zjistit, zda a kdy se chování změnilo; rozsah a trvání změny chování; variabilitu nebo stabilitu chování před, v průběhu a po léčení; a zda se významné změny v chování objevují i v jiných podmínkách a zda odrazily i v jiném chování. Praktici porovnávají měření cílového (též klíčového) chování před a po léčení (občas se ta tímto účelem užívají intervenční měření získaná v mimo léčebných podmínkách). Tak vyhodnotí celkový efekt programů zaměřených na změnu chování (sumativní hodnocení). Opakované měření chování v průběhu léčby (formativní posouzení) umožňuje dynamické, na datech postavené rozhodovaní, co se týká pokračování, modifikace nebo ukončení léčby. Praktici, kteří pro intervenci neužívají opakované měření cílového chování, se často dopouští dvou chyb: a) pokračují v neefektivní léčbě, i když se nenese skutečné změny v chování b) nepokračují v efektivní léčbě, protože subjektivně posuzují jako neúčinnou (např. bez měření učitel nejspíše nezjistí, že se žákovo hlasité čtení zlepšilo ze 70 slov na 80 slov za minutu). Proto, přímé a opakované měření umožňuje praktikům odhalit jejich úspěch i neúspěch, umožňuje učinit změny, aby se dostali k úspěchu. (Bushell and Bear, 1994; Greenwood and Maheady, 1997). Naše techniky změn chování jsou také technikami měření chování a návrhu výzkumu; jsou vyvinuty jako kompaktní balík a po dobu, kdy budou fungovat jako balík, vedou k sebehodnocení. Úspěch technik má známý rozsah, jejich neúspěch je téměř ihned rozpoznán jako neúspěch; ať jsou výstupy technik jakékoli, jsou přisouzeny spíše známým vstupům, a procedurám než pravděpodobné události či náhodě (D.M. Baer, osobní sdělení, October 21, 1982) Opakované měření poskytuje v oblasti vyhodnocování programu a rozhodování se na základě dat další důležité benefity praktikům i jejich klientům: - Měření pomáhá praktikům optimalizovat jejich efektivitu. Pro optimální efektivitu musí praktici maximalizovat účinnost změn chování v časových a zdrojových podmínkách. Neustálé vědomí o relevantních výstupních datech pomáhá odborníkům dosáhnout optimální efektivity a účinnosti (Bushell and Baer, 1994). Komentujíc stěžejní roli přímého a opakovaného měření na maximalizování efektivity ve vzdělávání, Sidman (2000) poznamenal, že učitelé „musí zůstat naladění na vzkazy žáků a být připraveni zkoušet a vyhodnocovat modifikace ve vzdělávacích metodách. Učení pak není jen záležitostí měnění chování žáků; je to interaktivní sociální proces“ (s. 23, slova v závorce přidána). Přímé a opakované měření je proces, kterým praktici „slyší“ vzkazy jejich klientů. - Měření umožňuje praktikům verifikovat legitimnost intervence chápané jako „založené na důkazech“. U praktiků se čím dál tím více očekává, a v některých případech požaduje právem, aby užívaly intervence založené na důkazech. Na důkazech postavená praxe je léčebná nebo intervenční metoda, která byla prokázána jako efektivní v důležitých a vysoce kvalitních vědeckých výzkumech. Například, státní No Child Left Behind Act z roku 2001 vyžaduje, aby se všechny distrikty veřejných škol ujistily, že všechny děti jsou vzdělávány vysoce kvalifikovanými učiteli užívajícími kurikulum a instruktážní metody, jež jsou validované přísnými vědeckými výzkumy. Přestože již byly navrženy příručky a indikátory kvality, které se týkají typu[2] a kvantity[3] výzkumu, a které jsou nutné ke kvalifikování léčebných metod jako praxe postavené na důkazech, pravděpodobnost kompletního souhlasu odborníků s danou léčbou je malá (např. Horner, Carr, Halle, McGee, Odom and WOlery, 2005; U.S. Depatrtment od Education, 2003). Když zavádíme jakoukoli léčbu, nehledě na typ nebo sumu výzkumné evidence, měli bychom pro její podporu užívat přímé a opakované měření, abychom verifikovali její intervenční efektivitu. - Měření pomáhá praktikům identifikovat a ukončit léčení založené na pseudovědě, bláznivých nápadech, módě nebo ideologii. Mnoho edukačních a léčebných metod jsou pokládány za průlomové. Četné kontroverzní léčby pro jedince s vývojovým postižením a autismem (např. facilitovaná komunikace, terapie pevným objetím, velké dávky vitamínů, diety, zátěžové vesty, terapie pomocí delfínů) byly podporovány bez vědecké evidence nebo měření efektivity (Helfin and Simson, 2002; Jacobson, Foxx and Mulick, 2005). Užití některých z tzv. průlomových terapií vede k znepokojení a ztrátě cenného času klientů i jejich rodin a v některých případech ke katastrofickým následkům (Maurice, 1993). Přestože dobře prováděné studie ukázaly, že mnoho z těchto metod nenese účinek, přestože tyto programy nejsou vědecky podloženy a postrádají evidenci účinků, rizik a výhod, rodiče a praktici jsou stále bombardováni upřímnými a dobře míněnými dobrozdáními o jejich prospěšnosti. Měření je nejlepší spojenec ve snaze najít a verifikovat efektivní léčbu a vymýtit ty, jejíž nejsilnější podpora je ve formě dobrozdání a reklam na internetu. Odborníci by měli držet zdravý skepticismus při posuzování tvrzení o efektivitě různých intervencí. Užívajíc Platonovo podobenství o jeskyni jako metaforu pro učitele a praktiky, kteří užívají netestované a pseudoinstruktážní myšlenky, Heron, Tincani, Peterson, a Miller (2002) navrhují, aby praktici sloužili tím, že převezmou vědecký přístup a vzdalli se pseudo edukačních teorií a filosofií. Praktici, kteří provádí přímé a opakované měření každé intervence a léčebného programu, mají empirickou podporu, aby se hájili proti politickým a sociálním tlakům k převzetí neověřených léčeb. V pravém smyslu budou vyzbrojeni tím, co Carl Sagan (1996) nazval „soupravou na poznání nesmyslu“. - Měření umožňuje praktikům být odpovědný ke klientům, konzumentům, zaměstnavatelům a společnosti. Přímé a opakované měření výstupů jejich snažení jim pomáhá bezpečně odpovědět na otázky rodičů a dalších provázejících osob ohledně efektu intervence. - Měření pomáhá praktikům dosáhnout etických standardů. Etické kodexy vyžadují po prakticích přímé a opakované měření klientova chování (viz kapitola 29). Posouzení zda je dodržováno klientovo právo na efektivní léčbu a efektivní edukaci, vyžaduje měření intervenovaného chování (Nakano, 2004; Van Houten et al., 1988). Odborníci, kteří neměří povahu a rozsah relevantních změn v chování, pracují na hraně špatné praxe. Kauffman (2005) užívá této perspektivy v edukačním kontextu na vztah mezi měřením a etickou praxí: „Učitel, který nemůže nebo nebude určovat a měřit relevantní chování jeho studentů, pravděpodobně nebude velmi efektivní… Nedefinovat a neměřit tyto behaviorální excesy a vady, je pak základní chybou. Obdobně jako u zdravotní sestry, která se rozhodne neměřit životní funkce (tep srdce, dýchání, teplota a krevní tlak), třeba kvůli své zaneprázdněnosti, či že subjektivně považuje známky života za adekvátní, anebo jsou pro ni známky života jen povrchní předpokladem pacientova zdraví, eventuálně nemusí považovat známky života za ukazatele možné patologie. Učitelské profese jsou oddány úkolu měnit chování – měnit chování prokazatelně k lepšímu. Co se dá říci pak o edukační praxi, když nezahrnuje precizní definici a důvěryhodné měření změn v chování vyvolaných učitelovou metodologií? Je to neobhajitelné (s. 439).“ Měřitelné dimenze chování Když vás přítel požádá, abyste změřili konferenční stolek, pravděpodobně se jej zeptáte, proč ho chce měřit. Jinak řečeno, co by mu toto měření o stole mělo prozradit. Chce znát jeho výšku, šířku anebo délku? Chce znát, kolik stůl váží? Snad jej zajímá barva stolu. Každý z těchto důvodů pro měření stolu vyžaduje měření jiné dimenze kvantity (též fyzikální veličiny) stolu (např. rozměr, hmotnost, odraz světla). Stejně jako konferenční stolky a jiné prvky ve fyzickém světě, má i chování své vlastnosti, jež lze měřit (rozměr, hmotnost a odraz světla mezi nimi nejsou). Protože se chování objevuje v čase a napříč časem, má tři základní dimenze kvantity, které analytici chování mohou měřit. Johnston a Penypacker (1993a) popisují tyto vlastnosti takto: - Opakovatelnost (také počitatelnost): situace určité třídy odpovědí (response class) se může objevovat opakovaně v čase (tj. chování lze počítat). - Časový rozsah: každá situace chování se objevuje určitou dobu (tj. průběh chování lze věřit). - Místo v čase (temporal locus): každá situace chování nastává v určitém časovém okamžiku s ohledem na jiné události (tj. když se chování objeví, může být měřeno). Obrázek 4.1 ukazuje schematickou reprezentaci opakovatelnosti, časového rozsahu a místa v čase. Samostatně a v kombinaci tyto kvantity poskytují základní a odvozená měření, kterých se užívá v aplikované behaviorální analýze. Tyto a dvě další měřitelné dimenze chování – tvar (form) a síla – budou probrány na následujících stranách. Obrázek 4.1. Schematická reprezentace dimenzí kvantit - opakovatelnosti, časového rozsahu a umístění. Opakovatelnost je zobrazena počtem čtyř prvků dané třídy odpovědí (R[1], R[2], R[3], R[4]) uvnitř sledovaného časového období. Časový rozsah (tj. trvání) každé odpovědi je zobrazen jako obdélníková šedá oblast na časové ose. Jeden aspekt časového umístění (reakční doba – response latency) dvou odpovědí je znázorněn uplynulou dobou (←L→) mezi předcházejícím stimulem (S[1], S[2]) a začátkem následující odpovědi (R[2] a R[4]). Měření založené na opakovatelnosti Počet Počet je prostý záznam počtu výskytu daného chování. Například počet správných a chybných odpovědí v cvičení z matematiky, počet gramatických chyb, počet spolujízd zaměstnance do práce, počet hodin, ve kterých žák přijde po zvonění, počet vytvořených produktů. Ačkoli to, jak často se chování objevuje, bývá často prvořadým zájmem, měření samotného počtu nemusí poskytovat dostatek informací k tomu, aby praktici udělali užitečná rozhodnutí ohledně intervence nebo analýzy. Například pokud získaná data ukazují, že Katka vypočítala správně 5, 10, 15 početních příkladů ve třech po sobě jdoucích měřeních, můžeme předpokládat její zlepšení v matematice. Avšak interpretace těchto dat bude úplně jiná, jestli zjistíme, že daná tři měření byla provedena v intervalech 5 minut, 20 minut a 60 minut. Proto doba pozorování by měla být vždy zaznamenána, když mluvíme o měření počtu. Míra/frekvence Kombinace záznamu času a počtu dává vzniknout jednomu z nejužívanějších měření v aplikované analýze chování – míře (nebo frekvenci). Míra je definovaná jako počet odpovědí za jednotku času.[4] Míra nebo frekvence je podíl počtu událostí a sledovaného času. Užívání míry nebo frekvence dělá měření smysluplnějším. Například, víme-li, že Yumi přečte 95 slov správně a 4 slova nesprávně za jednu minutu a že Lee napíše 250 slov za 10 minut a že se Joanovo sebepoškozující chování objeví 17 krát za hodinu, poskytne důležité informace a kontext. Tři předchozí měření Katčiných výkonů v hodinách matematiky vyjádřené jako míra prozrazují, že správně odpověděla v míře 1; 0,5 a 0,25 správných odpovědí za minutu v daných třech časových intervalech. Vědci a praktici obvykle zaznamenávají míru jako počet za 10 s., za minutu, za den, za týden, za rok. Za takovou dobu, jejíž jednotka času je typická pro experiment, aby měření mohla být porovnávána. Je možné srovnávat míry daných počtů, které jsme získali v průběhu pozorovnání o různých časových délkách. Například student, který ve čtyřech vyučovacích blocích a různých délkách, se bavil se svým spolužákem 12 x za 20 minut, 8 x za 12 minut a 9 x za 15 minut a 12 x za 18 minut, měl míru odpovědí 0,6; 0,67; 0,6; a 0,67 za minutu. Šest pravidel a pokynů popsaných níže pomůže vědcům a praktikům lépe získat, popsat a interpretovat počet a míru. 1) Vždy uvádějte měření času. Když měříme frekvenci odpovědí (rate-of-response), musíme vždy uvést průběh pozorovaného času (tj. délku času). Porovnávání frekvencí bez záznamu času může vést k chybné interpretaci dat. Například, když dva studenti čtou stejný text stejnou měrou sta správných slov za minutu a žádného nesprávného, zdá se, že podali rovný výkon. Bez znalosti délky pozorovacího období, nemůžeme porovnávat dané výkony. Uvažujme, že Sally a Lily běží měrou 7 mil za minutu. Nemůžeme porovnávat jejich výkony bz referování o vzdálenosti, kterou uběhly. Běžet 1 míli rychlostí 7 mil za hodinu je jiná třída chování než běžet touto rychlostí maraton. Zaznamenat délku pozorovací ho období je obzvláště důležité, pokud se tato doba mění pro každé pozorování. Například je lepší, aby si učitel zaznamenal celkový čas, který student potřeboval k dokončení sady početních úkolů, než aby zapisoval počet vypočítaných příkladů ve stanoveném intervalu (např. po jedné minutě). V této situaci učitel může zaznamenat studentovy správné a špatné odpovědi za jednotku času a také zaznamenat celkový čas každé etapy (který nemusí být konstantní). 2) Počítejte míry správných a nesprávných odpovědí, když vyhodnocujete vývoj dovedností. Když může participant uvést správné a nesprávné odpovědi, měla by být zaznamenána míra odpovědí pro obě varianty chování. Počítání míry správných a špatných odpovědí je zásadní pro vyhodnocování vývoje dovedností, protože zvyšování výkonnosti nemůže být hodnoceno jen na základě znalosti míry správných odpovědí. Pouhá míra správných odpovědí může ukázat zlepšující výkonnost, ale jestli se zvyšuje také míra špatných odpovědí, pokrok může být jen zdánlivý. Míra správných a nesprávných odpovědí dohromady poskytuje důležitou informaci, která pomáhá učitelům vyhodnotit, jaké pokroky studenti dělají. Ideálně se míra správných odpovědí zrychluje směrem k výkonnostním cílům a míra nesprávných odpovědí se snižuje na nízkou a neměnnou úroveň. Dále záznam míry správných a špatných odpovědí poskytuje hodnocení poměrné přesnosti zatímco zachovává dimenze kvantity měření (např. 20 správných a 5 nesprávných odpovědí za minutu = 80% přesnost anebo 4 násobnou proporční přesnost). Míra správných a nesprávných odpovědí poskytuje základní data pro hodnocení plynulé výkonnosti (tj. dovednosti) (Kubina, 2005). Hodnocení plynulosti vyžaduje měření počtu správných a špatných odpovědí za jednotku času (tj. poměrové přesnosti). Analytici nemohou hodnotit plynulost pouze užitím měr správných odpovědí, protože plynulá výkonnost musí být taktéž přesná. 3) Berte v úvahu rozmanitou složitost odpovědí. Míra odpovědí je citlivý a užitečný nástroj, pouze pokud úroveň složitosti a celistvosti se neliší během doby pozorování. Požadavky na naměřené míry odpovědí z předchozích příkladů jsou v podstatě stejné pro všechny odpovědi. Mnoho významného chování, je složené ze dvou či více komponent chování a rozdílné situace volají po rozdílných sekvencích nebo kombinacích daných komponent chování. Jeden způsob, jak měřit míru odpovědí, který bere v úvahu rozdílné složitosti vícekomponentního chování, je počítat operace nutné k získání správné odpovědi. Například v měření pokroku žáků v matematice, výzkumník může vzít v úvahu počet kroků, které byly dokončeny ve správném pořadí uvnitř každého příkladu. Helwig (1993) užíval počat operací potřebných k vypočítání matematického příkladu, aby vypočítal míru odpovědí. V každé relaci dostal student 20 náhodných příkladů na násobení a dělení z množiny 120 příkladů. Učitel nahrával průběh každé hodiny. Všechny příklady byly dvou typů: a x b = c; a/b = c. U každého příkladu byl student požádán, aby našel jednu neznámo: součin, dělenec, dělitele a podíl. Dle příkladu, najít chybějící prvek vyžadovalo jeden až pět kroků. Například, napsat odpověď 275 jako výsledek příkladu 55 x 5 = ? by bylo zaznamenáno jako 4 správné odpovědi, protože nalezení výsledku vyžaduje 4 operace: Vynásobit jednotky 5 x 5 = 25 Zapsat číslo 5 a zapamatovat si 2 Vynásobit desítky: 5 x 5 (0) = 25(0) Přidat zapamatovanou dvojku a zapsat součet 27 Pokud existuje více než jeden způsob, který vedou k nalezení výsledku, byl určen průměrný počet operací. Například. řešení příklady 4 x ? = 164, může být vypočteno násobením (2 operace) nebo dělením (4 operace). Průměrný počet operací jsou tři. Helwig počítal počet operací správně a nesprávně vypočtených příkladů v sadě 20 úloh a zaznamenal jejich míru. 4) Užít míru odpovědi k měření volných operantů (free operant). Míra odpovědi je užitečný nástroj pro měření všech chování, které jsou charakterizovány jako volné operandy. Termín volný operant odkazuje k chování, které má oddělený počáteční a koncový bod, vyžaduje minimální posun organismu v čase a prostoru, může být vykonáno téměř kdykoli, nevyžaduje mnoho času k dokončení a může být učiněno skrz široké rozmezí měr odpovědí. (Baer and Fowler, 1984). Skinner (1966) užívá míru odpovědi volných operandů jako primárně závislou proměnnou pro experimentální analýzu chování. „Stisk tlačítka“ je typickým volným operandem odpovědi užívané v laboratorních studiích na zvířatech. Lidské subjekty v základním laboratorním pokusu mohou mačkat tlačítka na klávesnici. Mnoho sociálně významného chování splňuje definici volného operandu: počet slov přečtených za jednu minutu, počet ran za minutu, počet písmen zapsaných ve třech minutách. Osoba může udělat takovou odpověď téměř kdykoli, každá jednotlivá odpověď nezabere moc času a každá třída odpovědí může produkovat vysoký rozsah měr. Míra odpovědí je preferovaným nástrojem pro měřením pro volných operandů, protože je citlivá na změny v hodnotách chování (např. hlasité čtení se může objevit v mírách 0-250 a více slov za minutu), a protože je přehledná a přesná tím, že vymezuje počet událostí za jednotku času. 5) Neužívejte měr k měření chovní, které se objeví v omezených situacích. Míra odpovědí není užitečným měřením pro chování, které se objevuje pouze v limitovaných a omezených okolnostech. Například míra odpovědi chování, jež se objevuje v určitém pokusu, je limitována možností učinit takové odpovědi. Typická omezená situace, která se objevuje ve zvířecích studiích, zahrnuje pohyb z jednoho konce bludiště na druhý. Typickým příkladem je odpověď na sadu rychlých karet, které ukazuje učitel; odpovídání na učitelovu otázku; ukazování na barvu v sadě barev, která se shoduje se barvou učitele. V každém z těchto případů je míra odpovědi závislá na prezentaci předchozích stimulů. Protože chování, které se objevuje v omezených situacích, je vázáno na příležitost, měření jako je procentuální měření poměru vyvolaných odpovědí a možností k odpovědí, nebo počet platných pokusů (trials-to-criterion), by měla být užita, ale neměla by se použít míra. 6) Neužívejte míru k měření spojitého chování, které se objevuje po delší časové období. Míra je také nevhodným měřením pro spojité chování, které se objevuje po delší dobu, jako je účast na hrách na hřišti nebo práce ve středisku volného času. Takové chování se lépe měří tím, zda se chování děje/neděje v daném čase, získávají se údaje o trvání nebo odhady doby trvání získané z nahrávky určitého časového intervalu. Změna rychlosti (celeration) Stejně jako auto zrychluje, když šlápne řidič na plyn, zpomaluje, když řidič pustí plynový pedál nebo stoupne na brzdu, míry odpovědí také zrychlují a zpomalují. Změna rychlosti je měření toho, jak se míry odpovědí mění v čase. Míry odpovědí zrychlují, když participant odpovídá rychleji v průběhu několika po sobě jdoucích měřeních a zpomalují, když se odpovědi zpomalují v po sobě jdoucích pozorováních. Změna rychlosti zahrnuje tři dimenze kvantity: počet za jednotku času/za jednotku času; nebo jinak řečeno míru za jednotku času (Graf and Lindsley, 2002; Johnston and Pennypacker, 1993a). Rychlost s přímým měřením dynamických vzorců chování poskytuje výzkumníkům a praktikům pohled na změnu jako na přechod z jednoho ustáleného stavu odpovědí na jiný stav a získání plynulých stupňů výkonnosti (Cooper, 2005). The standard Celeration Chart (standardní graf změny rychlosti) (viz obrázek 6.14) představuje standardní formát pro zobrazení měření rychlosti (Pennypacker, Gutierrez and Lindsley, 2003).[5] Existují čtyři standardní grafy změny rychlosti, které ukazují míru jako počet (za minutu, za týden, za měsíc a za rok). Tyto čtyři grafy poskytují rozdílný náhled pro sledování a interpretaci změny rychlosti. Míra odpovědi je zobrazena na vertikální ose y a postupný čas ve dnech, týdnech, měsících či letech na horizontální ose x. V grafech se nejčastěji užívá počtu za minutu a za den. Změna rychlosti je zobrazena ve všech standardních grafech rychlosti jako celeration trend line. Křivka trendů, rovná linka nakreslení skrz řadu bodů grafu, vizuálně zachycuje směr a stupeň trendu v datech.[6] Křivka trendů změny rychlosti ukazuje faktor, kterým je míra odpovědi vynásobena (zrychlena) nebo dělena (zpomalena) v průběhu období změny rychlosti (např. míra za týden, měsíc, rok, dekádu). Časové období změny rychlosti je 1/20 horizontální osy všech standardních grafů změny rychlosti. Například období změny rychlosti pro graf kalendářního týdne je v měsících. Křivka trendů vede z dolního levého rohu do pravého horního a má na všech standardních grafech sklon 34°. Její hodnota zrychlení je x2 (čte se jako dvakrát) - změna rychlosti je tedy vyjádřena jako násobek nebo dělitel. V tomto 34°úhlu změny rychlosti se lineární měření chování mění v čase, což dělá graf standardním. Například jestli je míra odpovědí 20 odpovědí za minutu v pondělí, 40 odpovědí za minutu další podělí a 80 odpovědí za minutu třetí pondělí, křivka změny rychlosti (tj. křivka trendů) by na grafu měla ukazovat zrychlení x2, měla by ukazovat zdvojení v míře odpovědí za týden. Dvojnásobné zrychlení v grafu v následujícím týdnu zdvojnásobí míru odpovědí každý týden (tj. 20 v prvním týdnu, 40 ve druhém týdnu, 80 ve třetím týdnu). Ve většině případů by hodnoty změny rychlosti neměly být počítány z méně než sedmi datových bodů. Více informací o vykreslování a interpretaci dat ze standardních testů změny rychlosti předkládá kapitola 6. Měření založené na časovém rozsahu Trvání (duration) Trvání, množství času, ve kterém se objevuje dané chování, je základním měřením časového rozsahu. Vědci a praktici měří trvání ve standardních jednotkách času (např. Erik dnes pracoval koopeartivně se svým vrstevnickým tutorem 12 minut a 24 sekund). Trvání je důležité, když měříme množství času, po které se osoba účastnila cílového chování. Aplikovaná behaviorální analýza měří trvání nezvykle dlouhého či krátkého klíčového chování. Příkladem může být dítě s vývojovým znevýhodněným, které se vzteká více než hodinu v kuse, nebo student kterému úkol netrvá déle než 30 sekund. Trvání je vhodné měřit u chování, které se vyskytuje ve vysoké míře (např. houpání, škubání hlavou, rukama, nohama) nebo u na úkol oreintovaného chování, které se objevuje po delší dobu (např. kooperativní hraní, plnění úkolu, neplnění úkolu). U chování se často se měří jeden nebo oba typů trvání: celková délku trvání dané relace či sledované období a délka trvání výskytu. Celková doba trvání relace: je měření kumulativní sumy času, po které je člověk účasten klíčového chování. Pro měření a zaznamenávání celkové doby trvání se užívají dvě techniky. Jeden způsob představuje záznam souhrnného množství času ze stanoveného sledovaného období, ve kterém se objevilo cílové chování. Například učitele zajímá, že dítě ve školce tráví mnoho času hrou o samotě. Může zaznamenat celkový čas, po který sledoval, že si dítě hraje samo. Sledovaným obdobím si může zvolit 30 minutové období volné hry. Procedurálně, když si dítě začne hrát samo, učitel spustí stopky. Když dítě se samostatnou hrou přestane, učitel stopky pozastaví, ale nevynuluje je. Když si dítě opět začne hrát samo, učitel opět spustí stopky. V průběhu období 30 minut volné hry, dítě může si mohlo hrát o samotě celkem 18 minut. Jestli se trvání volné hry mění ze dne na den, učitel bude zaznamenávat celkovou dobu trvání hry o samotě jako procento z celkového pozorovaného času (např. celkový čas hry o samotě/celkový čas volné hry x 100 = % hry o samotě v období volné hry). V tomto případě, souhrn 18 minut hry o samotě v 30 minutové relaci dělá 60 %. Zhou, Iwata, Goff a Shore (2001) užili měření celkové doby trvání k posouzení preference položek trávení volného času u lidí s těžkým vývojovým postižením. Použili stopky k záznamu fyzického zapojení do položky (např. dotek obou rukou podložky) během dvouminutových pokusů. Zaznamenávali celkový kontakt v sekundách tak, že sčítali hodnoty získané v průběhu tří dvouminutových relací. McCord, Iwata, Galesky, Ellingson a Thomson (2001) spouštěli a zastavovali stopky, aby změřili celkovou dobu trvání, po kterou se dva dospělí jedinci s těžkou a hlubokou mentální retardací zapojovali do problémového chování (podívejte se na obrázek 6.6). Další záznamy měření celkové doby trvání je suma času, po který je osoba zapojena do činnosti nebo čas který osoba potřebuje k dokončení určitého úkolu bez specifikování minimální či maximální doby pozorování. Například, komunitní plánování má informaci o množství času, který senioři tráví v novém rekreačním centru, takže může určit, kolik minut denně v centru stráví každý senior. Délka trvání výskytu: je měření času, po který se objevuje každá instance klíčového chování. Například předpokládáme, že student opouští své místo často a na různě dlouhou dobu. Pokaždé když student opustí místo, doba opuštění místa se změří stopkami. Když se vrátí, stopky se zastaví, čas je zaznamenán a vynulován. Když student opět opustí místo, proces se opakuje. Výsledná měření dávají data o trvání výskytu každé instance chování - opuštění místa - po sledovanou dobu. Ve studiích hodnotící intervenci zaměřenou na vyrušování dětí ve školním autobuse, Greene, Bailey a Barber (1981) užívali přístroje k nahrávání zvuku. Ten automaticky nahrával, kolikrát výbuchy hluku překročily stanovený práh hlučnosti a dobru trvání v sekundách, po kterou každý výbuch překračoval práh. Vědci pak užívali průměrnou dobu trvání hlučného vyrušování jako jedno měření pro vyhodnocení výsledků intervence. Výběr a kombinace měření počtu a doby trvání. Měření počtu, celkové doby trvání a doby trvání výskytu poskytuje odlišné pohledy na chování. Počet a doba trvání měří odlišné dimenze kvantity chování. Dané rozdíly ovlivňují, kterou dimenzi měřit. Nahrávání události měří opakovatelnost, zatímco záznam délky trvání měří časový rozsah. Například učitel, který sleduje žáka, který tráví mnoho času mimo své místo, může zaznamenávat každý případ, kdy žák opustí místo. Chování je diskrétní (jednotlivé) a pravděpodobně se neobjeví v tak vysokém počtu, že by počítání jeho výskytu bylo složité. Protože každá instance chování opuštění místa může trvat delší dobu a množství času, které student stráví mimo místo je sociálně významný aspekt chování, učitel může rovněž užít záznam o celkové délce chování. Užití počtu k měření chování opuštění místa říká, kolikrát student opustil své místo. Měření celkové doby trvání udává množství a poměr času, který student strávil mimo své místo během pozorované doby. Díky významu časového rozsahu v rozebíraném případě, doba trvání může poskytnout lepší měření než počet. Může se stát, že žák opustil své místo jednou za 30 minutovou pozorovanou dobu. Jeden výsky chování v 30 minutách se nemusí zdát jako problém. Avšak když student zůstane mimo místo na 29 minut v pozorované periodě 30ti minut, dostaneme se k velmi odlišnému pohledu. V tomto případě by doba trvání výskytu byla ještě lepším měřením než počet nebo celková doba trvání. To proto, že doba výskytu měří opakovatelnost a časový rozsah chování. Měření délky trvání výskytu může učitelům poskytnout informaci, kolikrát student opustil místo a jak dlouho každý výskyt trval. Doba trvání výskytu bývá často preferována nad celkovou dobrou trvání, protože je citlivá na počet výskytů klíčového chování. Navíc jestli je třeba měření celkové doby trvání, můžeme jen sečíst jednotlivé doby trvání každého výskytu. Avšak jestli je trvání chování (např. otáčky motoru, odpovídání ve škole) hlavním zájmem, záznam celkové doby trvání může stačit (např. ústní čtení za 3 minuty, volné psaní za 10 minut, běh na 10 km). Měření založené na časovém umístění. Jak bylo řečeno výše, časové umístění (umístění v čase) odkazuje na to, kdy se instance chování objeví s ohledem na další události. K jeho měření se užívají dva typy událostí: začátek předchozí stimulující události a konec předchozí odpovědi. Tyto dva body poskytují kontext pro měření reakční doby (response latency; též latence odpovědi) a doby mezi odpověďmi (interresponse time). Jedná se o nejčastěji užívaná měření umístění v čase v rámci analýzy chování. Reakční doba, latence odpovědi (response latency) Reakční doba (nebo latence) je měřením času mezi uběhlého od začátku stimulu k začátku následné reakce.[7] Latence je vhodným měřením, máme-li zájem o to, kolik času uběhne mezi příležitostí začít chování a samotným začátkem chování. Například student si může stěžovat se značným zpožděním na požadavky učitele. Reakční doba zde bude čas uběhlý od konce učitelových požadavků do stížnosti studenta. Zájem mohou budit také latence o velmi krátké době. Žák odpovídá špatně, protože nečeká, až učitel dokončí otázku. Adolescent, který reaguje útokem na nejmenší provokaci vrstevníka, nemá čas promyslet alternativní chování, které by situaci řešilo klidnějším způsobem. Výzkumníci u reakční doby obvykle udávají průměr, medián a rozsah latencí měřených ve sledovaném období. Například Lerman, Kelley, Vorndran, Kuhn a LaRue (2002) užili měření latencí k zhodnocení účinků rozdílných posilujících magnitud (např. 20 s., 60 s. a 300 s přístupu k posilovači) na pauzu po posilování. Vědci měřili počet sekund od konce každého posilovacího intervalu k první instanci klíčového chování (komunikační odpověď). Mohli pak spočítat a vykreslit průměr, medián a rozsah latencí naměřeních během každé relace. Interrresponse time (IRT) – čas mezi dvěma reakcemi IRT je množství času, které uběhne mezi dvěma po sobě jdoucími instancemi dané třídy odpovědí. Stejně jako latence, IRT je měřením časového umístění, protože udává, kdy se objevila určitá instance chování s ohledem na jinou událost (tj. předchozí událost). Obrázek 4.2. ukazuje schematické vyjádření IRT. Přestože se jedná o přímé měření umístění v čase, IRT se funkčně pojí s mírou odpovědi. Kratší IRT koexistuje s vyšší mírou odpovědi a delší IRT je spojeno s nižší mírou odpovědí. Behaviorální analytikové měří IRT, když je významná doba, která uběhne mezi dvěmi instancemi jedné časové třídy. IRT poskytuje základní měření pro zavádění a hodnocení intervencí (tyto intervence užívají rozdílné druhy posilování v nízkých mírách) a procedur, které užívající posilování k snížení míry odpovědi (viz kapitola 22). Podobně jako data o latenci, i měření IRT jsou typicky zaznamenána a zobrazena graficky průměrem (nebo mediánem) a rozsahem za pozorované období. Obrázek 4.2 Schematické zobrazení tří IRT (časů mezi dvěma reakcemi). IRT – čas uběhlý mezi koncem jedné reakce a začátkem reakce druhé – se běžně užívá k měření časového umístění. Odvozená měření V aplikované analýze chování se často užívá dvou forem dat odvozených z přímého měření dimenzí kvantit chování. Jedná se o procenta a počet platných pokusů (v originále trials-to-criterion; též počet pokusů potřebných k dosažení stanoveného výsledku) Procenta (v originále percentage; též část, procentní sazba) Procento je poměr (tj. proporce) tvořený kombinací stejných dimenzí kvantity, jako je počet (tj. číslo ÷ číslo) nebo čas (tj. doba trvání ÷ doba trvání). Procento vyjadřuje proporcionální množství určité události jako počet, kolikrát se událost objevila ze sta příležitostí, kdy se objevit mohla. Například jestli student odpoví při testu správně na 39 z 50 položek, procento správných odpovědí může být vypočítáno vydělením počtu správných odpovědí celkovým počtem otázek v testu a vynásobením 100 (39÷50= 0.78; 0.78 x 100 = 78 %). Procento se často užívá v aplikované analýze chování, aby vyjádřilo poměr všech správných odpovědí nebo k získání poměru pozorovaných intervalů, ve kterých se objeví klíčové chování. Tato měření jsou typicky udávána jako poměr intervalů v rámci daného sledovaného období (např. obrázek 21.4.). Takto se může vypočítat procento pro celé pozorované období. Procenta se široce užívají ve vzdělávání, psychologii a populárních médiích a většina lidí proporčním vztahům vyjádřených procenty dobře rozumí. Avšak procenta jsou často užívána nevhodně a špatně. Proto zde předkládáme několik poznámek k užití a interpretaci procent. Procenta nejpřesněji reflektují změny v chování a jejich stupeň změn, když se počítá s dělitelem (nebo jmenovatelem) 100 a více. Avšak mnoho procent počítá s dělitelem menším než 100. Měření procent, které se zakládá na malém děliteli, vysoce ovlivňují i malé změny v chování. Například změna o jeden počet v deseti možných, změní procento o 10 %. Guilford (1965) varuje, že počítat procenta s dělitelem menším než 20 není moudré. Pro výzkumné účely doporučujeme, aby se navrhovaly systémy měření, která budou založena na více než 30 možných odpovědích nebo pozorovaných intervalech. Někdy změny v procentech chybně předpokládají zlepšující se výkonnost. Například procenta mohou růst, přestože je frekvence nesprávných odpovědí se stejná nebo dokonce roste (tj. zhoršují se). Uvažujme studena, jehož správnost v matematických příkladech je v pondělí 50 % (5 z 10 příkladů vypočítaných správně), v úterý 60 % (12 z 20 příkladů vypočítaných správně). I přes zlepšující se poměrnou přesnost, vzrůstal počet chyb (z pondělních pěti na úterních osm špatných odpovědí). Přestože žádné jiné měření nevypovídá lépe o proporčních vztazích lépe než procenta, jejich užití nese limity, protože procenta nemají žádné dimenze kvantity.[8] Například procent nelze užít k zhodnocení pokroku zvládnutého nebo plynulého chování, protože zhodnocení zdatnosti se nemůže objevit bez odkazu na počet a čas, ale může ukázat poměrovou (proporční) přesnost klíčového chování během rozvoje dané způsobilosti. Dalším omezením procent jakožto měření změn v chování je, že ve svých údajích obsahuje horná a dolní limity. Například užití procent správně přečtených slov na zhodnocení žákovy dovednosti číst ukládá umělou horní mez na měření výkonu. Žák, který přečte správně 100% slov, se za daných podmínek měření nemůže zlepšit. Ve stejné sadě dat můžeme zaznamenat rozdílná procenta, přitom každé procento předpokládá výrazně odlišnou interpretaci. Například uvažujme studenta, který získá 4 správné odpovědi (20 %) ve 20 položkovém předběžném testu a 16 správných odpovědí ve 20 položkovém (80 %) posttestu. Nejjednodušší popis studentova pokroku od pretestu k posttestu (60 %) porovnává dvě měření, jež užívají stejného dělitele, stejný základ (20 položek). Protože student získal o 12 správných položek více v posttestu než v pretestu, jeho výkon na posttestu může být popsán jako lepší nad jeho výkonu v pretestu o 60 %. Uvažujeme-li, že studentův posttest představoval 4násobné zlepšení ve správných odpovědích, lze namítnout, že posttest je o 300 % lepší od pretestu – což je naprosto odlišná interpretace od pokroku 40 %. Někdy se také udávají procenta větší než 100 %. Udávají se tak nesprávně. Přestože se změny v chování větší než 100 % mohou zdát působivé, matematicky jsou nemožná. Procento je proporčním měřením celkového souboru, kde „x“ (část) z „y“ (celku) je vyjádřena jako jedna část ze sta. Část něčeho nemůže přesáhnout celek a nemůže být menší než 0 (tj. záporné procento je nesmysl). Oblíbený atlet každého trenéra, který jede na 110 %, prostě neexistuje.[9] Počet platných pokusů (TTC; trials-to-criterion; též počet potřebných pokusů k úspěchu). Počet platných pokusů je měření počtu příležitostí k odpovědi, kterých je třeba k dosažení k předem určené úrovni výkonu. Co je obsahem pokusu, záleží na povaze cílového chování a požadované úrovni výkonu. Pro dovednost jako je čištění bot, bude každá příležitost vyleštit boty považována za pokus a data ohledně počtu platných pokusů (TTC) budou dána jako počet pokusů, které žák potřeboval k vyleštění bot správně, bez nápovědy a pomoci. Pro chování, které zahrnuje řešení problému nebo výběr (diskriminaci) aplikované na vysokém počet příkladů, pokusy mohou sestávat z bloku nebo série příležitostí k odpovědi, ve které každá příležitost k odpovědi zahrnuje přítomnost jiného příkladu problému nebo výběru. Například pokus pro výběru dlouhé nebo krátké samohlásky písmena „o“ může být blokem deseti po sobě jdoucích možností, ve kterém každá možnost k odpovědi je přítomnost jiného slova obsahující písmeno o (např. horko, loď) daných v náhodném pořadí. Data TTC mohou být zaznamenána jako počet bloků (deseti odpovědí) potřebných k tomu, aby žák správně vyslovil „o“ ve všech deseti slovech. Počet může být základním měřením, ze kterého budou odvozena data počtu platných pokusů. Pro určení dat počtu platných pokusů lze užít další základní měření jako míra, doba trvání nebo latence. Například měření počtu platných pokusů pro příklady na odečítání dvou dvojciferných čísel může sestávat z počtu cvičných listů s 20 náhodně vybranými a seskupenými příklady, které žák vyplní, než vypočítá všech 20 příkladů na cvičném listu za méně než 3 minuty. TTC data jsou často počítána a zaznamenávána jako ex post facto měření (retrospektivní měření). Jsou pokládána za jeden z významných aspektů „nákladů“ léčení nebo vzdělávací metody. Například Trask-Tyler, Grossi a Heward (1994) zaznamenávali počet pokusů potřebných pro každého ze tří studentů s postižením k samostatnému připravení tří jídel podle receptu v dvou po sobě jdoucích relacích. Každý recept zahrnoval 10-21 analyzovaných kroků potřebných ke splnění úkolu. TTC data se často užívají k porovnání relativní účinnosti dvou a více léčených nebo vzdělávacích metod. Například díky porovnáním počtu platných pokusů potřebných k tomu, aby žák dokázal vyhláskovat týdenní množství slov, které byly učené dvěma způsoby, učitel může rozhodnout, kterou metodou se žák učí lépe. Někdy se TTC data nahrazují daty o délce instrukcí, které bylo třeba k podání výkonu o předem daných kritérií (např., Holcombe, Wolery, Werts a Hrenkevich 1993; Repp, Karsh, Johnson a VanLaarhoven 1994). Měření počtu platných pokusů může být také získáno a analyzováno ve výzkumech jako závislá proměnná. Například R. Baer (1987) zaznamenával a graficky znázornil TTC v pamětních úkolech jako závislou proměnou, když zkoumal dopad kofeinu na chování předškolních dětí. TTC data mohou být taktéž užitečná pro zhodnocení žákovy vzrůstající kompetence osvojit si související skupinu pojmů. Například naučit dítě pojmu „červená barva“ sestává z představení dítěti „červených“ a „nečervených“ položek a poskytnutí různých odměn za správnou odpověď. Počet platných pokusů může být měřen jako počet „červených“ a „nečervených“ exemplářů, kterých bylo třeba, aby dítě získalo stanovenou úroveň výkonu diskriminace. Stejné vzdělávací procedury a procedury sběru dat se mohou užít při učení dalších barev. Dostupná data ukazují, že děti potřebují k osvojení si každé nové barvy méně instruktážních pokusů než při učení předchozí barvy. To je důkaz o vzrůstající schopnosti dětí učit se pojmům barev. Definiční měření (definitional measures) Mimo základní a odvozené dimenze, chování může lze definovat a měřit i jeho formou a intenzitou. Ani forma (tj. topografie) ani intenzita (tj. rozsah, magnituda) odpovědi nejsou základní dimenzí kvantity chování, ale každá je důležitým kvantitativním parametrem pro definování a ověření výskytu mnoha tříd odpovědí. Když výzkumníci a praktici měří topografii nebo magnitudu odpovědi, činí tak aby rozhodli, jestli odpověď představuje klíčové chování. Výskyt klíčového chování, které je ověřeno na základě topografie nebo magnitudy, se pak měří jedním nebo více aspekty jako je počet, časový rozsah nebo časové umístění. Jinak řečeno, měření topografie nebo magnitudy bývá občas nutné k rozhodnutí, zda se objevily třídy klíčových odpovědí. Ale pokud jde o základní a odvozená měření času, míry, průběhu trvání, latence, IRT, procenta a počet platných pokusů, pracuje se s kvantifikací těchto odpovědí. Topografie Topografie odkazuje na fyzickou formu nebo tvar chování. Je jak měřením, tak i tvárnou dimenzí chování. Že je topografie měřitelná vlastnost chování, vyplývá z faktu, že lze rozpoznat rozdílní odpovědi v různých případech. Skupina odpovědí s rozdílnými topografiemi může zastávat stejnou funkci (tj. tvoří třídu odpovědí). Například každý z různých způsobů napsání slova „topografie“, který je ukázán na obrázku 4.3, poskytne čtenáři stejný efekt. Do stejné třídy odpovědí lze ovšem zahrnout jen omezené množství topografií. Přestože každá odpověď topografie na obrázku 4.3 splňuje své požadavky na psanou komunikaci, žádná by nesplnila standardy očekávané od pokročilého studenta kaligrafie. Topografie je velmi důležitá v oblastech, kde forma, styl nebo umělecký dojem tvoří důležitou hodnotu chování (např. malování, sochařství, tanec, gymnastika). Měření a záznam rozdílných následků pro různé topografie je také důležité pro situace, kdy funkční výstup chování vysoce koreluje s konkrétními topografiemi. Student, který sedí slušně a sleduje učitele, bude pravděpodobně lépe ohodnocen, než student který spí s hlavou na lavici (Schwarz a Hawkins, 1970). Basketbalisté, kteří střílí trestné hody určitým způsobem, budou mít větší úspěšnost střelby něž ti, kteří po svém (Kladopoulos a McCOmas, 2001; voz obrázek 6.3). Trap, Milner-Davis, Joseph a Cooper (1978) měřili topografii kurzivního ručního písma prvňáčků. Používali průhledné fólie, aby zachytili odchylky od modelových malých i velkých i velkých písmen (viz obrázek 4.4) Vědci počítali počet správných tahů písmen – ty které splnily všechna specifikovaná topografická kritéria (tj. všechny napsané tahy písma byly v rámci 2 mm tolerance od vzoru písma, byly kompletní, spojené a dostatečně dlouhé) – a počítali procento správných tahů ze všech napsaných každým studentem, aby zhodnotili efekt vizuální a slovní zpětné vazby a posoudili úspěch dětí v nabývání dovedností psaní. Obrázek 4.3: Topografie, fyzická forma nebo tvar chování, je měřitelnou dimenzí chování. Síla odpovědi (v orig. magnitude) Síla odezvy odkazuje na sílu nebo intenzitu, s kterou došlo k odpovědi. Požadovaný výstup některých chování je závislý na síle odpovědi, která může být nad či pod jistou intenzitou. Šroubovák musí být otočen s dostatečnou silou, aby zavrtal nebo vyvrtal šrouby; tužkou musíme na papír patřičně přitlačit, aby zanechala čitelnou stopu. Na druhou stranu aplikování velkého točivého momentu na zrezavělý šroub strhne závity a nadměrný tlak na tužku zlomí její tuhu. OBRÁZEK 4.4: příklady obrysů na průhledné fólii užité k měření vnitřních a vnějších hranic ručně psaných písmen a ilustrace užití průhledné fólie k měření písmena „m“. Protože vertikální tah písmena m přesáhl vnější hranice, nesplnil topografická kritéria na správnou odpověď. Některé výzkumy se zaměřily na posouzení hlasitosti řeči a dalších vokalizací. Schwarz a Hawkins (1970) měřili sílu hlasu Karen, žákyně šesté třídy, která obvykle mluvila ve třídě tak potichu, že ji většinou nikdo neslyšel. Její hlas byl každodenně nahráván na videokazetu po dobu vyučovacích hodin (videokazeta byla taktéž užita k získání dat ohledně dvou dalších chování: dotýkání obličeje a množství času, které Karen seděla shrbeně). Výzkumníci pak zkoumali autostopu nahrávky pomocí měřiče hlasitosti a spočítali, kolikrát přístroj zaznamená překročení určeného stupně hlasitosti. Schwarz a Hawkins užívali počet (poměr) překročení dané úrovně ve sto slovech jako primární měření pro zhodnocení efektů intervence zaměřené na zvýšení hlasitosti její řeči. Greene a kolektiv (1981) užili přístroj pro automatické nahrávání zvuku, aby změřili hlasitost vyrušování středoškoláků ve školním autobuse. Nahrávací zařízení se spustilo pouze pokud okolní hlasitost překročila předem nastavenou hodnotu. Zařízení automaticky nahrávalo počet překročení zvukového limitu (93 dB) a celkový dobu trvání tohoto překročení. Když úroveň hluku přesáhla určený práh, aktivovalo se světlo na panelu, které mohli vidět všichni žáci. Když světlo nesvítilo, studenti mohli v cestou poslouchat hudbu, nepřekročil-li počet překročení zvukového limitu určitou mez, studenti se mohli účastnit losování o ceny. Tato intervence drasticky snížila vyrušování a další problémové chování. Green a kolektiv použili počet a průměrnou dobu vyrušování jako míry pro zhodnocení účinků intervence.[10] Tabulka 4.1. shrnuje měřitelné dimenze chování a rady pro jejich použití. Tabulka 4.1: základní, odvozené a definiční dimenze, které lze užít pro měření a popis chování Základní měření Jak se počítá Komentář Počet: počet odpovědí, které se objevily během pozorovaného období Počítejte pozorované odpovědi; Jitka přispěla 5 komentáři v průběhu 10 minutové třídní diskuze. Mělo by se referovat o pozorovaném času, po který byl počet zaznamenáván. Nejužitečnější pro porovnávání, když je sledovaný čas konstantní ve všech pozorováních; užíván k počítání míry/frekvence, změny rychlosti, procent a počtu platných odpovědí Míra/frekvence: poměr počtu a sledovaného času; často vyjádřen jako počet za standardní jednotku času (tj. za minutu, za hodinu, za den) Udejte počet odpovědí a čas, ve kterém se pozorování odehrávalo. Jestli byly Jitčiny komentáře počítány během 10 minutové třídní diskuze, míra jejího odpovídání bude 5 komentářů za deset minut. Často počítána jako podíl počtu zaznamenaných odpovědí počtem standardních jednotek času, po které bylo pozorování prováděno. Jitka má míru 0,5 komentáře za minutu. Jestli se pozorovaný čas mění napříč měřeními, počítejte se standardní jednotkou času; Minimalizujte špatnou interpretaci tím, že nahlásíte měřený čas. Hodnocení vývoje dovedností a plynulosti vyžaduje měření měr správných a špatných odpovědí; berte v úvahu rozličnou celistvost a složitost, když počítáte míru odpovědí. míra je nejcitlivějším měřítkem změny v opakovatelnosti; preferované měření pro volné operandy; špatné měření pro chování, které se vyskytuje v omezených časových intervalech nebo pokud se chování vyskytuje po delší dobu; nejcitlivější měření opakovatelnosti chování. Odvozená měření Jak se počítá Komentář změna rychlosti: změna (zrychlení, zpomalení) v míře odpovědí napříč časem založena na počtu za jednotku času (míra); vyjádřena jako faktor, kterým se odpovědi zrychlují/zpomalují (násobení či dělení). Linka trendů spojující Jitčina průměrná míra komentářů po dobu 4 týdnů 0,1; 0,2; 0,4 a 0,8 komentářů za minutu, může ukazovat zrychlení faktorem "krát 2 " za týden. Odhaluje dynamiku vzorců změn chování jako je přechod z jednoho ustáleného stavu do dalšího anebo přírůstek či plynulost. Vyjádřena linkou trendů v Standardtním grafu změny rychlosti (viz kapitola 6). Doporučuje se minimálně 7 měření měr pro její výpočet. trvání: množství času, po které se vyskytuje chování celková doba trvání: dvě metody: a) sčítej jednotlivá množství času pro každou odpověď v průběhu sledovaného období; b) zaznamenej celkové množství času, po který je osoba zapojena do aktivity, nebo který potřebuje k dokončení úkolu, bez minimálního nebo maximálního pozorovaného období. Jitka v dnešní výuce komentovala po dobu 1,5 minuty. doba trvání výskytu: zaznamenejte dobu trvání každé instance chování; často zapsána průměrem a mediánem a rozsahem trvání za výskyt. Jitčiny komentáře dnes v průměru trvaly 11 sekund, měly rozsah od 3 do 24 sekund. důležité měření, když je klíčové chování problematické, protože se objevuje po příliš dlouhou nebo krátkou dobu. Užitečné měření pro chování, které se vyskytuje ve vysokých mírách a pro které je složité přesné nahrávání (například poklepávání prstů). Užitečné měření pro chování, které nemá samostatné začátky a které je těžké zaznamenávat (např. bzučení). Užitečné měření pro chování orientované na úkol nebo chování souvislé (např. kooperativní hra). Doba trvání výskytu bývá preferována nad celkovou dobou trvání, protože obsahuje data o počtu i celkové době trvání. Užívejte celkovou dobu trvání, když chcete postihnout vzrůstající odolnost (trvání) chování. Měření trvání výskytu vyžaduje počítat odpovědi, které mohou být dále užity k měření míry odpovědí. Latence v odpovědi: bod v čase, ve kterém dojde k odpovědi s ohledem na výskyt předchozího stimulu. zaznamenávejte čas, který uběhne od začátku stimulující události a začátkem následné odpovědi; často udáván průměrem nebo mediánem a rozsahem latence za období. Jitčiny komentáře měly dnes průměrnou latenci 30 sekund od komentářů spolužáků (rozsah od 5 do 90 sekund) důležité měření je-li klíčové chování, ke kterému dochází příliš pozdě nebo příliš brzy. Snižující se latence mohou odhalit narůstající zběhlost ve výkonu některých dovedností. Čas mezi odezvami: IRT interresponse time: bod v čase, ve kterém dojde k odpovědi s ohledem na výskyt předchozí odpovědi zaznamenávejte čas, který uběhl od konce předchozí odpovědi a začátkem odpovědi následující; často udáván průměrem nebo mediánem a rozsahem času mezi odpověďmi za období. Jitčiny komentáře dnes měly medián IRT 2 minuty a rozsah od 10 sekund do 5 minut. Důležité měření, když je cílem čas uběhlý mezi odpověďmi nebo stimulace chování. Přestože měří časové umístění, IRT koreluje s mírou odpovědí. Důležité měření, když zavádíme a hodnotíme intervenci (viz kapitola 22). Odvozené měření jak se počítá komentář Procento: poměr vyjádřený jako počet částí ze sta; typicky dána jako míra počtu odpovědí určitého typu z celkového počtu odpovědí (nebo možností či intervalů, ve kterých se odpovědi mohly vyskytnout). vyděl počet odpovědí splňujících daná kritéria (např. správné odpovědi, odpovědi s minimálním IRT, odpovědi jisté topografie) celkovým počtem odpovědí (nebo možných odpovědí) a vynásob stem. 70 % Jitčiných komentářů bylo dnes relevantních diskutovanému tématu. procenta založená na děliteli menším než 20 jsou nadmíru ovlivnitelná malými změnami v chování. Pro výzkum doporučujeme minimálně 30 pozorovaných intervalů nebo možných odpovědí. Změny v procentech mohou klamně předpokládat zvyšující se výkon. Vždy udávejte dělitele, na kterém se zakládá měření procent. Nemůže se užít k zhodnocení dovednosti nebo plynulosti. Zavádí horní a dolní mez výkonnosti (tj. nemůže přesáhnout 100 %). Ze stejné sady dat lze získat velmi rozlišná procenta. Abys vypočítal výsledné procento z řady procent, které mají různé jmenovatele (např. 90%=9/10; 87,5%=7/8; 33%=1/3), poděl součet všech čitatelů součtem všech jmenovatelů. Pouhá průměr samotných procent může vést k jinému výsledku (např. 90 % + 87,5 % + 33 % + 100 % /4 = 77,6 %). Počet platných pokusů: TTC: počet odpovědí, cvičných pokusů nebo možných procvičování, kterých je třeba k dosáhnutí předem stanovených kritérií výkonu. sečti počet odpovědí nebo zkoušek nutných k tomu, aby žák dosáhl specifických kritérií. Během třídní diskuze bylo zavedeno pokusné období. Bylo třeba 14 bloků o 10 příležitostech ke komentáři, aby Jitka dosáhla na kritérium 8 z 10 komentářů, které se týkají tématu. Poskytuje ex post facto popis "ceny" léčebných a učebních metod. Užitečné pro porovnávání relativní účinnosti rozdílných metod, instrukcí nebo trénování. Užitečné k zhodnocení změn v mírách, ve kterých žák zvládne novou dovednost. definiční měření jak se počítá komentář Topografie: forma nebo tvar chování užívány k rozhodnutí, zda odpovědi splňují topografická kritéria; odpovědi, které je splňují, jsou měřeny a zaznamenávány jedním či více základními nebo odvozenými měřeními (např. procenta odpovědí splňující topografická kritéria). Amanda se trefila do šípem do terče na vzdálenost 30 metrů v 69 % případů. důležité měření, když jsou chtěné výsledky chování podmíněné vykonáním odpovědí jistých topografií. Důležité měření pro oblasti, v kterých se cení forma, styl nebo umělecký výkon. Síla chování: síla, intenzita chování. užívána k posouzení, zda odpověď splňuje kritéria velikosti. Odpověď splňující tato kritéria je měřena a zaznamenávána jedním či více základními či odvozenými měřeními (např. počet odpovědí splňujících kritéria velikosti). Julie zvedla na bench 60 librové závaží 20 krát. důležité měření, když jsou žádané výstupy chování podmíněné odpověďmi o daném rozsahu nebo velikosti. Procedury měření chování Procedury pro měření chování nejčastěji užívané v aplikované analýze chovní nejčastěji zahrnují jedno nebo kombinaci z následujícího: nahrávání událostí, časování a rozlišné metody pro časového vzorkování. Zaznamenávání události Zaznamenávání události zahrnuje širokou škálu procedur pro zjišťování a nahrávání toho, kolikrát se zkoumané chování vyskytlo. Například Cuvo, Lerch, Leurquin, Gaffaney a Poppen (1998) užívali nahrávání událostí, když analyzovali efekt rozvrhu práce a odměn na chování dospělých s mentálním postižením a předškoláků, zatímco byli zapojeni do úkolů vhodných jejich věku (např. dospělí třídili stříbro, děti házely pytlíky nebo skákaly přes překážky). Vědci zaznamenávali každý kousek vybraného stříbra, každý hozený pytlík a každou přeskočenou překážku). Přístroje na nahrávání chování Přestože pro záznam chování postačí i tužka a papír, následující zařízení a procedury mohou ulehčit sběrný proces. · Náramkové počítadlo (wrist counters): užitečné pro počítání výskytu chování žáků. Golfisté užívají tato počitadla k počítání úderů. Na většině náramkových počitadel lze zaznamenat hodnoty od 0 po 99. Tato počítadla lze objednat v obchodě se sportovním zbožním nebo ve velkých nákupních centrech. · ruční digitální počítadla (hand tally digital counter): tato digitální počítadla jsou podobna svým náramkovým protějškům. Často se užívají v řetězcích ochodů s potravinami, kavárnách, vojenských jídelnách a u dopravních závor. Tato počitadla mohou zaznamenávat najednou i více dat a vejdou se pohodlně do dlaně. Zkušení výzkumníci mohou jednou rukou počítat rychle a spolehlivě více hodnot najednou. Jsou k dostání v obchodech s kancelářskými potřebami. · zápěstní a tkaničkové počitadlo (abacus wrist and shoestring counters): Landry a McGreevy (1984) popsali dva typy zápěstních počitadel. Zápěstní počitadlo je vyrobeno z provázků a korálků připevněných ke koženému náramku a tvoří tak počitadlo se šňůrkami a korálky od 1 do 10. Výzkumník může počítat výskyty chování v rozmezí od 1 do 99 tím, že posune korálky na šňůrce. Na tkaničkovém počitadle jsou odpovědi jsou počítány stejným způsobem s rozdílem, že kuličky jezdí na tkaničce připevněné ke kroužku na klíče, který je připevněn k výzkumníkovu pásku nebo jinému kusu oblečení jako je knoflíková dírka. · Izolepa, páska (masking tape): učitelé mohou zaznamenávat výskyt chování na pásce přilepené na katedře nebo zápěstí. · Mince, knoflíky, kancelářské sponky: pokaždé, když se vyskytne klíčové chování, přemístíme drobný předmět z jedné kapsy do druhé · Kapesní počitadlo: užívá se taktéž z počítání událostí. Zaznamenávání událostí lze také užít pro měření jednotlivých výskytů chování, když hodnota pro každou odpověď je buď 1 nebo 0 v závislosti na tom, zda došlo či nedošlo k výskytu daného chování. Obrázek 4.5 ukazuje záznamový arch použitelný pro zachycení nápodoby (odpovědi imitace) u předškoláků se znevýhodněním a jeho intaktního vrstevníka, která se vyskytuje v sérii výukových pokusů během vyučovací hodiny (Valk, 2003). Pro každý pokus výzkumník zaznamenával výskyt správné odpovědi, žádné odpovědi, přibližné odpovědi nebo nevhodné odpovědi u sledovaného dítěte a vrstevníka. Tento záznam se provede zakroužkováním symbolu reprezentujícímu dané chování. Formulář dovoloval zaznamenat učitelovu odezvu (výtka, chvála) imitačního chování každého dítěte. Zamyšlení nad záznamem událostí Záznam událostí se provádí snadno. Většina lidí může zaznamenat jednotlivá chování přesně, často na první pokus. Jestli míra odpovědí není příliš vysoká, záznam událostí neomezuje ostatní aktivity. Učitel může pokračovat ve výkladu, zatímco počítá výskyt zkoumaného chování. Záznam událostí je užitečným měřením většiny chování. Je však nutné, aby každý výskyt klíčového chování měl jasný bod začátku a konce. Záznam událostí lze dobře aplikovat na klíčové chování jako je odpovídání na otázky, psané řešení matematických úloh, pochvala rodičů. Chování jako je hlučení je těžko měřitelná veličina pro záznam událostí, jelikož výzkumník jen obtížně rozliší přesný počátek a konec hlučení. Záznam událostí je obtážně aplikovatelný pro taková chování, které nemají přesně definované akce či vztahy mezi objekty – např. hraní si s předměty ve volné hry. Protože hra s předměty nepředstavuje konkrétní akci nebo vztah mezi objekty, pozorovatel těžko posoudí, kdy hra začne a skončí. Záznam událostí není vhodným měřením u chování, které se vyskytuje příliš často a pozorovatel by měl problémy počítat jejich přesný výskyt. Příkladem takového častého chování může být rychlé mluvení, houpání tělem a poklepávání s objekty. Taktéž nahrávání událostí neposkytuje přesné údaje pro takové chování, které trvá příliš dlouhou dobu. Naříklad plnění úkolu, poslech, hraní si v koutě, být mimo místo, cucání palce. Na úkol orientované či soustavné chování (např. být zaúkolován) jsou předtavitelé takového typu chování, pro které jejich záznam není vhodný. Třídy spojitých chování vyskytujících se delší dobu nestojí v zájmu aplikované analýzy chování. Například čtení samo o sobě má menší vypovídající hodnotu než počet slov přečtených správně a špatně, nebo počet otázek na porozumění textu zodpovězených správně a chybně. Podobně chování, která demonstrují porozumění, jsou důležitější pro měření než „chování poslouchání“. I počet odpovědí, které student napsal během samostatné práce, je významnější než to, že plní úkol. Obrázek 4.5. Formulář sběru dat, který zaznamenává chování dvou dětí a učitele během série nezávislých pokusů. Převzato z „The effects od Embedded instruction within the Context of a Small Group on the Acquisition of Imitation Skills of Young \children with Disabilities by J. E: Valk (2003), s. 167. Nepublikovaná doktorská dizertační práce, The Ohio State University. Dovoleno užít. Časování, měření času (timing) K měření délky trvání, latence a doby mezi odpověďmi (IRT) se užívají rozličné měřicí přístroje a procedury Měření délky chování Výzkumníci často využívají poloautomatické počítačem řízené systémy pro nahrávání doby trvání. Praktici budou spíše používat neautomatizované nástroje pro záznam délky trvání. Nejpreciznější neautomatický nástroj jsou digitální stopky. Praktici mohou užít nástěnné hodiny či náramkové hodinky, ale takto získané výsledky budou méně precizní. Procedura nahrávání celkové doby klíčového chování v každé relaci za použití stopek: a) spusťte stopky, jakmile začne klíčové chování; b) pozastavte stopky, když chování skončí. Pak, bez vynulování opět spusťte stopky, když začne další výskyt klíčového chování a zastavte stopky, když chování skončí. Tímto způsobem výzkumník sbírá jednotlivé délky trvání po celé pozorované období, na jeho konci zapíše celkovou délku trvání, kterou vyčte na stopkách, do datového formuláře. Gast a kolektiv (2000) pro měření doby trvání užívali magnetofonu s nožním spínačem, takže měli obě ruce volné a užívali je jako stimulu k interakci s participantem výzkumu. Trvání studentova klíčového chování bylo nahráváno audio a videorekordér s páskou, kterou aktivoval instruktorovou nohou. Když se student zapojil do klíčového chování, učitel aktivoval nahrávání. Když student ukončil klíčové chování, učitel nohou ukončil nahrávání. Na konci relace učitel řekl „konec“ a zastavil nahrávací zařízení, vyndal pásku. Následně ji přehrál a stopoval dobu trvání klíčového chování se stopkami (s. 398). McEntee a Saunders (1997) nahrávali dobu trvání výskytu pomocí systému čárových kódů, aby změřili a) funkční a stereotypní zapojení s předměty; b) stereotypy bez interakce s předměty a další odchylné (aberantní) chování. Vytvořili čárové kódy (ty se nalepily na předměty) a uspořádali je na záznamový formulář, aby zaznamenávali chování čtyř adolescentů s těžkým až hlubokým mentálním postižením. Počítač s fontem čárových kódů a se softwarem, který dokáže přečíst čárové kódy, zaznamenávali rok, měsíc, den a čas konkrétních událostí. Systém sbírající čárové kódy poskytoval data o reálném čase trvání měření manipulace s předměty a nenormálním chování. Měření délky latence odpovědi a času mezi odpověďmi (IRT) Procedury pro měření latence a času mezi odpověďmi se podají procedurám k měření doby trvání. Měření latence vyžaduje precizní měření a záznam času, který uběhne od začátku stimulující události a začátkem následné odpovědi (klíčového chování). Měření IRT pak znamená záznam doby uběhlé mezi koncem výskytu klíčového chování a začátkem následujícího klíčového chování. Webhy a Hollan (2000) měřili latenci mezi požadavkem k počítání matematických úloh a začátkem počítání u skupiny žáků základních škol s poruchami učení. Užívali přitom laptop se softwarem na detekování latence (viz Tapp, Wehby, Ellis, 1995; pro pozorovací systém MOOSES). Časové vzorkování (time sampling) Termín časové vzorkování zahrnuje rozmanité metody pro pozorování a záznam chování během intervalů nebo v konkrétních časových momentech. Základní postup spočívá v rozdělení pozorovaného období na několik menších časových intervalů a následným pozorováním, zda-li se zkoumané chování objevilo či neobjevilo během intervalu, či na jeho konci. Časové vzorkování bylo původně vyvinuto etology studujícími chování zvířat (Charlesworth a Spiker, 1975). Jelikož bylo obtížně pozorovat zvířata neustále, tito vědci navrhli rozvrh relativně krátkých ale častých pozorovacích intervalů. Měření získané z těchto „vzorků“ je považováno za reprezentativní vzhledem k chování během celé periody času, v níž byly vzorky sbírány. Například většina našich znalostí o chování goril se je založena na datech sesbíraných vědci jako Jane Goodall, kteří užívali pozorovací metody časového vzorkování. Často se užívá se tři formy časového vzorkování: záznam celého intervalu, záznam části intervalu a okamžikový záznam.[11] Záznam celého intervalu (v originále whole-intrerval recording) Záznam celého intervalu se často užívá k měření spojitého chování (např. kooperativní hry) nebo chování, které se objeví ve vysokých mírách, takže pozorovatel obtížně rozezná jednu odpověď od druhé (např. houpání, hlučení, bzučení), ale může určit, zda se chování v daném čase děje či nikoli. Při záznamu celého intervalu, se pozorované období dělí na sérii krátkých časových intervalů (typicky od 5 do 10 sekund). Na konci každého intervalu pozorovatel zaznamená, zda se zkoumané chování vyskytovalo po celý interval. Pokud u studenta zkoumám jeho plnění úkolu na základě 10vteřinových časových intervalů, může o studentovi říci, že úkol plnil, pouze pokud se mu věnoval celý časový interval. Pokud se student věnoval pouze 9 z 10 sekund intervalu, je hodnocen, jako že v daném intervalu úkol neplnil. Proto takto získaná data získaná obvykle podceňují celkové procento času, po které se zkoumané chování skutečně objevovalo. Čím jsou delší intervaly pozorování, tím víc je tato hodnota podceňována. Data získaná pomocí záznamu celého intervalu jsou prezentována jako procento ze všech intervalů, ve kterých se zkoumané chování objevilo. Protože představuje podíl celého pozorovaného období, ve které osoba projevovala zkoumané chování, data ze záznamu celého intervalu dovolují odhadnout celkovou dobu trvání. Například předpokládejme, že pozorovací období rozdělíme na šest 10 sekundových intervalů (1 minuta). Jestli bylo zkoumané chování sledováno ve 4 z těchto intervalů a neobjevilo se ve dvou zbývajících intervalech, můžeme celkovou dobu trvání odhadnout na 40 sekund. Obrázek 4.6 ukazuje příklad formuláře pro záznam celého intervalu, který se užívá k měření, zda 4 studenti vykonávali svěřený úkol (Ludwig, 2004). Každá minuta byla rozdělena na 4 desetisekundové pozorovací intervaly; po každém interval měl pozorovatel 5 vteřin na to, aby mohl zaznamenat výskyt či absenci zkoumaného chování v předchozím intervalu. Pozorovatelka nejdříve sledovala studenta č. 1 po dobu 10 sekund a pak během dalších 5 vteřin zapsala, zda-li se student svému úkolu věnoval. Záznam byl proveden zakroužkování ANO (YES) nebo NE (NO) v záznamovém formuláři. Po těchto 5 vteřinách, pozorovatelka začala sledovat studenta č 2 po dobu dalších 10 sekund, po jejichž uplynutí obdobně zaznamenala ve formuláři výskyt chování u studenta č 2. Tímto způsobem byli zkoumání i zbývající dva studenti. Tímto způsobem byl každý student pozorován jedním desetivteřinovým intervalem za minutu. Pozorování bylo prováděno po dobu 30 minut a u každého studenta bylo zaznamenáno 30 desetivteřinových vzorků, zda-li se věnoval, svému úkolu. Z data na obrázku 4.6 vyplývá, že se čtyři studenti plnili své úkoly během relace 17 na 87 %, 93 %, 60 % a 73 %, respektive všech intervalů. Přestože záměr těchto dat je reprezentovat úroveň chování studentů po zkoumané období, je třeba míti na paměti, že každý byl pozorován pouze po dobu 5 z celých 30 minut. Obrázek 4.6: pozorovací formulář užívaný pro záznam celých intervalů čtyř studentů, jestli plní úkol během samostatné práce. Převzato z Ludwig, 2004, s. 101, nepublikovaná magisterská práce,The Ohio State University). Pozorovatelé užívající jakýkoli způsob časového vzorkování by měli vždy v každém intervalu zkoumat odpovědi stejného druhu. Například pozorovatel užívající formulář jako na obrázku 4.6 by měl zaznamenat výskyt nebo absenci klíčového chování v každém intervalu tím, že zakroužkuje ANO nebo NE. Nechat neoznačené intervaly zvyšuje pravděpodobnost chyby při dalším označování. Všechny metody časového vzorkování vyžadují časové měřící zařízení, které upozorné na začátek a konec každého pozorování a nahrávaného intervalu. Pozorovatelé užívající tužku, papír a tabuli často umístí stopky k tabuli. Ovšem častý pohled na stopky může mít negativní dopad na přesnost měření. Účinným řešením tohoto problému je, pokud pozorovatel dostává ve sluchátku zvuková znamení značící pozorované a zaznamenávané intervaly. Například pozorovatel užívající proceduru záznamu celého intervalu, viz výše, může poslouchat audionahrávku se sekvencemi předem nahraných zpráv v podobě: „pozoruj Studenta 1“, 10 sekund později „zaznamenej Studenta 1“, 5 sekund později „pozoruj studenta 2“, 10 sekund později „zaznamenej studenta 2“, atd. Vibrační zařízení mohou být také užita k signalizaci pozorovaných intervalů. Například Gentle Reminder (dan@gentlereminder.com) a MotivAider (www.habitchange.com) jsou malé časové nástroje, které vibrují v naprogramovaném čase. Záznam části intervalu Když užíváme záznam části intervalu, zaznamenáváme, zda se chování objevilo v jakékoli části daného intervalu. Časové vzorkování po částečných intervalech se nezajímá o to, kolikrát se chování objevilo, nebo jak dlouho trvalo, zajímá se jen o to, zda se během intervalu objevilo či nikoli. Jestli se klíčové chování objevilo několikrát během intervalu, je stejně zaznamenáno jako jeden výskyt. Pozorovatel, který užívá záznam části intervalu k měření rušivého chování žáka, by označil interval, kdykoli by se v něm žák projevil takovým způsobem, který by splnil definici rušení, což znamená, že interval by se označil jako rušiví, kdyby žák zlobil pouhou 1 vteřinu ze 6 vteřinového intervalu. Podobně jako v případu záznamu celého intervalu, i data ze záznamu části intervalu, se prezentují ve formě procenta z celkového počtu intervalů, kdy se zkoumané chování objevilo. Částečná záznam intervalu se užívá pro reprezentaci poměru výskytu zkoumaného chování k celkové době pozorování, ale na rozdíl od záznamu celého intervalu neposkytuje žádné informace o době takového chování. To protože každý výskyt sledovaného chování, nehledě na délku jeho trvání, způsobí, že se celý interval bude počítat. Obrázek 4.7: ukázka formuláře, který byl užit pro částečný záznam intervalu u tří studentů ve třídě pro 4 třídy odpovědí (A = akademická odpověď; T= mluvení; S = mimo své místo; D = jiné rušivé chování; N = žádný výskyt klíčového chování). Pokud u částečného záznamu intervalu užijeme krátkých pozorovacích intervalů pro měření jednotlivých odpovědí s krátkou dobou trvání, získaná data poskytují hrubý odhad minimální míry odpovědi. Například pokud se částečný záznam intervalu skládal z 6 sekundových po sobě jdoucích intervalů (tj. mezi intervaly není okamžik, kdy by objekt nebyl pozorován), a získaná data říkají, že se chování objevilo v 50 % všech intervalů, můžeme prohlásit, že minimální míra odpovědi byla 5 odpovědí za minutu (průměrně, přinejmenším jedna odpověď se nastala v 5 z 10 intervalů za minutu). Přestože záznam částečného intervalu často nadhodnocuje celkovou dobu trvání, zároveň podhodnocuje míru vysoce frekventovaného chování. To protože interval, ve kterém osoba udělá 8 neverbálních zvuků, se bude počítat, pouze jako kdyby udělala jeden neverbální zvuk. Pokud pro vyhodnocení a pochopení cílového chování potřebujeme přesně a citlivě změřit míru odpovědí, doporučujeme použít nahrávání událostí. Protože pozorovatel užívající záznam části intervalu zaznamenává pouze, zda se chování objevilo kdykoli během intervalu (na rozdíl od záznamu celého intervalu), je zároveň možné měřit více chování. Obrázek 4.7 znázorňuje část formuláře užívaného pro částečný záznam intervalu u tří studentů ve třídě pro 4 třídy odpovědí s 20 vteřinovým intervalem. Pozorovatel sledoval studenta 1 po dobu prvních 20 sekund, studenta 2 po dobu dalších 20 sekund a studenta 3 po dobu další 20 sekund. Každý student byl tedy během jedné minuty pozorován 20 vteřin. Zda se u student projeví jakékoli zkoumané chování v libovolném okamžiku pozorovacího intervalu, pozorovatel označí písmeno odpovídající projevenému chování. Pokud se u studenta nevyskytne žádné zkoumané chování, pozorovatel označí N. Například během prvního intervalu student 1 odpověděl Pacifický oceán (akademická odpověď). Během prvního intervalu studentka 2 opustila místa a hodila tužkou (chování ve třídě odpovědí „jiné rušivé chování“). Student prvním intervalu 3 neprojevil žádné zkoumané chování ze 4 klíčových chování během prvního pozorovaného intervalu. Okamžikový záznam (momentary time sampling) Pozorovatel užívající okamžikový záznam zapisuje, zda se sledované chování objevilo na konci každého měřeného intervalu. Když vedeme okamžikový záznam po minutových intervalech, dívali bychom se na sledovanou osobu na konci každé minuty a okamžitě bychom rozhodnuli, zda se klíčové chování vyskytlo a zaznamenali bychom naše zjištění na záznamový arch. O minutu později (tj. 2. minuta pozorovaného období) bychom se opět podívali na sledovanou osobu a zase rozhodly o výskytu či absenci zkoumaného chování. Tento postup by se opakoval až do konce pozorovaného období. Podobně jako u metody pro intervalový záznam, data z okamžikového záznamu jsou typicky zobrazena jako procenta ze všech intervalů, ve kterých se chování vyskytlo a jsou užívána k odhadu podílu celkové pozorované doby, po kterou se chování dělo. Pro pozorovatele má okamžikový záznam tu velkou výhodu, že nemusí zkoumat objekt nepřetržitě, což je hlavní požadavek u intervalového záznamu. Jelikož osobu sledujeme jen po krátký okamžik, nezachytíme mnoho výskytu sledovaného chování. Okamžikový záznam se užívá primárně k měření kontinuálních aktivit/chování, jako je zapojení do úkolu, což je právě takový typ činnosti, který se dobře. Naopak okamžikový záznam nedoporučujeme pro taková chování, která se vyskytují v omezenéí míře a po krátký okamžik (Saudagas a Zanolli, 1990). Mnoho studií již porovnávalo měření stejného chování pomocí okamžikových záznamů (o různě dlouhých intervalech) s nepřetržitým záznamem (např. Gunter, Venn, Patrick, Miller a Kelly, 2003; Powell, Martindale a Kulp 1975; Simpson a Simpson, 1977; Saudargas a Zanolli 1990; Test a Heward, 1984). Závěr těchto výzkumů naznačují, že okamžikový záznam s intervalem delšími než dvě minuty nadhodnocuje i podhodnocuje výskyty chování ve srovnání s nepřetržitým záznamem. S intervaly kratšími dvou minut, se již data získaná okamžikovým záznamem podobají datům získaným metodou kontinuálního záznamu. Obrázek 4.8 ukazuje výsledky pro jednoho ze studentů. Práce Guntera a jeho kolegů jsou typickými představiteli těchto výzkumů. Porovnávali měření plnění úkolů u tří žáků základních škol s poruchami emocí a chování po dobu sedmi sezení. Data byla získána jednak okamžikovým záznamem s intervaly 2, 4, 6 minut a jednak s pomocí kontinuálních záznamů. Měření získané za pomoci 4 a 6 minutových intervalů byla vysoce nepodobna těm, které byly produktem kontinuálního měření. Zatímco u 2minutového okamžikového záznamu data korespondovala s kontinuálním měřením. Obrázek 4.8 znázorňuje výsledky jednoho ze studentů. Obrázek 4.8: Porovnání měření chování – plnění úkolu žáka základní školy získané 2, 4 a 6 minutovám intervalem okamžikového vzorkování s měřením stejného chování získaného kontinuálním záznamem. Převzato z „efficacy of using momentky time samples to determinate on-task behavior of students with emotional/behavioral disorders“ od P.L. Gunter, M.L.Venn, J. Patrick, K.A. Miller a L. Kelly, 2003. Plánovaná kontrola činnosti (Planned Activity Check) Plánovaná kontrola činnosti (PLACHECK), je variace okamžikového záznamu, kdy používáme počet lidí (head counts) k měření skupinového chování. Učitel při použití PLACHECK na konci každého intervalu sleduje skupinu žáků, spočítá počet žáků, kteří se věnují zkoumané aktivitě a zapíše toto číslo spolu s celkovým počtem žáků. Například Doke, a Risley (1972) užili data získaná PLACHECK metodou k porovnání skupiny účastníků pro povinné a dobrovolné předškolní aktivity. Pozorovatelé na konci každého tříminutového intervalu zaznamenali počet dětí, které se věnovali povinné či dobrovolné aktivitě a počet dětí zapojených do jiné aktivity. Data pak uváděli jako jednotlivá procenta dětí zapojených do požadované či dobrovolné aktivity. Deyer, Schwartz a Luce (1984) používali variaci PLACHECKu, aby změřili procento studentů se znevýhodněním v ústavní výchově, kteří se zapojili do věkově vhodných a funkčních aktivit. Jakmile studenti vstoupili do pozorovacího prostoru, byli individuálně sledováni tak dlouho, dokud se neurčila aktivita, které se věnují. Studenti byli pozorování v předem stanoveném pořadí, a doba pozorování nepřesáhla 10 sekund na studenta. Rozpoznání chyb v metodách časového vzorkování Jak již bylo řečeno, všechny metody časového vzorkování, poskytují jen odhad skutečného výskytu chování. Rozdílné vzorkovací metody produkují rozdílné výsledky, jenž mohou mít vliv na rozhodnutí a interpretaci. Obrázek 4.9 ilustruje rozdílnost výsledky získané různými metodami časového vzorkování. Tmavé bloky značí, kdy nastalo zkoumané chování v pozorovaném období, které bylo rozděleno na 10 po sobě jdoucích intervalů. Tmavé bloky znázorňují všechny tři dimenze kvantity chování: opakovatelnost (7 výskytů chování), časový rozsah (trvání každé odpovědi) a časové rozmístění (čas mezi odpověďmi je dán prostorem mezi černými bloky). Metody časového vzorkování jsou často prezentovány a interpretovány jako podíl z celkového sledovaného období, ve které se chování objevilo. Proto je důležité porovnat výsledky získané metodami časového vzorkování s výsledky získanými s kontinuálním měřením. Kontinuální měření na obrázku 4.9 ukazuje, že se chování dělo 55 % času pozorovaného období. Když bylo to stejné chování ve stejném časovém období měřeno záznamem celého intervalu, získané výsledky značně podhodnotily výskyt chovní (30 % oproti 55 %), naopak výsledky záznamu části intervalu výskyt chování nadhodnotily (70 % oproti 55 %) a okamžikové vzorkování poskytlo poměrně solidní odhad skutečného výskytu chování (50 % oproti 55 %). Fakt, že okamžikové vzorkování dalo výsledky nejbližší skutečnému výskytu chování, neznamená, že je vždy nejpřesnější metodou. Jiné rozložení chování (tj. časové rozmístění) by v námi sledovaném období (obrázek 4.9), i při stejné frekvenci a stejné celkové době trvání, podalo velmi rozdílné výstupy od ostatních tří vzorkovacích metod. Rozdíly ve výsledcích různých metod měření se popisují z hlediska relativní přesnosti nebo chybnosti každé metody. Ovšem v našem případě není přesnost problém. Jestli černé bloky na obrázku 4.9 udávají skutečnou hodnotu chování, pak každá z užitých metod časového vzorkování byla provedená s maximální přesností a uvedená data jsou tím, co mělo být získáno užitím našich metod. Příkladem nepřesného užití jedné z metod by bylo, kdybychom uvedli, že se sledované chování vyskytlo v intervalu 2 při užití záznamu celého intervalu. To proto, že zmíněný výskyt chování nesplňuje pravidla pro záznam celého intervalu. Obrázek 4.9: porovnání měření stejného chování získaného různými vzorkovacími metodami a kontinuálním měření. (- aktuální výskyt chování měřený kontinuálním záznamem; + chování přítomné v intervalu, - chování chybějící v intervalu; WI – záznam celého intervalu; PI záznam části intervalu, MTS okamžikový záznam) Ovšem když se chování objeví v 55 % pozorovaného období, jak můžeme nazývat zavádějící měření 30 % nebo 70 %, když ne chybnost? V tomto případě pokládejme zavádějící data za artefakty měřících procedur, kterými byly získány. Artefakt je něco, čemu dává vzniknout způsob, kterým se zkoumalo. Výsledek měření 30 % získaný záznamem celého intervalu a výsledky 70 % získaných záznamem části intervalu jsou artefakty způsobu, jakým bylo měření prováděno. To že data vzešlá ze záznamu celého intervalu a záznamu části intervalu trvale podhodnocují či nadhodnocují skutečný výskyt chování je známým příkladem artefaktů. Že intervalové měření a okamžikové vzorkování dá v datech vzniknout rozlišným artefaktům, je jasné. Rozmanitost artefaktů musíme mít na paměti, když interpretujeme výsledky získané užitými metodami sběru dat. V kapitole 5 rozebíráme některé ze známých příčin artefaktů, stejně jako způsob, jak se jim vyhnout. Měření chování pomocí stálých produktů Chování můžeme měřit v reálném čase pozorováním lidských aktivit a jejich záznamem, když se objeví. Například učitel může počítat, kolikrát se během třídní diskuze žák přihlásí. Některá chování lze v reálném čase měřit tím, že zaznamenáme jejich vliv na okolí. Například trenér na počitadle zvýší počet pokaždé, když pálkař trefí míček do vymezeného prostoru. Některá chování můžeme měřit až poté, co k nim došlo. Chování, které má stálý vliv na okolí, lze měřit poté, co nastalo, když zanechá dopad či produkt, jež vydrží až do měření. Například let basebolového míčku nenaruší pálkař a míče se nechají dopadnout na zem. Pak může trenér posbírat data o počtu správně odpálených míčů a pálkařovu pokroku, tím že spočítá míčky ležící ve vymezeném prostoru. Měření chování pomocí jeho dopadů na prostředí je známé jako měření pomocí trvalých produktů. Měření stálých produktů je ex post facto metodou sběru dat, protože k němu dochází až poté, co se chování odehrálo. Stálý produkt je změna v prostředí učiněná chováním, která trvá dostatečně dlouho, abychom ji mohli změřit. Přestože se často popisuje chybně jako metoda pro měření chování, měření pomocí trvalých produktů není žádnou měřící metodou nebo procedurou. Měření trvalých produktů odkazuje k času měření (tj. po té, co se chování objevilo) a médiu (tj. efekt chování, ne chování jako takové), se kterým měřitel (tj. pozorovatel) přichází do styku. Všechny popsané metody měření chování – záznam události, časování a časové vzorkování – mohou být použita k měření stálých produktů. Stálé produkty mohou být přirozenými nebo umělými výsledky chování. Stálé produkty jsou přirozenými a důležitými výstupy řady sociálně významného chování ve vzdělávacím, pracovním, domácím a komunitním prostředí. Příklady ze vzdělávacího prostředí zahrnují slohové práce (Dorow a Boyle, 1998), výpočty matematických úloh (Skinner, Fletcher, Wildon a Belfore, 1996), písemné hláskování slov (McGuffin, Martz a Heron, 1997) vyplněné pracovní listy (Alber, Nelson a Brennan, 2002), řešení testů (např. Gardner, Heward a Grossi, 1994). Chování jako stírání podlahy, mytí nádobí (Grossi a Heward, 1998), inkontinence (Adkins a Matthews, 1997), kreslení grafitti na toaletě (Mueller, Moore, Doggett a Tingstrom, 2000), recyklování (Brothers, Krantz a McClannah, 1994) a sbírání odpadků (Powers, Osborne a Anderson, 1973mohou být také měřeny pomocí přirozených a významných změn v prostředí. Mnoho sociálně významného chování nemá přímý dopad na fyzické prostředí. Ústní čtení, správné sezení nebo luskání nezanechávají žádné přirozené produkty v běžném prostředí. Nicméně ex post facto měření takového chování může být provedeno přes vymyšlené, umělé, trvalé produkty. Například nahrávání nahlas čtoucích studentů (Eckert, Ardoin, Daly a Martens, 2002), videonahrávky dívky sedící ve třídě (Schwarz a Hawkins, 1970), videonahrávky luskajícího chlapce (Ahearn, Clark, Gardenier, Chung a Dube, 2003). Takto vědci získali umělé trvalé produkty pro měření těchto chování. Umělé trvalé produkty jsou občas užitečné k měření takových chování, které vytvářejí pouze dočasné přirozené produkty. Například Goetz a Baer (1973) měřili variace dětských staveb z kostek na základě jejich fotografií a Twohig a Woods (2001) měřili délku nehtů z fotografií rukou zkoumaných osob. Výhody měření trvalým produktem Měření trvalým produktem nabízí mnoho výhod pro praktiky i výzkumníky. Praktici mají volné ruce pro jiné úkoly Nemuset pozorovat a zaznamenávat chování, když se objeví, umožňuje praktikům během pozorovaného období dělat jiné věci. Například když učitel pořizuje audionahrávky otázek, komentářů a rozhovorů žáků během třídní diskuze, může se lépe soustředit na to, co studenti říkají, poskytovat individuální pomoc a tak dále. Umožňuje měřit chování, které se objevuje v nevyhovujícím a nedostupném čase a místě. Mnoho sociálně významného chování nastává v čase a místě, které jsou pro praktiky i výzkumníky nevyhovující a nedostupné. Měření trvalých produktů se doporučuje, v takových případech, kdy se zkoumané chování děje nepravidelně, v rozdílných prostředích nebo trvá delší dobu. Například učitel hry na kytaru může nechat studenty pořídit audionahrávky jejich domácích cvičení. Měření může být přesnější, kompletnější a soustavnější Přestože bezprostřední měření chování poskytuje okamžitý přístup k datům, neposkytuje nutně nejpřesnější, nejkompletnější a nejreprezentativnější údaje. Pozorovatel měřící chování na základě trvalých produktů si může odpočinout, přehodnotit dotazník, nebo si opět poslechnout či prohlédnout nahrávku. Videonahrávku lze zpomalit, zastavit, přehrát část záznamu – doslovně „pozastavit“ chování, takže může být v případě potřeby prozkoumáno a přeměřeno znova. Pozorovatel může najít další nuance a aspekty chování, nebo další chování, které přehlédnul, nebo mu uniklo během samotného pozorování. Měření pomocí trvalého produktu dovoluje sběr data od více participantů. Pozorovatel se může dívat na video jednou a měřit chování jednoho participanta, přehrát pásku a měřit chování participanta druhého. Video a audozáznam chování poskytuje data o všech instancí klíčového chování (Miltenberger, Rapp a Long 1999; Tapp a Walden, 2000). Když máme tento trvalý záznam všech instancí chování, můžeme je později vyhodnocovat užíváním zabudovaných digitálních hodin (např. na videorekordéru). Při sledování nahrávky vynulujeme tyto hodiny, když sezení začne, lze tak jednoduše změřit přesný čas, kdy zkoumané chování nastalo. Dále, speciální softwarové programy zjednodušují sběr dat a jejich analýzu založenou na přesném časování. PROCORDER je software dovolující sběr a analýzu videonahrávek chování. Miltenberger a kolektiv říkají: „Se záznamem přesného času začátku a konce klíčového chování v pozorované relaci jsme schopni vypočítat frekvenci (nebo míru) nebo délku trvání chování“ (s. 119).[12] Dovoluje sdílení dat mezi pozorovateli a léčebnou integritu Video a audionahrávky společně s nasbíranými daty umožňují sdílení dat mezi pozorovateli (viz kapitola 5) a zajišťuje integritu léčby (viz kapitola 10). Trvalé produkty chování umožňují opakovatelná měření chování a eliminovat potřebu vyššího počtu pozorovatelů ve výzkumu a léčbě. Dovoluje měřit komplexní chování a několikanásobných tříd odpovědí Trvalé produkty, především videozáznamy, poskytují příležitost měřit komplexní chování a mnohanásobných tříd odpovědí v rušném sociálním prostředí. Schwarz a Hawkins (1970) provedli měření postojů, hlasitosti mluvy a dotýkání se obličeje u žáka na základě videonahrávek pořízených během dvou vyučovacích hodin. Tři chování byla určena jako výsledek operacionalizace „nízkého sebevědomí“. Vědci mohli opakovaně sledovat nahrávky a na jejich základě hodnotit různá chování. V této studii dívka v rámci vlastní intervence také sledovala a hodnotila své chování. Obrázek 4.10 ukazuje příklad záznamového archu od Silvestriho (2004), který užil k měření tří typů hodnocení od učitelů – obecně pozitivní, specificky pozitivní, a negativní - z audionahrávek vyučovacích hodin. Pohyby, více hlasů a všeobecný ruch typický pro školní prostředí by mohli zkomplikovat, pokud ne znemožnit, aby pozorování v reálném čase poskytlo dostatečně přesný záznam takových chování. Každý participant – učitel nosil malý bezdrátový mikrofon, který převáděl signál na přijímači, který byl připojen k rekordéru. Obrázek 4.10: záznamový formulář pro záznam počtu a časového výskytu tří typů hodnocení od učitelů z videonahrávky. Kdy je vhodné měření trvalým produktem Výhody měření pomocí trvalého produktu jsou zřejmé. Může se zdát, že se toto měření preferuje před měřením v reálném čase. Odpověď na následující 4 otázky pomůže praktikům a vědcům rozhodnout, zda je měření trvalým produktem vhodné pro jejich účel: Je třeba měření v reálním čase? Může být chování měřeno trvalým produktem? Neovlivní získávání umělého trvalého produktu nadměrně chování? Kolik to bude stát? Je třeba měření v reálním čase? Rozhodování na základě dat o léčebných procedurách a experimentálních podmínkách je typickým rysem aplikované analýzy chování a jedna z jejich největších kladů. Rozhodování se na základě dat vyžaduje víc než jen přímé a časté měření chování, vyžaduje trvalý a včasný přístup k datům, která tato měření poskytují. Okamžité měření chování poskytuje nejvčasnější přístup k datům. Přestože měření v reálném čase pomocí trvalých produktů lze v jistých situacích provést (např. počítat balonky, které pálkař odpálí do vymezeného prostoru), měření pomocí trvalých produktů nastane až poté, co skončí výuková a experimentální období. Měření založená na nahrávkách nemůže být provedeno, dokud nebudou tyto nahrávky prozkoumány. Pokud musí být rozhodnutí o další léčbě rozhodnuto až před dalším sezením, nepředstavuje toto zdržení výraznější problém (pokud lze audionahrávku včas vyhodnotit). Avšak když se o pokračování léčby musí rozhodovat okamžitě, je nutné měřit v reálném čase. Uvažujme analytika chování, který se snaží redukovat míru sebepoškozujícího chování tím, že odměňuje klienta podle doby, kdy k sebepoškozování nedošlo. Taková léčba vyžaduje reálné měření času mezi sebepoškozením. Může být chování měřeno trvalým produktem? Ne každé chování je vhodné pro měření trvalým produktem. Některé chování zanechává změny v prostředí, které nejsou vhodné pro účely měření. Například sebepoškozování má často dlouhotrvající následky (otlaky, šrámy a poškozenou a krvácející kůži), které lze měřit po výskytu chování. Ovšem přesné měření sebepoškozování nelze provádět pravidelnou kontrolou klientova těla. Výskyt zbarvené kůže, jizev a dalších známek může indikovat, že osoba byla zraněna, ovšem spousta dalších otázek zůstane nezodpovězena. Kolikrát k sebepoškození došlo? Došlo k sebepoškozování, které nezanechalo známky na kůži? Bylo každé poškození tkáně výsledkem automutilace? Toto jsou velmi důležité prvky pro hodnocení výsledků každé léčby. Takové otázky nemohou být s jistotou zodpovězeny, protože tyto trvalé produkty nejsou dostatečně přesným nástroje pro měření automutilace. Chování vhodné pro měření pomocí trvalého produktu musí splňovat dvě pravidla. Pravidlo 1: každý výskyt klíčového chování musí vytvořit stejný trvalý produkty. Trvalé produkty musí být výsledkem každé odpovědi měřené třídy (skupiny). Všechny topografické varianty klíčového chování a všechny odpovědi rozdílných magnitud, které splňují podmínky klíčového chování, musí produkovat stejný trvalý produkt. Měření produktivity práce zaměstnanců počtem správně zkompletovaných výrobků v bedně jejich hotových výrobků splňuje toto pravidlo. Výskyt klíčového chování je v tomto případě definován funkčně jako počet správně zkompletovaných produktů. Měření sebepoškozování známkami na kůži nesplňuje první pravidlo, protože některé projevy sebepoškozování nezanechávají rozeznatelné stopy. Pravidlo 2: trvalé produkty mohou být pouze výsledkem klíčového chování. Toto pravidlo vyžaduje, aby trvalé produkty nemohly vzniknout z a) žádného jiného chování participanta než klíčového chování; b) chování jiné osoby než participanta. Užití počtu správně zkompletovaných předmětů v zaměstnancově krabici na hotové kusy k měření jeho produktivity, splňuje pravidlo číslo dva, jestli si pozorovatel může být jist, že a) zaměstnanec do krabice nevložil žádný kus, který sám nezkompletoval a B) žádný z hotových kusů nebyl do krabice dán nikým jiným než zaměstnancem. Užívání známek na kůži jako trvalého produktu pro měření sebepoškozování nesplňuje také pravidlo dva. Známky na kůži mohou být způsobena jiným chováním osoby (např. pád při běhu) nebo chováním další osoby (např. udeření jinou osobou). Neovlivní získávání umělého trvalého produktu nadměrně chování? Praktici i vědci by měli vždy pamatovat na reaktivitu – efekt měřící procedury na měřené chování. K reaktivitě nejčastěj dochází, když je pozorování a pozorovací procedury rušivé. Rušivé chování mění prostředí, které může zase změnit chování během měření. Přítomnost nahrávacího zařízení může způsobit, že se osoba bude chovat jinak. Takto se nazývají nepřirozené/umělé trvalé produkty. Například užití audiopásky k záznamu konverzace může ovlivnit účastníka, aby mluvil více či méně. Měli bychom si uvědomit, že reaktivita způsobena přítomností lidského pozorovatele je běžným fenoménem, jehož vlviv je většinou dočasný (např. Haynes a Horn, 1982; Kazdin, 1982, 2001). Ale i tak je vhodná, aby všechna zařízení měla co nejmenší vliv na sledované chování. Kolik to bude stát? Poslední otázka, která rozhoduje o vhodnosti měření pomocí trvalého produktu je dostupnost, cena a vynaložené úsilí. Je nahrávací zařízení dostupné? Jestli ne, kolik bude stát jeho pořízení či nájem? Jak bude obtížné naučit se s ním pracovat? Kolik času zabere jeho úvodní nastavení, uskladnění? Ovlivní zařízení průběh studie nebo klíčové chování? Počítačové měření chování Počítačový hardware a software se stává čím dál tím více sofistikovaný a užívaný pro měření a analýzu dat chování, především u vědců. Vývojáři vytvořili programy na sběr a analýzu dat, který lze spustit na laptopech (Kahng a Iwata, 2000; Repp a Karsch, 1994), ručních počítačích (Saudargas a Bunn, 1989) nebo osobních digitálních asistentech - PDA (Emerson, Reever a Felce, 2000). Některé systémy užívají čtečky čárových kódů pro sběr dat (např. McEntee a Saunders, 1997; Saunders a Saunders, 1994; Tapp a Wehby, 2000). Kahng a Iwata (2000) tvrdí: Tyto systémy mají potenciál usnadnit úkol pozorování tím, že zlepší spolehlivost a přesnost nahrávání avšak tradiční avšak těžkopádné metodě – tužka, papír. Taktéž vylepšují efektivitu počítání dat a jejich grafické znázornění. Pokrok v mikročipové technologii vylepšil schopnost těchto systémů měřit a analyzovat dat a udělal software jednodušší k naučení i použití. Mnoho z těchto poloautomatických systémů může nahrávat počet událostí, včetně jednotlivých výskytů, počet odpovědí za jednotku času, dobu trvání, latenci, dobu mezi odpověďmi (IRT), pevné a proměnné intervaly pro časové vzorkování. Tyto systémy mohou zobrazit data v podobě míry, procentech a v podmíněných pravděpodobnostech. Další výhoda pozorování s pomocí počítače je ta, že lze seřadit a analyzovat data o jí mírách, časových řadách, podmíněných pravděpodobnostech, sekvenčních závislostech, vnitřních vztazích a kombinaci událostí. Protože tyto systémy dovolují současně nahrávat více chování v násobných dimenzích, výstupy mohou být prozkoumány a zanalyzovány z různých pohledů, které by byly složité a časově náročné metodou tužka-papír. Mimo nahrávání chování a počítání dat tyto systémy poskytují sdílení dat mezi pozorovateli a měření z audio a video souborů. Tyto poloautomatické počítačově řízené systémy mají potenciál vylepšit dělení dat mezi pozorovateli, spolehlivost měření a výkonnost počítání dat (Kahng a Iwata, 1998).[13] Díky větší efektivitě a uživatelské přívětivosti budou měření za pomocí počítačů v budoucnosti více oblíbené i mezi výzkumníky a praktiky, kteří v současné době užívají mechanická počitadla, časovače, a papír a tužku pro záznam pozorování. Shrnutí: Definice a funkce měření v aplikované analýze chování Měření je proces přiřazování kvantitativních symbolů k pozorovaným vlastnostem událostí za použití standardních pravidla. Měření je to, jak vědci operacionalizují empírii. Bez měření všechny tři stupně vědecké znalosti – popis, predikce a kontrola – by byly odsunuty k pouhým odhadům a subjektivním názorům. Analytikové měří chování, aby získali odpovědi na otázky o existenci a povaze funkčních vztahů mezi sociálně významným chováním a proměnnými prostředí. Praktici měří chování před a po léčbě, aby vyhodnotili celkový efekt intervence (sumativní hodnocení) a měření frekvence chování během léčby (formativní hodnocení), aby usměrnili rozhodnutí ohledně pokračování, modifikace a ukončení léčby. Bez měření počtu klíčového chování v intervenci by mohli praktici a) pokračovat v neúčinné léčbě, přestože nedochází k žádné reálné změně chování; b) přerušit účinnou léčbu, protože subjektivně nevidí žádné zlepšení. Měření také praktikům pomáhá optimalizovat jejich účinnost; potvrdit legitimitu praktik vedených jako „založené na evidenci“; identifikovat léčbu založenou na pseudovědě, šarlatánství, módě a ideologii; být zodpovědný vůči klientům, zákazníkům a zaměstnavatelům a společnosti; a dodržovat etické standardy. Měřitelné dimenze chování Protože chování se vyskytuje v čase, má tři dimenze kvantity: opakovatelnost (tj. počet), časový rozsah (tj. dobu trvání), a umístění v čase (tj. kdy dochází k chování). Tyto vlastnosti, samy nebo v kombinaci, poskytují základní a odvozená měření, která se užívají v aplikované analýze chování. (viz obrázek 4.5 – detailní shrnutí). Počet je celkové množství odpovědí, ke kterým došlo v průběhu pozorovaného období. Míra nebo frekvence je poměr počtu a pozorovaného období; často se vyjadřuje jako počet za standardní jednotku času. Změna rychlosti je měřením změny (zrychlení nebo zpomalení) v míře odpovědi za jednotku času. Doba trvání je množství času, ve kterém se chování objevovalo. Latence v odpovědi je měřením času uběhlého mezi začátkem stimulu a začátkem následné odpovědi. Doba mezi odpověďmi (IRT) je množství času uběhlého mezi dvěma po sobě jdoucími instancemi určité třídy odpovědí. Procento je poměr sestavený kombinací kvantit stejné dimenze a vyjadřuje poměrovou kvantitu události ve tvaru: kolikrát událost nastala ze sta možných příležitostí. Počet platných pokusů (Trials-to-criterion: počet pokusů potřebných k splnění kritérií) je měření počtu příležitostí k odpovědi nutných k dosažení předem stanovené úrovně výkonu. Přestože forma (tj. topografie) a síla odpovědi (tj. magnituda) nejsou základní dimenze kvantity chování, jsou důležitými kvantitativními parametry pro definovaní a potvrzení výskytu mnoha tříd odpovědí. Topografie znamená fyzický tvar nebo formu chování. Síla odpovědi znamení sílu nebo intenzitu, s kterou k chování došlo. Procedury pro měření chování Záznam události zahrnuje širokou paletu procedur pro zjištění a záznam kolikrát se klíčové chování objevilo. Užívá se mnoho procedur a přístrojů na měření času k měření doby trvání, latence, času mezi odpověďmi. Časové vzorkování zahrnuje množství metod pro pozorování a záznam měření chování v průběhu intervalu nebo v konkrétních bodech v čase. Pozorovatel užívající záznam celého intervalu dělí pozorované období na sérii stejných časových intervalů. Na konci každého intervalu zaznamenává, zda se klíčové chování objevovalo po dobu celého intervalu. Pozorovatel užívající záznam části intervalu dělí pozorované období na sérii stejných časových intervalů. Na konci každého intervalu zaznamenává, zda se chování objevilo v jakémkoli bodě sledovaného intervalu. Pozorovatel užívající okamžikový záznam dělí pozorované období na sérii časových intervalů. Na konci každého intervalu zaznamenává, zda-li se zkoumané chování právě děje (přesně na konci intervalu). Plánovaná kontrola činnosti (PLACHECK) je variace okamžikového vzorkování, v které pozorovatel zaznamenává, zda každá osoba ve skupině provádí klíčové chování. U časového vzorkování se často vyskytují artefakty měření. Měření chování trvalými produkty Měření chování trvalými produkty je metoda založení na měření účinků chování na okolí. Mnoho chování lze měřit pomocí umělých trvalých produktů. Měření trvalými produkty nabízí početné výhody: praktici mají volné ruce k jiným činnostem; je možné měřit chování, ke kterému dojde v nevhodném a nedosažitelném čase a místě; měření může být přesnější, kompletnější a kontinuálnější; dovoluje sdílení dat mezi pozorovateli a integritu léčebných dat; umožňuje měření složitých chování a více odpovědních tříd. Jestliže je třeba okamžitého rozhodnutí o léčbě během sezení, měření trvalým produktem není doporučováno. Chování vhodné pro měření trvalým produktem musí splňovat dvě pravidla. Pravidlo 1: každý výskyt klíčového chování musí přinášet stejný trvalý produkt. Pravidlo 2: trvalý produkt může být vytvořen pouze klíčovým chováním. Měření pomocí počítače Počítačový hardware a software pro měření chování a analýzu dat se stává stále více sofistikovaný a snadnější k užívání. Vývojáři vytváří programy na sběr a analýzu dat, které lze použít na přenosných počítačích, ručních počítačích, PDA a stolních počítačích. Některé systémy dovolují současný záznam násobného chování ve více dimenzích. Výstupy mohou být zkoumány a analyzovány z rozdílných pohledů, které by byly složité a časově náročné metodou tužka-papír. ________________________________ [1] Měření je nutné ale ne dostačující pro získání vědeckého pochopení (viz Kapitola 7) [2] např. náhodné klinické pokusy - randomized clinical trials, studie jednoho případu [3] např. počet studií uveřejněných v přezkoumaných časopisech, minimální počet participantů [4] Přestože existují některé technické nuance mezi mírou a frekvencí, oba termíny jsou často zaměnitelné v literatuře věnující se analýze chování. Přesnou definici, rozdíly, význam těchto termínů a příklady rozdílných metod jejich počítání, viz Johnston a Pennypacker /1993b, čtení 4: Describing behavior with ratio sof count and time). [5]Změna rychlosti (v originále celeration), kořen slova zrychlení a zpomalení (v originále aceleration, decelaration), je obecný pojen bez specifického odkazu na zrychlení či zpomalení míry odpovědí. Praktici i vědci by měli užívat termínu zrychlení a zpomalení, když popisují vzrůstající a snižující se míry odpovědí. [6] Metody pro počítání křivek trendů popisuje kapitola 6. [7] Latence se nejčastěji užívá k popsání času mezi začátkem předchozícho stimulu a začátkem odpovědi. Ovšem termín lze užít pro popsání měření časového umístění odpovědi s respektem na jakýkoli typ předchozí události. Více Johnston a Pennypacker (1993b). [8]Protože procenta jsou podíly založené na stejných dimenzích kvantity, dimenze kvantita se v procentech ruší. Například procenta přesnosti, které bylo vytvořeno dělením počtem správných odpovědí počtem možných odpovědí, odstranilo skutečný počet. Avšak míry vytvořené rozdílnými dimenzemi kvantity zachovávají dimenze kvantity každé komponenty. Jmenujme například podíl získaný počtem za jednotku času. Více viz Johnston a Pennypacker (1993a). [9]Když osoba udává přebytek nad 100 % (např. „náš podílový fond vzrost na 120 % během posledního trhu“), pravděpodobně udává zkreslená procenta vzhledem k předešlé základní jednotce, neudává její poměr. V tomto příkladě vzrůst podílového fondu o 20 %, dělá jeho hodnotu 1,2 x větší než byla před začátkem trhu. [10]Vědci někdy manipulují a kontrolují topografii a sílu odpovědí jako nezávislé proměnné, aby zhodnotili jejich možný účinek. Piazza, Roane, Kenney, Boney a Abt (2002) analyzovali účinky rozdílných topografií odpovědi na frekvenci pik (tj. konzumace nestravitelných objektů, které mohou poškodit zdraví) u třech žen. Objekty piky se nacházely na rozmanitých místech, které pro jejich získání vyžadovaly, aby subjekty odpovídaly mnoha způsoby (např. dosáhnout, ohnout se, zvednout z podlahy, otevřít popelnici). Piky se snižovaly, když se vyžadovala propracovanější topografie odpovědi k jejich získání. Van Houten (1993) pracoval s chlapcem s problémem s častým fackováním. Zjistil, že když chlapec nosil na zápěstí závaží o hmotnosti 1,5 libry, fackování náhle kleslo na nulu. Studie jako tato ukazují, že problémové chování může být redukováno, pokud chování vyžaduje namáhavější topografii a sílu odpovědi. [11] Literatura užívá rozličné termíny k popisu měřících procedur, které se týkají pozorování a záznamu chování uvnitř nebo na konci plánovaných intervalů. Někteří autoři užívají termín „time sampling“ (časové vzorkování), aby popsali jen okamžikový záznam. My do této kategorie zahrnujeme záznam celého intervalu (kontinuální záznam) a záznam částečného intervalu, protože je často veden jako nespojitá metoda měření, která poskytuje reprezentativní vzorek lidského chování během pozorovaní periody intervalu. [12]Edwards a Christophersen (1993) popsali videorekordér, který automaticky nahrává na jednu 2hodinovou pásku vzorky chování v periodě od 2 do 400 hodin. Přístroj je naprogramován pro záznam 12 hodinové periody by nahrál 1/10 z každé vteřiny. Takový systém může být užitečný k záznamu velmi málo frekventovaného chování a pro chování, které se objevuje po dlouhé období (např. chování dítěte ve spánku) [13]Popis charakteristik a možností možných počítačových systémů na měření chování můžete nalézt ve zdorjích: Emerson, Reever a Felce (2000); Farrel (1991); Kahng a Iwata (1998, 2000); Repp, Harman, Felce, Vanacker a Karsh (1989), Saunders, Saunders a Saunders (1994); Tapp a Walden (2000); aTapp a Wehby (2000).