č á s t 4 Posilování T ři kapitoly Části 4 jsou věnovány posilování – nejdůležitějšímu principu behaviorální analýzy, široce využívanému v  praxi. Posilování, zdánlivě jednoduchá závislost chování na jeho následku, představuje základ, na němž stojí selekce operantů. V kapitole 11, nesoucí název Pozitivní posilování, si řekneme, čím je pozitivní posilování definováno, a stručně si popíšeme, jak modulují jeho účinky antecedentní podmínky. Probereme faktory, které ovlivňují účinnost posilování, a seznámíme se s tím, jak stimuly nabývají posilovací účinnosti. Uvedeme si druhy stimulů, které často slouží jako posílení, představíme metody identifikace potenciálních posílení a mapování jejich účinků a nastíníme si, jak se provádějí kontrolní zkoušky, při nichž pokusně ověřujeme, zda je za zvýšení frekvence odpovědi skutečně zodpovědné pozitivní posilování. V závěru kapitoly pak najdete devět pokynů, jak postupovat, aby bylo posilování efektivní. V kapitole 12 nám Brian Iwata a Richard Smith představují princip chování, jenž je velmi často chybně interpretován, negativní posilování - takové posilování, u něhož je podmíněně závislým následkem chování skončení, snížení nebo oddálení stimulace. Autoři zde tento pojem definují a vymezují vůči pozitivnímu posilování a trestání. Dozvíme se, jaký je rozdíl mezi únikovým a vyhýbavým chováním coby následkem negativního posilování, jaké stimuly plnívají úlohu negativního posílení a jak lze pomocí negativního posilování zpevňovat žádoucí chování. Kapitola končí zamyšlením nad etickými problémy, které používání negativního posilování provázejí. Ke  Skinnerovým nejzásadnějším objevům patří zjištění, že k  tomu, aby mělo posilování žádoucí účinek, nemusí být posílena každá odpověď. Ve skutečnosti vede mnohdy občasné posilování – kdy po  výskytu cílové odpovědi pokaždé nenásleduje posílení - k vyšší a stabilnější frekvenci odpovědí než posilování nepřetržité. Kapitola 13 podává přehled základních režimů posilování, založených na určitém počtu odpovědí a na časových úsecích určité délky, spolu s křivkami výkonnosti, které jsou pro každý z nich charakteristické. Praktik, který rozumí fungování posilovacích režimů, dokáže sestavit program posilování tak, aby účinně a efektivně napomáhal osvojování nových dovedností a zlepšoval dosavadní klientův výkon a aby se dosažené změny chování udržely i po ukončení intervence. Pouze pro studijníúčely. N ešířita nekopírovat. 2 5 6     č á s t 4     Posilování K A P I T O L A 1 1 Pozitivní posilování Klíčové pojmy automatické posilování (automatic reiforcement) generalizované podmíněné posílení (generalized conditioned reinforcer) hypotéza omezeného operantu (responsedeprivation hypothesis) mapování posilovací účinnosti stimulů (stimulus preference assessment) mapování preferovaných stimulů (reinforcer assessment) nepodmíněné posílení (unconditioned reinforcer) podmíněné posílení (conditioned reinforcer) pozitivní posílení (positive reinforcement) pozitivní posilování (positive reinforcer) Premackův princip (Premack principle) Výbor pro udělování certifikací behaviorálního analytika® BCBA® a BCABA® Seznam úloh z behaviorální analýzy© , třetí vydání Obsahový okruh 3: Principy, procesy a pojmy 3-3 Definujte pozitivní (a negativní) posilování a uveďte příklady. 3-4 Definujte podmíněné a nepodmíněné posilování a uveďte příklady. 3-14 Vysvětlete paradigma operantního podmiňování a uveďte příklady. 3-19 Definujte tvarované chování a chování určované respektováním zákonitosti a rozlište je za použití příkladů. Obsahový okruh 9: Metody modifikace chování 9-2 Použijte pozitivní (a negativní) posilování: (a) Identifikujte a použijte posílení. (b) Použijte vhodné parametry a režimy posilování. (c) Použijte metody omezeného operantu (např. Premackův princip). © 2006 The Behavior Analyst Certification Board, Inc.,® (BACB®). Všechna práva vyhrazena. Aktuální verzi tohoto dokumentu lze najít na www.bacb.com. Žádosti o tisk, kopírování či distribuci tohoto dokumentu a otázky, které se ho týkají, je třeba adresovat přímo BACB. Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 5 7 Když se ohlédnu zpět, připadá mi, že to nejdůležitější, co jsem si odnesl z vysoké školy, jsem se naučil od jiného studenta, Burrhuse Frederika Skinnera (říkal jsem mu Burrhus, ostatní mu říkali Fred). Měl box, uvnitř něhož byl ještě jeden menší, a do něj umísťoval hladového laboratorního potkana. Když zvíře při prozkoumávání boxu zmáčklo tlačítko, umístěné na jedné stěně, spadla do misky pod tlačítkem krmná granule. Potkan se za několik minut, případně i vteřin, naučil, jak stisknutím tlačítka získat potravu. Nepřestával s mačkáním, někdy rychlým, ani když se granule uvolňovaly jenom občas; a když byl přísun krmiva úplně zastaven, zvíře ještě chvíli v mačkání pokračovalo. (Fred Keller, 1982, s. 7) Přestože se ještě dnes někteří domnívají, že výsledky laboratorního výzkumu zaměřeného na učení zvířat se nedají vztáhnout na chování člověka, prokazují výzkumníci od poloviny šedesátých let minulého století význam pozitivního posilování při vzdělávání lidí a modifikaci jejich chování. „Můžeme klidně říct, že bez Skinnerových podrobných laboratorních analýz posilování (Skinner, 1938) by dnes obor aplikované behaviorální analýzy neexistoval, přinejmenším ne v té podobě, jak ho známe“ (Vollmer a Hackenberg, 2001, s. 241). Pozitivní posilování je nejdůležitějším a nejpoužívanějším principem behaviorální analýzy. Patrně není náhoda, že hlavní článek prvního čísla časopisu Journal of Applied Behavior Analysis pojednával o  několika experimentech, dokládajících účinky pozitivního posilování na chování žáků (Hall, Lund a Jackson, 1968). Do této klasické studie bylo zařazeno šest žáků základní školy, kteří při vyučování často vyrušovali nebo zdržovali. Závisle proměnná, učení, byla definována u  každého z  dětí individuálně podle toho, jaký předmět se učilo, ale její obecná definice spočívala v  tom, že žák sedí na  místě a  je zaměřený na  příslušný objekt nebo osobu (např. se dívá na učební materiály nebo vyučujícího) a zapojuje se do dění ve třídě (píše si poznámky, odpovídá na  otázky učitele apod.). Nezávisle proměnnou byla pozornost učitele, k níž dával pokyn pozorovatel, držící v ruce čtvereček barevného papíru. Zvednutí papírku, provedené natolik nenápadně, aby si ho žák nevšiml, bylo signálem pro učitele, aby dítěti věnoval pozornost: v té chvíli přišel k jeho lavici, promluvil na něj, poklepal ho po rameni a podobně. Účinky učitelovy pozornosti podmíněně závislé na  chování dítěte byly ve  všech šesti případech nepřehlédnutelné. Obr. 11.1 ukazuje výsledky získané u  Robbieho, třeťáka, který byl do  experimentu zařazen kvůli tomu, že to byl „žák obzvlášť narušující výuku, který se velmi málo učil“ (s. 3). Za výchozích podmínek se Robbie věnoval učení průměrně v 25 % sledovaných časových úseků. Ve  zbývající době natahoval gumičky, až praskly, pohrával si s  různými předměty v  kapse, bavil se a  smál se se spolužáky a hrál si s prázdnou krabicí od mléka, které předtím dostal. V této fázi experimentu učitelka většinou reagovala právě na Robbieho rušivé chování: často ho napomínala, aby dával pozor, dal pryč krabici od mléka a nechal spolužáky na pokoji. Po  skončení počáteční fáze pokusu ukázal experimentátor učitelce graf, který znázorňoval, jak se Robbie učí. Seznámil ji s výsledky studií, v nichž podmíněně závislá pozornost dospělých zlepšila chování dětí, a probral s ní základy sociálního posilování. Hall a kolegové (1968) popsali postup aplikovaný v průběhu dvou následujících posilovacích fází takto: 100 80 60 40 20 0 Míraučení 5 10 15 20 25 30 35 Sezení výchozí podmínky první fáze posilování1 návrat k výchozím podmínkám druhá fáze posilování2 následné kontroly Robbie Obrázek 11.1 Procento časových úseků, během nichž se žák třetí třídy za výchozích podmínek a v podmínkách posilování věnoval učení. Šipka označuje první kontrolu, při níž už učitelka nedostávala signál od pozorovatele, že má chlapci věnovat pozornost. Převzato z Effects of Teacher Attention on Study Behavior R. V. Halla, D. Lunda a D. Jacksona, 1968, Journal of Applied Behavior Analysis, 1, s. 3. Copyright Society for the Experimental Analysis of Behavior, Inc., 1968. Použito se svolením držitele autorských práv. Pouze pro studijníúčely. N ešířita nekopírovat. 2 5 8     č á s t 4     Posilování Vždycky když se Robbie jednu minutu souvisle učil, dal pozorovatel signál jeho učitelce. Ta přišla k Robbieho lavici a řekla mu „Moc dobře, Robbie“, „Vidím, že se učíš“ nebo něco podobného. Přestala naopak reagovat na jeho nevhodné chování, a to i když tím vyrušoval ostatní. (s. 4) Během první fáze posilování se u Robbieho míra učení zvýšila průměrně na 71 %. Když byly znovu nastoleny výchozí podmínky, snížila se u něj průměrná míra učení na 50 %; avšak poté, co učitelka v druhé fázi posilování znovu reagovala na jeho žádoucí chování, vrátilo se na předchozí úroveň a míra učení se u  Robbieho ustálila mezi 70 a  80 %. Při následných pozorováních, prováděných po  dobu čtrnácti týdnů poté, co učitelka přestala dostávat signály od pozorovatele, se u Robbieho úroveň učení udržovala na 79 %. Učitelka referovala o pozitivních změnách v Robbieho chování, spojených s tím, že se víc učí. Od posledního týdne druhé posilovací fáze měl Robbie stabilnější výkon při hláskování, méně vyrušoval, pokračoval v učení i při pití mléka a také už si pak nehrál s prázdnou krabicí. Intervence, k níž učitelka přistoupila, aby Robbiemu pomohla k větší úspěšnosti ve škole, byla založena na  principu pozitivního posilování. V  této kapitole si řekneme, co to pozitivní posilování je a čím se vyznačuje, a popíšeme si metody, jak identifikovat potenciální posílení a jak hodnotit jejich účinky. Povíme si, jakými experimentálními postupy lze zjišťovat, zda bylo příčinou zvýšeného výskytu cílového chování pozitivní posilování, a jak postupovat, aby bylo pozitivní posilování efektivní. Definice a charakter pozitivního posilování Princip posilování je zdánlivě jednoduchý. „Základní operantně funkční popis posilování zní následovně: Pokud po určitém typu chování (R) následuje posílení (SR ), pak se frekvence tohoto typu chování v budoucnu zvýší“ (Michael, 2004, s. 30).1 Jak ovšem upozorňuje Michael a jiní, je přitom zapotřebí vzít v úvahu tři faktory, které se vztahují k situaci, v níž k posilování dochází. Těmito faktory jsou: (a) prodleva mezi 1 Behaviorální analytikové popisují někdy základní účinek posilování pomocí termínů jako zpevnění chování nebo zvýšení pravděpodobnosti dané odpovědi v budoucnu. I když se takové pojmy v naší knize příležitostně objevují, protože sdílíme Michaelův (1995) názor, že „používání podobných termínů vede k většímu důrazu na intervenující proměnné či implicitnímu poukazování na to, že chování nemá jen pozorovatelné aspekty“ (s. 274), nejčastěji používáme k označení primárního účinku posilování pojem zvýšená frekvence chování v budoucnu. behaviorální odpovědí a posílením,(b) podmínky prostředí působící v  době, kdy je generována odpověď, a (c) intenzita aktuální motivace ve vztahu k posílení. Na tyto faktory, stejně jako na několik dalších pojmů potřebných k plnému pochopení toho, jak posilování „funguje“, se podíváme v první části této kapitoly. Operantní účinek definující pozitivní posilování O pozitivní posilování (positive reinforcement) se jedná tehdy, jestliže bezprostředně po behaviorální odpovědi zapůsobí nějaký stimul, v důsledku čehož se zvýší výskyt podobných odpovědí v budoucnu. Dvojčlennou podmíněnou závislost (two-term contingency) tvořenou chováním a těsně po něm následujícím stimulem, jenž ovlivní budoucí chování uvedeným způsobem, charakterizujícím pozitivní posilování, znázorňuje obr. 11.2. Tato dvojčlenná podmíněná závislost je základním kamenem, na němž stojí selekce veškerého operantního chování (Glenn, Ellis a Greenspoon, 1992). Stimulu působícímu jako následek, který zapříčiní budoucí nárůst frekvence odpovědí, se říká pozitivní posílení (positive reinforcer) nebo jednoduše posílení.2 Takovým posílením byla pozornost učitelky v podobě pochvalných komentářů, která u Robbieho zvýšila míru učení. Studená voda tekoucí do sklenice a spatření pestrobarevného ptáka zase účinkují jako posílení dvou typů chování uvedených na obr. 11.2. Je na místě si připomenout, že posílení neovlivňuje a ani nemůže ovlivňovat odpověď, po níž následuje. Posilování zvyšuje pouze frekvenci podobných odpovědí v budoucnosti. Říkat, že operantní posilování „zpevňuje odpověď, která mu předchází,“ není správné. Odpověď už proběhla a nelze ji změnit. To, co se mění, je budoucí frekvence odpovědí z téže třídy. Je to operant jako třída odpovědí, nikoli jako jednotlivý případ chování, co je podrobeno podmiňování. (Skinner, 1953, s. 87) Skinner (1966) používal při výzkumu posilování jako základní údaj frekvenci odpovědí. Zpevňovat operant znamená zvyšovat jeho frekvenci. Četnost (nebo frekvence) však není jedinou vlastností chování, kterou posilování selektuje, tvaruje a udržuje. Posilování může zpevňovat také dobu trvání, latenci, 2 Pokud následek, který zvýšil frekvenci odpovědí, spočívá v tom, že dosud působící stimul působit přestane nebo je odstraněn, mluvíme o negativním posilování. Základní charakter negativního i pozitivního posilování a podmínky pro jejich působení jsou stejné. Negativnímu posilování se budeme podrobně věnovat v kapitole 12. Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 5 9 intenzitu a/nebo topografii chování. Jestliže například posílení následuje jen po odpovědích, jejichž intenzita spadá do určitého rozmezí, zatímco odpovědi, které svou intenzitou tohoto rozmezí nedosahují, nebo ho přesahují, posilovány nejsou, bude výsledkem vyšší frekvence odpovědí z daného rozmezí. Při posilování odpovědí splňujících různá kritéria se bude zpevňovat podmnožina odpovědí, které těmto kritériím vyhovují (např. hráč golfu se při tréninku učí udeřit do míčku přiměřenou silou a takovým způsobem, aby ho úspěšně dopravil do jamky). Význam okamžité prezentace posílení Je třeba klást zásadní důraz na  to, aby posílení následovalo ihned po odpovědi. Přímý účinek posilování spočívá „v časové souvztažnosti mezi chováním a  jeho následky, které se dostavují v  řádu několika sekund“ (Michael, 2004, s. 161). Výzkum na zvířatech ukazuje, že mezi chováním a posílením může uplynout zhruba půl minuty, aniž by došlo ke  kritickému oslabení kýženého účinku (např. Byrne, LeSage a Poling, 1997; Critchfield a Lattal, 1993; Wilkenfeld, Nickel, Blakely a Poling, 1992). Trvá-li však prodleva jednu sekundu, bude účinek nižší, než kdyby byla nulová. Je tomu tak proto, že jedinec se během této doby projevuje i jiným chováním, než je chování cílové, přičemž posílení zpevní to chování, které je mu časově nejblíž. Jak napsal Sidman (1960): „Pokud posílení nenásleduje hned po odpovědi, která byla jeho podmínkou, pak bude následovat po nějakém jiném chování. Jeho hlavní účinek bude potom záviset na tom, jaké chování (což, dodáváme, je věcí náhody) bude tomuto posílení nejtěsněji předcházet“ (s. 371). Mallot a Trojan Suarez (2004) se k významu okamžitého nástupu posílení vyjadřují následovně: Jestliže má posílení posílit určitou odpověď, musí nastoupit hned po ní. Ale co to znamená hned? Z experimentů na lidech o tom nemáme žádné údaje, nicméně z výzkumu na zvířatech vyplývá, že limitní je minuta nebo dvě (i půl minuty je dlouho). Většina behaviorálních analytiků pracujících s dětmi, které ještě neumějí mluvit, s tím bude souhlasit. Pokud by museli čekat s prezentací každého posílení minutu, přišla by jejich snaha vniveč. U takové prodlevy už je jisté, že k učení – přinejmenším k tomu žádoucímu – ani u lidí nedojde. Jestliže se tedy snažíte posílit nějakou odpověď, nedržte se limitu jedné minuty, ale opačného limitu – nulové prodlevy. Přímý účinek posilování s narůstající prodlevou rychle klesá; stačí i tři nebo čtyři sekundy. Dokonce i při prodlevě trvající jednu sekundu může být posíleno špatné chování. Pokud řeknete malému dítěti, aby se na vás podívalo, a poskytnete mu posílení vteřinu poté, co zareaguje, hrozí nebezpečí, že u něj posílíte pohled jiným směrem. U opožděného posilování tedy představuje problém to, že je posílena špatná odpověď– jiná odpověď, ta k níž došlo těsně před udělením posílení. (s. 6) Rozšířeným omylem je domněnka, že chování mohou posilovat i následky, které se objeví dny, týdny či měsíce po proběhnutí chování. „Změna chování zjevně ovlivňovaného dlouhodobými následky bývá u  člověka výsledkem působení složitých sociálních faktorů a faktorů verbální komunikace a neměla by být považována za případ jednoduchého zpevňování chování posilováním“ (Michael, 2004, s. 36). Představme si například, že dívka, která se učí hrát na klavír, několik měsíců každý den svědomitě cvičí, aby se připravila na celostátní soutěž v sólové klavírní hře, a nakonec dostane za svůj výkon první cenu. Bylo by mylné se domnívat, že vítězství v  soutěži u  ní posílí každodenní cvičení na  klavír. Opožděné následky chování nikdy přímo neposilují. R SR+ Dát hrnek pod kohoutek a zmáčknout tlačítko Do hrnku teče studená voda Otočit hlavu a podívat se doleva Spatřit pestrobarevného ptáka Účinek na budoucí frekvenci podobných odpovědí Obrázek 11.2 Dvojčlenná podmíněná závislost u pozitivního posilování: Po odpovědi (R) následuje vzápětí změna stimulu (SR+ ), která vede ke zvýšené frekvenci podobných odpovědí v budoucnu. Effect on Future Freqency of Similar Responses = Účinek na budoucí frekvenci podobných odpovědí Pouze pro studijníúčely. N ešířita nekopírovat. 2 6 0     č á s t 4     Posilování Mohou ovšem chování do budoucna ovlivňovat, jsou-li spojeny s  poučením o  zákonitosti (instructional control) a  respektováním této zákonitosti. Poučení o zákonitosti (rule) je slovní popis podmíněné závislosti následku na  chování (např. „Když zasejeme tuřín kolem 15. srpna, můžeme ho sklidit, ještě než uhodí mrazy“). Naučit člověka respektovat zákonitost představuje jeden ze způsobů, jak lze dostat jeho chování pod kontrolu následků, které jsou příliš opožděné na to, aby jeho chování ovlivňovaly přímo. Řekla-li učitelka hry na klavír své žačce něco jako: „Jestli budeš ode dneška dennodenně hodinu cvičit, máš šanci soutěž vyhrát“, mohlo toto poučení o  zákonitosti ovlivnit dívčino každodenní snažení. Pokud dívka na  základě učitelčina poučení každý den hrála, bylo její pravidelné cvičení na klavír dáno respektováním zákonitosti (rule-governed).3 Níže uvádíme situace, ve  kterých je chování s  vysokou pravděpodobností výsledkem respektování zákonitosti a nikoli přímého působení posilování (Mallot, 1988; Michael, 2004): • Na chování bezprostředně nenavazuje žádný následek. • Prodleva mezi chováním a následkem trvá déle než půl minuty. • Chování se mění bez posilování. • Frekvence daného chování se výrazně zvýší po jediném posílení. • Na chování nenavazuje žádný následek, ani v případě automatického posilování, ale je respektována zákonitost. Posilování není pojem definovaný kruhem Často se setkáváme s mylným názorem, že posilování je pojem vycházející z definice kruhem a jako takový nijak nepřispívá k  tomu, abychom chování lépe porozuměli. Definice kruhem je druh logického omylu, u něhož se za vysvětlení nějakého jevu chybně považuje předpokládaná příčina tohoto jevu. Tato záměna následku za příčinu se označuje jako kruhová proto, že identifikace příčiny je založena výhradně na pozorovaném jevu. U kruhové definice není předpokládaná příčina nezávislá na svém následku, ale je s ním totožná. Uveďme si příklad definice kruhem, který se dost často objevuje v pedagogice. U žáka, jemuž dělá potíže 3 O  chování určovaném respektováním zákonitosti skvěle pojednávají Baum (1994); Chase a Danforth (1991); Hayes (1989); Hayes, Zettle a Rosenfarb (1989); Mallot a Garcia (1991); Mallot a Trojan Suarez (2004); Reitman a Gross (1996) a Vaughan (1989). naučit se číst, je diagnostikována porucha učení, která pak slouží jako vysvětlení toho, proč má se čtením problémy: „Paulovy problémy se čtením jsou způsobeny jeho poruchou učení.“ Jak víme, že má Paul poruchu učení? Protože se mu nedaří naučit se číst. Proč se Paulovi nedaří naučit se číst? Protože má poruchu učení, která mu v tom brání. A tak stále dokola. Podobně by šlo o definici kruhem, kdybychom řekli, že pozornost učitelky zvýšila u Robbieho míru učení, protože je to posílení. Správné je však říct, že protože se u  Robbieho zvýšila úroveň učení tehdy (a pouze tehdy), následovala-li těsně poté, co se učil, pozornost učitelky, je pozornost učitelky posílením. Přitom nejde jen o uvedení příčiny a následku v opačném pořadí nebo o nějakou slovní ekvilibristiku. U definice kruhem nelze manipulovat s předpokládanou příčinou jako s  nezávisle proměnnou a dozvídat se tak, zda má na chování vliv. Taková experimentální manipulace zde není možná, protože příčina a následek jsou ztotožněny. S Paulovou poruchou učení se nedá manipulovat jako s nezávisle proměnnou, neboť vzhledem k použití definice kruhem není ničím víc než jiným názvem pro závisle proměnnou (následek). Posilování však není pojem definovaný kruhem, poněvadž jeho dvě složky, chování a posílení, od sebe lze oddělit. Díky tomu je možné posílením manipulovat tak,abysezjistilo,zdazvyšujefrekvencitohotypuchování, po němž následuje. Epstein (1982) to popsal takto: Jestliže můžeme dokázat, že se frekvence nějaké odpovědi zvyšuje v důsledku toho (a jedině v důsledku toho), že po ní následuje určitý stimul, nazveme tento stimul posílením a jeho prezentaci posilováním. Všimněte si, že se nejedná o definici kruhem. Posilování je pojem, na nějž se odvoláváme, když pozorujeme jisté vztahy mezi proměnnými v okolním světě… [Avšak] řekneme-li například, že určitý stimul zpevňuje behaviorální odpověď, protože je to posílení, pak jsme pojem posílení definovali kruhem. Ve skutečnosti nazveme tento stimul posílením, protože zpevňuje chování. (s. 4) Epstein (1982) dále vysvětluje, jaký je rozdíl mezi tím, mluvíme-li v teoretické práci o chování o empiricky dokázaném principu, jako je posilování, nebo používáme definici kruhem: V některých svých dílech Skinner uvažuje nad tím, že k určitému chování (například verbálnímu) dochází díky posilování. Vysloví třeba domněnku, že určité chování je dobře osvojeno, protože bylo posilováno. V tomto případě nejde o definici kruhem, pouze o přemýšlení nad daným pojmem či jeho výklad. Je rozumné používat terminologii týkající se posilování tímto Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 6 1 způsobem, pokud jste nashromáždili velké množství údajů… Jestliže Skinner připisuje nějaké každodenní chování minulým posílením, jde o přijatelný odhad, založený na velkém množství dat a na principech chování prokázaných v kontrolovaných podmínkách. (s. 4) Pojem posilování, je-li použit správně, označuje empiricky dokázanou (nebo na základě teoretické analýzy předpokládanou) funkční závislost mezi změnou stimulu - následkem, který se dostavil bezprostředně po odpovědi, a zvýšením frekvence podobných odpovědí v budoucnu. Tab. 11.1 podává přehled pojmů posílení, posilující, posilování a posilovat, jak ho navrhl Catania (1988). V boxu 11.1 uvádíme čtyři chyby, k nimž při popisu posilování často dochází. Posilováním získávají význam antecedentní podmínky Posilování nevede jen ke  zvýšení budoucí frekvence chování, po němž následuje, ale mění též funkci stimulů, které posilovanému chování bezprostředně předcházejí. Díky svému spárování s posílením podmíněně závislým na dané odpovědi získávají tyto antecedentní stimuly schopnost navozovat chování z posilované třídy odpovědí (zvyšovat pravděpodobnost jeho výskytu). Jak jsme si řekli v kapitole 2, antecedent korelovaný s následkem posilujícím určité chování se nazývá diskriminační stimul (SD ). Jestliže dojde k  behaviorální odpovědi ve chvíli, kdy působí SD , následuje posílení; dojde-li k odpovědi tehdy, kdy SD nepůsobí – což je situace označovaná jako stimul delta (SΔ ) -, posílení se nedostaví. Výsledkem této předchozí zkušenosti s posilováním je, že se u  člověka dané chování objevuje častěji v době působení diskriminačního stimulu než v době, kdy SD nepůsobí. Říkáme pak, že chování je pod kontrolou stimulu (stimulus control) (viz kapitola 17). Přidáním SD se dvojčlenná podmíněná závislost posílení na chování mění na trojčlennou podmíněnou závislost, u  níž je operant diskriminován stimulem (proto diskriminovaný operant). Příklady trojčlenné podmíněné závislosti u pozitivního posilování ukazuje obr. 11.3. Za předpokladu, že momentálně účinkuje jako posílení studená voda a že si člověk v minulosti pouštěl studenou vodu vždy jen z modře označeného kohoutku, je pravděpodobnější, že si dá sklenici pod modře označený kohoutek než pod kohoutek označený dejme tomu červeně. Podobně pokud předpokládáme, že momentálně působí jako posílení spatření pestrobarevného ptáka a  že se člověku v  minulosti častěji poštěstilo nějakého ptáka uvidět, když se otočil směrem, odkud se ozývalo ptačí štěbetání (než směrem, odkud se neozývalo nic anebo jiné zvuky), pak častěji otočí hlavu a podívá se doleva, jestliže odtud uslyší ptačí hlasy. Tabulka 11.1 Slovníček pojmů týkajících se posilování* Pojem Význam pojmu Příklad správného použití Posílení (podstatné jméno) Stimul Potravní granule byly u potkanů použity jako posílení toho, aby zmáčkli tlačítko. Posilující (přídavné jméno) Vlastnost stimulu Posilující stimul působil častěji než stimuly, které na chování takový vliv neměly. Posilování (podstatné jméno) Postup, při němž je prezentován následek, když se dostaví odpověď Posilování bylo založeno na podávání potravy holubům po každém desátém klovnutí do klíče. Zvyšování četnosti odpovědi jako výsledek posilování Experiment s opicemi prokázal, že sociální následky vedou k posilování. Posilovat (sloveso) Používat postup, při němž je prezentován následek, když se dostaví odpověď; posilovány jsou odpovědi, nikoli jedinci Když bylo vypracování domácí úlohy posilováno tím, že si mohlo dítě určitou dobu hrát, zlepšilo si známky ve škole. Zvyšovat četnost odpovědi prostřednictvím postupu posilování Cílem experimentu bylo zjistit, zda budou samolepicí zlaté hvězdičky posilovat u prvňáčků spolupráci při hře. *Uvedený slovníček je použitelný pouze tehdy, jsou-li splněny tři podmínky: (1) po odpovědi se dostavují následky; (2) daný typ odpovědi je častější, pokud se po ní tyto následky dostavují, než pokud se nedostavují; (3) četnost odpovědi se zvyšuje proto, že má odpověď tyto následky. Analogický slovníček lze použít pro trestání (s trestem jako stimulem a slovesem trestat), jen s tím rozdílem, že trestající následek četnost odpovědi nezvyšuje, ale snižuje. / Převzato z Learning, Interim A. C. Catanii, 2007 (4. vyd.), s. 69. Cornwall-on-Hudson, NY: Sloan Publishing. Pouze pro studijníúčely. N ešířita nekopírovat. 2 6 2     č á s t 4     Posilování B o x 1 1 . 1 Časté chyby při používání terminologie týkající se posilování Smysluplný popis jakékoli výzkumné aktivity vyžaduje, abychom v rámci daného vědního odvětví používali jednotný terminologický systém. Máme-li o plánování, průběhu a výsledcích experimentů ABA efektivně informovat další zájemce, neobejdeme se bez znalosti příslušné odborné terminologie. Některé pojmy vztahující se k posilování tvoří naprostý základ slovní zásoby behaviorálního analytika. V  tomto boxu poukazujeme na  čtyři chyby, jichž se studenti aplikované behaviorální analýzy často dopouštějí, když popisují intervence založené na  posilování. Tím patrně nejrozšířenějším omylem – zaměňováním negativního posilování za  trestání – se zde nezabýváme. O této terminologické chybě jsme se zmínili v kapitole 2 a znovu se k ní vrátíme v kapitole 12. Posilování osoby I když je na místě mluvit o poskytování nějakého posílení žákovi (např. „Když Bobby položil otázku, dal mu učitel žeton“), výroky jako „Když Bobby položil otázku, učitel ho posílil“ nebo „Chloe byla posílena pochvalou pokaždé, když správně hláskovala nějaké slovo“ jsou chybné. Posiluje se chování, nikoli lidé. Bobbyho učitel posílil položení otázky, ne Bobbyho. Posilování samozřejmě působí na  celou osobnost člověka, protože zpevňuje chování, které tvoří jeho behaviorální repertoár. Je to však postup zaměřený na určité typy chování, u nichž se také projeví jeho primární účinek. Procvičování jako posilování dovednosti Učitelé občas žáky nabádají k  procvičování nějaké dovednosti s odůvodněním, že „procvičováním se tato dovednost posiluje“. Tento výrok nepředstavuje problém, pokud je míněno posilování v jeho běžném chápání, tedy v tom smyslu, že posilovat znamená „činit něco silnějším“ (např. „posilovat imunitní systém užíváním vitaminu C“). Dobře sestavený a provedený program k procvičení nějaké dovednosti obyčejně vede k jejímu lepšímu osvojení v  podobě lepšího zapamatování, kratší latence, vyšší četnosti a/nebo zvýšené výdrže (např. Johnson a Layng, 1994; Swanson a Sachse-Lee, 2000). Bohužel jsou však slovní obraty typu „dovednost se procvičováním posiluje“ často interpretovány chybně a mylně se předpokládá, že se vztahují k posilování založenému na operantním podmiňování. I když bývá dovednost, která je procvičována, lépe osvojena, samo procvičování nějaké dovednosti nepůsobí jako její posílení. Procvičování se týká druhu a způsobu cílové dovednosti (např. vyřešit za  pět minut co nejvíc početních příkladů). Je to chování, které může být posilováno pomocí různých následků, například tím, že žák dostane možnost zabývat se oblíbenou činností („Procvičuj si počítání těchto příkladů a pak si můžeš deset minut stavět z lega.“). V závislosti na předchozí zkušenosti žáka s posilováním a na tom, co ho baví, může být možnost procvičovat určité dovednosti stimulem, který posiluje procvičování jiné dovednosti („Vypočítej příklady do matematiky a pak můžeš deset minut procvičovat čtení.“). Umělé posilování Někdy se rozlišuje mezi posíleními přirozenými a  umělými, jak je například patrné z  výroku „Protože u  žáků vzrostla míra úspěšnosti, postupně jsme přestali používat umělá posílení, jako jsou nálepky a  všelijaké drobnosti, a zvýšili používání posílení přirozených“. Podle některých autorů lze brát uplatňování principů chování jako jeho „umělou kontrolu“ (např. Smith, 1992). Podmiňování závislosti chování na jeho následku formou posilování může být buď účinné, nebo neúčinné, žádná ze tří složek dané jednotky (chování, následek ani výsledná změna chování) však není a nemůže být umělá. Posilování a  stimuly používané jako posílení jsou v programech modifikace chování vždy přidané – jinak by pro tyto programy ani nebyl důvod, ale nikdy ne umělé (Skinner, 1982). Nemá smysl rozlišovat mezi posilováním přirozeným a umělým, nýbrž mezi posilováním, které v  daném prostředí probíhalo už před zahájením intervenčního programu, a tím, které se v něm objevilo teprve jako součást intervence (Kimball a  Howard, 1993). Ačkoli pro účinnost intervenční strategie může být v posledku rozhodující, zda se posilování přesunulo z přidaných podmíněných závislostí na ty, které se v příslušném prostředí přirozeně vyskytují, nic takového jako umělé posilování neexistuje. Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 6 3 Používání pojmů posilování a zpětná vazba v synonymním významu Pojem posilování je nezřídka volně zaměňován s pojmem zpětná vazba, jako by šlo o synonyma. Přitom se každý z obou pojmů, i když se do jisté míry významově překrývají, vztahuje k jiným postupům a výsledkům. Zpětná vazba je informace podávaná člověku o určitém aspektu jeho chování, když toto chování skončilo („Skvěle, Kathy. Dvě čtvrtiny se rovnají padesáti procentům.“). Zpětná vazba mívá nejčastěji podobu slovního hodnocení, ale může být poskytnuta i jiným způsobem, jako jsou vibrace nebo světla (např. Green, Bailey a Barber, 1981). Protože zpětná vazba je následek často vedoucí ke zvýšené frekvenci chování v budoucnu, někdy se mylně předpokládá, že je nezbytnou součástí posilování nebo že posilování je jen termín, jenž pro zpětnou vazbu používají behavioristé. Na  rozdíl od  posilování, které vždy budoucí frekvenci behaviorální odpovědi zvyšuje, může vést zpětná vazba ke  (a) zvýšení budoucí frekvence dané činnosti, působí-li jako posílení a/nebo prompt či upozornění, na  co si dát příště pozor („Zlepšil sis písmo, Jasone, ale příště si to po  sobě nezapomeň přečíst“), a/nebo ke (b) snížení budoucí frekvence nějakého aspektu této činnosti, jestliže má funkci trestu nebo upozornění pro příště („Ty jsi fauloval. To nedělej.“). Zpětná vazba může mít více různých účinků, přičemž není výjimečné, že zatímco zvyšuje jeden aspekt činnosti, jiný naopak snižuje; a také nemusí mít na budoucí chování vůbec žádný vliv. Posilování je definováno funkčně, svým účinkem na chování v budoucnu; naproti tomu zpětná vazba je definována svými formálními znaky (je to informace o nějakém aspektu chování). Posilování a zpětná vazba mohou probíhat nezávisle na sobě: k posilování dochází i bez poskytnutí zpětné vazby a zpětná vazba nemusí mít žádný posilovací účinek. Někdy je lepší používat běžný jazyk Odborná terminologie používaná v behaviorální analýze je složitá a její zvládnutí není úplně snadné. Začínající studenti ABA nejsou jediní, kdo se v  této terminologii občas dopustí chyby. Tu a tam udělají chybu i dobře vyškolení praktikové a  zkušení výzkumníci. Ani ti nejpozornější a  nejsvědomitější behaviorální analytikové se občas nevyhnou chybě spočívající v  tom, že vysvětlují složité situace, na nichž se podílí mnoho různých procesů a nekontrolovaných a neznámých proměnných, pomocí behaviorálních pojmů a principů, jako je pozitivní posilování. Bude rozumnější nepoužívat k  vysvětlování vlivu následků, které jsou vzdáleny v čase, pojmosloví vztahující se k posilování, ale řídit se radou Jacka Michaela (2004)a vystačitsis běžnoumluvoua obyčejnoulogikou. Nesprávné používání odborné terminologie je horší, než používáme-li laické výrazy, poněvadž vzbuzuje dojem, že už věci dobře rozumíme, a tudíž není třeba podnikat vážné pokusy o další analýzu. Dokud nedokážeme přesně analyzovat různé procesy, které stojí za nepřímými účinky [posilování], uděláme lépe, když zůstaneme u běžného jazyka. Řekněte tedy „Schválení žádosti o grant pravděpodobně povzbudí podobné snahy v budoucnu“, ale ne tak, jako byste vycházeli z poznatků vědyo chování. Nevyjadřujte se o urovnání pracovního sporu jako o posílení stávek nebo o úspěšném zvolení nějakého politického kandidáta jako o posílení politické aktivity… Nemluvte o dobrých známkách jako o posílení efektivního učení, třebaže v některých případech mají nepochybně na udržení jeho efektivity zásluhu. Řekněte prostě, že pomáhají udržovat efektivní učení. Zdrženlivost tohoto druhu sice některé z nás připraví o možnost předvádět (chybně) své odborné znalosti, ale tím lépe. (s. 165, zvýrazněno v originále) Posilování závisí na motivaci Slovní obrat za předpokladu, že momentálně účinkuje jako posílení studená voda, použitý v předchozím odstavci, nám poskytuje ještě jiný klíč k  pochopení posilování. I když je posilování obecně považováno za způsob, jak lidi motivovat - jímž také skutečně může být -, je momentální účinnost posílení vždy závislá na aktuální míře motivace, která je s ním spjata. Jak už jsme uvedli v kapitole 2, pozměňují momentální hodnotu každého posílení motivující operace (Michael, 2004). Motivující operace (MO) jsou proměnné prostředí, které mají na chování dvojí účinek. (1) Mění účinnost, s níž je chování posilováno určitými stimuly, objekty či jevy (změna hodnoty posílení), a (2) mění aktuální frekvenci veškerého chování, které bylo těmito stimuly, objekty či jevy dosud posilováno (změna chování). Hodnota posílení a to, jak dlouhá doba ho dělí od operantu, se odrazí v účinnosti tohoto posílení v době podmiňování. Jestliže řekneme, že následek má formu posílení, znamená to, že relevantní MO v té chvíli působí v dostatečné míře (s. 31). Pouze pro studijníúčely. N ešířita nekopírovat. 2 6 4     č á s t 4     Posilování Jinými slovy, k tomu, aby změna stimulu „zafungovala“ jako posílení, už ji dotyčný člověk musí chtít. To je klíčový požadavek, jenž musí splňovat podmínky prostředí, má-li se účinek posílení projevit. Michael (2004) vysvětluje tento požadavek následovně: MO má vliv na zvýšení frekvence posilovaného chování a je třetí nezbytnou složkou korelace mezi operantem a posílením: Jestliže za daného souboru podmínek (S) po určitém typu chování (R) bezprostředně následuje posílení (SR ), dojde v budoucnu k nárůstu frekvence tohoto typu chování za stejných nebo podobných podmínek prostředí, ale pouze tehdy, bude-li znovu působit MO, která byla předtím pro posílení relevantní. (s. 31, zvýrazněno v originále) Rozlišujeme dva druhy motivujících operací. MO, která zvyšuje aktuální účinnost posílení, se nazývá etablující operace (EO, establishing operation) (např. hlad zvyšuje účinnost jídla jako posílení); MO, která snižuje aktuální účinnost posílení, je aboliční operace (AO, abolishing operation) (nasycení naopak účinnost jídla jako posílení snižuje).4 Přidáním etablující operace (EO) k  diskriminovanému operantu vzniká čtyřčlenná podmíněná závislost, jak ji ukazuje obr. 11.4. Strávit několik hodin v  horké a  dusné místnosti bez vody je EO, která (a) zvyšuje účinnost vody coby posílení a (b) zvyšuje aktuální frekvenci veškerého chování, jehož následkem 4  Motivující operace jsou podrobně popsány v kapitole 16. byla v  minulosti možnost dostat se k  vodě. Podobně když strážce parku turistům před výletem slíbí, že každý, kdo bude po návratu schopen říct, jak vypadá pták ozývající se určitým charakteristickým hlasem, dostane poukaz na nákup v obchodě s dárkovými předměty ve výši pěti dolarů, jedná se o EO, která (a) učiní ze zahlédnutí ptáka vydávajícího tento hlas posílení a (b) zvýší frekvenci veškerého chování (například otáčení hlavy, rozhlížení se okolo sebe), které v minulosti vedlo k podobným následkům (v tomto případě spatření zdroje zvuku). Etablující operace (EO) zkrátka rozhodují o tom, co daný jedinec v té které chvíli chce. EO jsou dynamické a neustále se mění. Hodnota posílení stoupá se vzrůstající úrovní deprivace a klesá s tím, jak narůstá saturace. Vollmer a Iwata (1991) v jedné studii ukázali, jak se liší posilovací účinnost stimulů ze tří různých tříd – jídla, hudby a sociální pozornosti - v podmínkách deprivace a saturace. Studie se zúčastnilo pět dospělých lidí s vývojovými vadami. Závisle proměnnou byl počet operantů za minutu, přičemž těmito operanty byly dvě motorické činnosti: účastníci experimentu měli za  úkol mačkat tlačítko nebo brát z  krabice kostky a vhazovat je otvorem ve víku do jiné krabice. Všechna sezení trvala deset minut. Na  začátku vždy experimentátor pokusnému subjektu řekl: „Provádějte tohle, [oslovení jménem],“ a předvedl mu, co má dělat. V počáteční fázi pokusu (kdy panovaly deprivační podmínky) nenásledovalo po požadované odpovědi SR+ Do sklenice teče studená voda Spatřit pestrobarevného ptáka Účinek na budoucí frekvenci podobných odpovědí při působení SD SD R Modře označený kohoutek Dát sklenici pod kohoutek a pustit vodu Ptačí štěbetání ozývající se zleva Otočit hlavu a podívat se doleva Obrázek 11.3 Trojčlenná podmíněná závislost u pozitivního posilování diskriminovaného operantu: Po odpovědi (R) generované ve chvíli, kdy působí diskriminační stimul (SD ), následuje vzápětí změna stimulu (SR+ ), která vede ke zvýšené frekvenci podobných odpovědí v budoucnu, působí-li tento SD . Diskriminovaný operant je výsledkem předchozího podmiňování, založeného na tom, že po odpovědích, ke kterým došlo za působení SD , následovalo posílení, zatímco podobné odpovědi, u nichž SD nepůsobil (situace označovaná jako stimul delta [SΔ ]), posilovány nebyly. Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 6 5 žádné programované posílení. Ve druhé fázi, kdy se experiment odehrával buď v  podmínkách deprivace, nebo saturace, bylo po  odpovědi prezentováno příslušné posílení – jídlo, hudba, nebo sociální pozornost. Nejprve bylo zvolené posílení poskytováno po každé žádoucí odpovědi, ale poté se jeho frekvence postupně snižovala a byla posilována každá třetí, pátá nebo desátá odpověď. U každé třídy stimulů byly deprivační a saturační podmínky vytvořeny jiným způsobem. V případě jídla například experimentátoři zajistili deprivační podmínky tak, že sezení načasovali na dobu půl hodiny 30 25 20 15 10 5 0 výchozí podmínky deprivace saturace deprivace Donny 30 25 20 15 10 5 0 výchozí podmínky deprivace saturace deprivace Sam saturace 10 20 30 40 Sezení Početodpovědízaminutu SR+ Do sklenice teče studená voda Spatřit pestrobarevného ptáka Účinek na budoucí frekvenci podobných odpovědí za podobných podmínekSD R Modře označený kohoutek Dát sklenici pod kohoutek a pustit vodu Ptačí štěbetání ozývající se zleva Otočit hlavu a podívat se doleva EO Strávit dvě hodiny v horké a dusné místnosti bez vody Strážce parku řekne: „Každý, kdo po návratu z výletu popíše ptáka ozývajícího se tímto hlasem, dostane poukázku na nákup v obchodě s dárkovými předměty ve výši pěti dolarů.“ Obrázek 11.4 Čtyřčlenná podmíněná závislost u pozitivního posilování diskriminovaného operantu při působení motivující operace: etablující operace (EO) zvyšuje momentální účinnost změny stimulu jakožto posílení, takže je pravděpodobnější, že SD navodí chování, které bylo touto změnou stimulu v minulosti posilováno. Obrázek 11.5 Počet odpovědí za minutu u dvou probandů za výchozích podmínek a při použití sociální pozornosti jako posílení v podmínkách deprivace a saturace. Převzato z Establishing Operations and Reinforcement Effect T. R. Vollmera a B. A. Iwaty, 1997, Journal of Applied Behavior Analysis, 24, s. 288. Copyright Society for the Experimental Analysis of Behavior, Inc., 1991. Použito se svolením držitele autorských práv. Pouze pro studijníúčely. N ešířita nekopírovat. 2 6 6     č á s t 4     Posilování předtím, než měla jít pokusná osoba na oběd; sezení v podmínkách saturace naopak proběhlo čtvrt hodiny po obědě. Sezení v podmínkách nedostatku sociální pozornosti bylo zahajováno poté, co byl dotyčný člověk čtvrt hodiny sám, nebo u něj neproběhla žádná interakce s jinou osobou; v opačném případě věnoval experimentátor zkoumanému subjektu těsně před sezením čtvrthodinovou nepřetržitou pozornost (např. v podobě hraní jednoduché hry nebo konverzace). U všech pěti lidí zařazených do studie byla frekvence odpovědí vyšší v podmínkách deprivace než v podmínkách saturace. Na obr. 11.5 můžete vidět, jak změna těchto podmínek ovlivňovala účinnost sociální pozornosti jakožto posílení u dvou účastníků studie, Donnyho a  Sama. K  podobným výsledkům dospěli i jiní výzkumníci, kteří zkoumali, jaké mají motivující operace v různých případech účinky na relativní efektivitu s nimi souvisejících posílení (např. Gewirtz a Baer, 1958; Klatt, Sherman a Sheldon, 2000); North a Iwata, 2005; Zhou, Iwata a Shore, 2002). Automatičnost posilování Souvislost s posilováním nemusí být jedinci, jehož chování je posilováno, zřejmá. (B. F. Skinner, 1953, s. 75) Skutečnost, že k  tomu, aby došlo k  posílení, není nutné, aby člověk chápal nebo uměl vysvětlit vztah mezi svým chováním a posílením, a dokonce ani aby si uvědomoval, že na něj posílení působí, je známa jako automatičnost posilování (automacity of reinforcement). Skinner (1983) poskytl zajímavý příklad automatičnosti posilování ve třetím, posledním díle své autobiografie, nazvaném Otázka následků (A Matter of Cosequences). Popisuje zde případ, který se odehrál na  konferenci, na  níž se sešli renomovaní odborníci, aby diskutovali o roli motivace v politické činnosti. V  jednu chvíli přišel psycholog Erich Fromm s argumentem, že „lidé nejsou holubi“ - patrně tím měl na mysli, že pomocí analýzy operantního chování, založené na pozitivním posilování, se nedá vysvětlit lidské chování, které je produktem myšlení a svobodné vůle. Skinner líčí, co se událo potom: Říkal jsem si, že to tak nemůžu nechat. Na útržek papíru jsem napsal: „Sleduj Frommovu levou ruku. Budu tvarovat [posilovat postupné aproximace] jeho gestikulaci“ a poslal papírek Halleckovi [člen skupiny]. Fromm seděl na opačné straně stolu přímo naproti mně a mluvil hlavně ke mně. Trochu jsem posunul svou židli tak, abych na něj viděl koutkem oka. Při řeči živě gestikuloval, a vždycky když mu levá ruka vyletěla nahoru, podíval jsem se přímo na něj. Když ruku spustil, přikývl jsem a usmál se. Za pět minut máchal rukou tak divoce, že mu náramkové hodinky neustále klouzaly dolů. (s. 150-151, slova v závorce doplněna dodatečně). Náhodnost selektovaného chování Pokud jde o organismus, je jediným důležitým znakem podmíněné závislosti časový aspekt. (B. F. Skinner, 1953, s. 85) K tomu, aby došlo k posílení, není nutná žádná logická souvislost nebo souvislost spočívající v  adaptaci jedince na prostředí. Jinými slovy, posílení zpevní jakékoli chování, které mu těsně předchází. Tato libovolnost selektovaného chování je klíčem k pochopení posilování. S  časovou souvztažností mezi chováním a následkem musí soupeřit všechny ostatní souvztažnosti (co je logické, žádoucí, užitečné, vhodné atd.). „Když říkáme, že posílení je podmíněně závislé na odpovědi, nemusí to znamenat nic víc, než že po této odpovědi následovalo… k podmiňování patrně dochází pouze na základě časové souvztažnosti, dané pořadím a blízkostí odpovědi a posílení“ (Skinner, 1948, s. 168). Skinner (1948) názorně ukázal libovolnost chování, které je posilováním selektováno, v jedné ze svých nejslavnějších experimentálních studií, nesoucí název Pověrčivost u holuba (Superstiton in the Pidgeon). Dával holubům každých 15 vteřin malé množství potravy „zcela bez ohledu na jejich chování“ (s. 168). Skutečnost, že posílení zpevní jakékoli chování, po němž bez- prostředněnásleduje,bylabrzyočividná.U šestiz osmi holubů se vyvinulo idiosynkratické chování, které bylo „tak zřetelné, že se dva pozorovatelé dokonale shodli na tom, kolikrát k němu došlo“ (s. 168). Jeden pták obcházel klec kolem dokola proti směru hodinových ručiček; jiný opakovaně strkal hlavu do jednoho horního rohu klece. U dvou ptáků se objevil „kývavý pohyb, kdy s rychlým komíháním ze strany na stranu vystrčili hlavu a pak ji trochu pomaleji zase zatáhli“ (s. 169). Žádný z těchto typů chování se u holubů „v pozorovatelné míře“ neprojevoval ve  fázi, kdy se teprve adaptovali na prostředí klece a ještě nebyli krmeni ve čtvrtminutových intervalech. Jakékoli chování, které u holubů zrovna probíhalo, když jim byla předložena potrava, mělo tendenci se opakovat, čímž se zvyšovala pravděpodobnost, že se příště znovu objeví právě ve chvíli, kdy dostanou zrní. V tomto případě nebylo posílení na chování podmíněně závislé; bylo pouze věcí náhody, že k  němu občas došlo v těsné časové návaznosti na to které chování. Takové náhodně posilované chování se označuje jako „pověrčivé“, protože nemá žádný vliv na to, zda Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 6 7 se dostaví posílení. U lidí se setkáváme s celou řadou pověrčivého chování. Nepřeberné množství příkladů najdeme ve  sportu: Basketbalista se před trestným hodem zatahá za šortky, golfista si s sebou bere markovátko, které mu přináší štěstí, fotbalový fanoušek chodí na zápasy svého týmu s vlastnoručně vyrobeným amuletem kolem krku…5 Pochopení toho, že posilování se děje náhodně, nám ovšem dává nejen možnou odpověď na otázku, jak se vyvíjí neškodné pověrčivé nebo idiosynkratické chování; může nám též pomoci vysvětlit, čím to je, že se u lidí objevuje a udržuje tolik typů maladaptivního a problémového chování. Pokud například věnujeme pozornost člověku, který se právě poškozuje, v dobře míněné snaze ho uklidnit nebo odvést jeho myšlenky jinam, můžeme tak napomáhat tvarování a udržování právě toho chování, jemuž se snažíme zabránit. Kahng, Iwata, Thompson a Hanley (2000) zjistili pomocí funkční analýzy u tří dospělých s vývojovými vadami, že sociální posilování udržuje sebepoškozování a agresivní chování. Tyto výsledky podporují hypotézu, že vzhledem k náhodnému působení posilujících následků může být sociální pozorností selektováno a udržováno nevhodné chování. Automatické posilování Některé typy chování vytvářejí své vlastní posílení, aniž by je museli zprostředkovávat druzí – kupříkladu když se poškrábeme na místě, kde nás to svědí. Pro posilování odpovědi, které nevyžaduje prezentaci následků nikým dalším, používají behaviorální analytikové termín automatické posilování (automatic reinforcement) (Vaughan a Michael, 1982; Wollmer, 1994, 2006). Následky, jež účinkují jako automatické posílení, mají často podobu přirozeně vznikajícího smyslového vjemu, kdy něco „příjemně zní, pěkně vypadá, dobře chutná, hezky voní, je příjemné na dotek nebo jde o pohyb příjemný sám o sobě“ (Rincover, 1981, s. 1). Smyslové podněty, které působí jako automatické posílení, mohou vznikat při perzistentním neúčelném repetitivním chování (prokřupávání kloubů na  prstech, kývání hlavou, pohupování tělem, chození po  špičkách, namotávání vlasů na  prst, poklepávání se na  různých místech těla apod.). Vědci se domnívají, že taková „sebestimulace“ je faktorem, který udržuje sebepoškozování (Iwata, Dorsey, Slifer, Bauman a  Richman, 1994), stereotypní repetitivní 5   Bylo by ovšem mylné se domnívat, že veškeré pověrčivé chování je přímým výsledkem nahodilého posilování. V mnoha případech k němu patrně vedou kulturní vlivy. Například na střední škole mívají často hráči baseballu na zápasech kšiltovku naruby a štítkem dozadu, protože to tak viděli u ligových hráčů. pohyby a „neurotické zlozvyky“, jako je namotávání vlasů na prst (Rapp, Miltenberger, Galensky, Ellingson a Long, 1999), okusování nehtů, kousání se do rtů nebo vnitřní strany tváří či manipulace s  různými předměty, například pohrávání si s tužkou nebo popotahování za přívěšek na krku (Miltenberger, Fuqua a Woods, 1989). Následkem, který účinkuje jako automatické posílení, bývá nepodmíněné posílení nebo původně neutrální stimul, z něhož se spárováním s jiným druhem posílení stalo posílení podmíněné. Sundberg, Michael, Partington a Sundberg (1996) popisují dvoufázové podmiňování, které by mohlo vysvětlovat, jak takové podmíněné automatické posilování vzniká. Člověk si může například cestou z kina stále prozpěvovat nebo pobrukovat píseň z filmu, který viděl, přestože není jasné, jaké z toho plyne přímé posílení. Má-li toto chování nastat na základě automatického posilování, musí předtím projít dvěma fázemi speciálního podmiňování. V první fázi musí být určitý stimul (v tomto případě píseň) spárován s nějakým druhem podmíněného nebo nepodmíněného posílení (např. filmem, který dotyčného bavil, popcornem, odpočinkem). Z původně neutrálního stimulu se tak stává nový druh podmíněného posílení. Ve druhé fázi vede generování odpovědi (z jakékoli příčiny) k posílení (sluchovému vjemu vznikajícímu při zpěvu písně), které se topograficky podobá předchozímu neutrálnímu stimulu a nyní má sebeposilovací účinky. (s. 22-23) Podle některých teoretiků by nám mohlo automatické posilování pomoci též se zodpovězením otázky, co stojí za žvatláním malých dětí a jak se z neartikulovaných vokalizací tvořících dětské žvatlání přirozeně, bez zjevné intervence druhých stávají hlásky rodné řeči (např. Bijou a Baer, 1965; Mowrer, 1950; Skinner, 1957; Staats a  Staats, 1963; Vaughan a Michael, 1982). Matky nebo jiní lidé, kteří se starají o miminko, na něj často při chování, krmení či koupání mluví a zpívají mu. Zvuk jejich hlasu se v důsledku opakovaného párování s různými posíleními (potravou, teplem) stává pro dítě podmíněným posílením. Žvatlání je automaticky posilováno, jestliže se hlasové projevy dítěte podobají hlasovým projevům člověka, který se o něj stará. „U malého dítěte, které je samo ve svém pokoji, se může automaticky posilovat jeho vlastní explorační vokalizování, když vydává zvuky, které slýchá v řeči druhých“ (Skinner, 1957, s. 58). Přestože myšlenka, že automatické posilování hraje roli při raném osvojování jazyka, není nikterak nová, objevily se experimentální analýzy tohoto jevu v  odborné literatuře teprve nedávno (např. Miguel, Carr a  Michael, 2002; Sundberg a  kol., 1996; Yoon Pouze pro studijníúčely. N ešířita nekopírovat. 2 6 8     č á s t 4     Posilování a Bennet, 2000). První studii, která ukazuje účinky párování stimulu s posílením - bez přímého posilování nebo promptování - na frekvenci nových hlasových projevů publikovali Sundberg a  kol. (1996). Pokusnými subjekty bylo pět dětí ve věku od dvou do čtyř let, které se značně lišily úrovní svých jazykových dovedností. Výchozí podmínky byly nastaveny tak, že rodič a terapeut seděli několik metrů od dítěte, které si hrálo s elektrickým vláčkem a několika hračkami, a nijak s ním nekomunikovali. Přitom zaznamenávali veškeré hlasové projevy dítěte, a to několikrát po sobě vždy po dobu jedné minuty. V další fázi, při párování stimulu s posílením, k dítěti pokaždé přišel člověk, jehož dobře znalo, generoval cílový hlasový projev (slovo, větu nebo neverbální vokalizaci) a bezprostředně poté dítěti poskytl předem dohodnutý druh posílení (polechtal ho, pochválil, vyhodil do vzduchu…). Zopakoval to patnáctkrát za minutu, přičemž tato fáze trvala jednu, případně dvě minuty. Při vokalizacích měnil výšku hlasu a intonaci. Hned po skončení fáze párování stimulu s posílením dotyčný odešel a podmínky se vrátily do výchozího stavu. V  poslední fázi, následující po  spárování příslušného hlasového stimulu se zvoleným posílením, byla u všech pěti dětí zjištěna zvýšená frekvence cílového hlasového projevu. Na obr. 11.6 jsou znázorněny reprezentativní výsledky jednoho ze tří takových pokusů u subjektu 2, čtyřletého chlapce s autismem. Verbální repertoár tohoto chlapce tvořilo přes 200 mandů, taktů a  intraverbálů,6 ale jen zřídka spontánně vokalizoval nebo se zapojoval do hlasové hry. 6  Mandy, takty a intraverbály - tři základní verbální operanty, poprvé popsané Skinnerem (1957) – jsou představeny v kapitole 25. Za výchozích podmínek ani jednou nevyslovil cílové slovo (jablko) a byly u něj zaznamenány čtyři vokalizace, jejichž průměrná četnost činila 0,5/min. Ve fázi párování stimulu s posílením bylo slovo jablko zhruba patnáctkrát za 60 sekund spárováno s polechtáním. Během následujících čtyř minut vyslovil chlapec slovo jablko sedmnáctkrát, tedy s četností 4,25/min. Kromě toho řekl čtyřikrát během první minuty po spárování stimulu s posílením slovo lechtat. Uvedené výsledky ukazují, že následky vokalizací mohly po  spárování s jiným druhem posílení u dítěte účinkovat jako podmíněné automatické posílení. Kennedy (1994) poznamenává, že pojem automatické posilování se v aplikované behaviorální analýze používá ve dvou různých významech. Za prvé se tak označuje posilování, na němž se nepodílí žádná zprostředkující osoba (Vollmer, 1994; 2006). Kromě toho připisují někteří behaviorální analytikové automatickému posilování roli kontrolující proměnné u perzistentního chování, u něhož se nepodařilo zjistit, čím je posilováno (viz kapitola 24, pojednávající o funkční analýze chování). Často se na automatické posilování usuzuje u sebepoškozování, které neprovází sociální pozornost ani žádná jiná známá forma sociálně zprostředkovaného posilování (Fisher, Lindon, Alterson a Thompson, 1998; Ringdahl, Vollmer, Marcus a Roanne, 1997; Roscoe, Iwata a Goh, 1998). Pokud se ukáže, že by chování mohlo být udržováno automatickým posilováním, snažíme se odstranit zdroj tohoto posilování nebo ho nahradit jiným (Kennedy a Souza, 1995, viz obr. 8.5; Shore, Iwata, DeLeon, Kahng a Smith, 1997), abychom zjistili, jaký program intervence bude vhodný: zda využít toho, že jde o automatické posilování, nebo působit proti němu (viz kapitoly 21, 22 a 23). 20 15 10 5 0 kumulativníčetnostvokalizací Subject 2 počáteční fáze fáze po spárování stimulu s posílením fáze párování stimulu s posílením nové slovo „jablko“ jiná vokalizace 1 2 3 4 5 6 7 8 9 10 11 12 13 minuty Obrázek 11.6 Kumulativní četnost, s níž čtyřletý chlapec s autismem vokalizoval cílové slovo „jablko“ ve fázi před opakovaným spárováním tohoto slova s předem dohodnutým druhem posílení a ve fázi po spárování. Zvýšenou frekvenci vokalizací slova „jablko“ po jeho spárování s posílením lze vysvětlit automatickým posilováním. Převzato z Automatic Reinforcement M. L. Sundberga, J. Michaela, J. W. Partigtona a C. A. Sunberga, 1996, Repertoire-Altering Effects of Remote Contingencies, in The Analysis of Verbal Behavior, 13, s. 27. Copyright Association for Behavior Analysis, Inc., 1996. Použito se svolením držitele autorských práv. Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 6 9 Vollmer (2006) shrnul možnosti a omezení konceptu automatického posilování a přitom uvedl, že: • Praktikové by si měli být vědomi toho, že ne každé posilování je zamýšlené anebo zprostředkované druhými. • Některé typy chování udržované automatickým posilováním (např. sebestimulační nebo stereotypní chování) vzdorují snaze o redukci či eliminaci pomocí určitých postupů (jako je time-out, úmyslné ignorování, vyhasínání apod.). • Dáme-li pozorovanému jevu příliš rychle nálepku automatického posilování, zúžíme tím možnosti analýzy, protože z ní už předem vyřadíme posílení, které může dané chování ve skutečnosti udržovat. • V situacích, kdy je obtížné nebo nereálné, aby byla podmíněná závislost vytvořena prostřednictvím jiné osoby, mohou praktikové zvážit použití automatického posilování. Klasifikace posílení V tomto oddíle si probereme klasifikaci posílení podle původu a uvedeme si několik praktických kategorií, které terapeuti a výzkumníci často používají k rozlišování posílení podle formálních vlastností. Čtenář by si ovšem měl být vědom toho, že všem posílením, bez ohledu na to, jak jsou klasifikována, je společný jeden definující znak: zvyšují budoucí frekvenci toho typu chování, které jim bezprostředně předcházelo. Klasifikace posílení podle původu Jak už jsme uvedli v kapitole 2, dělíme posílení na základě původu na dva základní typy: nepodmíněná posílení jsou produktem evoluce daného druhu, zatímco podmíněná posílení jsou výsledkem učení na individuální úrovni. Nepodmíněná posílení Stimul, který účinkuje jako posílení, i když s ním jedinec nemá žádnou obzvláštní předchozí zkušenost, se nazývá nepodmíněné posílení (unconditioned reinforcer). (Někteří autoři používají pro nepodmíněné posílení synonymní názvy primární posílení nebo nenaučené posílení.) Protože nepodmíněná posílení vznikají na zá- kladěevolučníhovývojedruhu(fylogeneze),jsouvšichni příslušníci určitého druhu na  totéž nepodmíněné posílení víceméně stejně citliví. Jako příklady stimulů, s nimiž předtím jedinec nemusí přijít do kontaktu, aby účinkovaly jako posílení, můžeme uvést potravu, vodu, kyslík, teplo nebo sexuální podněty. Potrava bude působit jako nepodmíněné posílení na člověka trpícího nedostatkem jídla, voda na toho, kdo má žízeň, a tak dále. Nepodmíněným posílením může být též lidský dotek (Gewirtz a  Pelaez-Nogueras, 2000). Pelaez-Nogueras s kolegy (1996) zjistili, že malé děti dávají přednost kontaktu tváří v  tvář doprovázenému dotykovou stimulací. S  každým dítětem zařazeným do studie interagoval střídavě dospělý člověk dvěma různými způsoby: jakmile dítě zareagovalo na  oční kontakt, začal se na něj usmívat a žvatlat, ale nedotýkal se ho, anebo mu zároveň masíroval nožky. Všechny zkoumané děti si déle udržely oční kontakt, více se usmívaly a vokalizovaly a méně plakaly a protestovaly tehdy, pokud se jich dospělý při komunikaci dotýkal. Z výsledků této studie a několika jí podobných vědci vyvozují, že „dotyková stimulace působí u malých dětí jako primární sociální posílení“ (s. 199). Podmíněná posílení Podmíněné posílení (někdy též označované jako sekundární posílení nebo naučené posílení, conditioned reinforcer) je původně neutrální stimul, který získává svoji schopnost účinkovat jako posílení na  základě spárování s  jedním či více nepodmíněnými nebo podmíněnými posíleními. Opakovaným spárováním s posílením (případně posíleními) nabývá původně neutrální stimul takové posilovací schopnosti jako posílení, s nímž byl spárován.7 Pokud bylo například zaznění tónu opakovaně spárováno s  podáním potravy, bude účinkovat jako posílení i tento tón (za předpokladu, že EO v dané chvíli propůjčují potravě posilovací účinek). U  lidí se mohou stát neutrální stimuly podmíněnými posíleními i tehdy, pokud nebyly s posílením spárovány přímo, ale prostřednictvím párovacího procesu, jemuž říká Alessi (1992) analogické verbální podmiňování. Tak například dětem ve školce, které se připravují do školy a za dobré výkony dostávají bonbony, můžeme ukázat proužky nastříhaného žlutého papíru a říci jim: „Takové proužky žlutého papíru dostávají za odměnu velké děti“ (Engelmann, 1975, s. 98-100). Mnoho dětí ze skupiny začne ihned bonbony odmítat. Pracují s velkým úsilím, ale jako odměnu akceptují jen proužky žlutého papíru. Dá se říci, že proužky žlutého papíru působí jako „naučené posílení“. Z laboratorních výzkumů vyplývá, 7   Nezapomeňte, že párování probíhá v prostředí, nikoli u člověka. Není nutné, aby u člověka došlo k „asociaci“ jednoho stimulu s druhým. Pouze pro studijníúčely. N ešířita nekopírovat. 2 7 0     č á s t 4     Posilování že neutrální stimuly se stávají posílením jenom tehdy, jsou-li přímo spárovány s primárním posílením (nebo jiným „naučeným posílením“). Žlutý papír však nebyl spárován s žádným posílením, a rozhodně ne s posílením primárním (bonbony). Přesto získal ještě silnější posilovací účinky než primární posílení, jak je patné ze skutečnosti, že děti odmítly přijímat bonbony a místo toho vyžadovaly proužky žlutého papíru. (Pro účely tohoto příkladu předpokládejme, že děti měly před sezením na bonbony pořád chuť.) (s. 1368) Někdy se objevuje názor, že „síla“ podmíněného posílení je dána tím, kolikrát bylo spárováno s původním posílením. Přesto nejsou výroky typu „Čím častěji je tón spárován s potravou, tím větší bude jeho posilovací účinek“ úplně přesné. Mnohonásobným spárováním tónu s  nějakým posílením se sice zvýší pravděpodobnost, že bude příslušný tón účinkovat především jako podmíněné posílení (i když někdy stačí i jediné spárování), nicméně jeho aktuální účinnost závisí na etablující operaci spojené s posílením, se kterým byl tón původně spárován. Tón, který byl spárován pouze s jídlem, zapůsobí jako účinné posílení, pokud má člověk hlad, ale bude mít jen malý efekt, jestliže se dotyčný právě dosyta najedl - bez ohledu na to, kolikrát byl předtím tento tón spárován s potravou. Podmíněné posílení, které je výsledkem párování s  mnoha nejrůznějšími nepodmíněnými a  podmíněnými posíleními, takže jeho účinnost není závislá na stávající EO pro žádný konkrétní druh posílení, označujeme jako generalizované (zobecněné) podmíněné posílení (generalized conditioned reinforcer). U  mnoha lidí působí například jako generalizované podmíněné posílení sociální pozornost (blízkost, oční kontakt, pochvala), což je dáno jejím společným výskytem s řadou jiných druhů posílení. S čím větším počtem různých posílení je zobecněné podmíněné posílení spárováno, tím vyšší je pravděpodobnost, že bude účinné v jakémkoli konkrétním okamžiku. Rovněž peníze, protože se dají vyměnit za nepřeberné množství různých zálohovaných posílení, jsou generalizovaným podmíněným posílením, jehož účinnost obvykle nezávisí na momentálních etablujících operacích. Občas se setkáváme s domněnkou, že za zobecněné se označuje takové podmíněné posílení, které dokáže posilovat širokou škálu různého chování. Tak tomu ale není – každé posílení dokáže zpevňovat jakékoli chování, jež mu bezprostředně předchází. Důvodem, proč určité podmíněné posílení považujeme za zobecněné, je to, že je účinné při nejrůznějších EO. Pro behaviorální analytiky, kteří mají často omezené možnosti kontrolovat EO pro příslušná posílení je používání zobecněných podmíněných posílení, na  EO do značné míry nezávislých, velmi výhodné. Na zobecněných podmíněných posíleních je založen žetonový systém, systém, s jehož pomocí se dají zlepšovat nejrůznější projevy chování mnoha lidí (např. Higgins, Williams a McLaughlin, 2001; Phillips, Phillips, Fixen a Wolf, 1971). Podstatou tohoto systému je, že lidé, kteří jsou do něj zapojeni, dostávají za  cílové chování nejrůznějšího typu žetony (body, nálepky, razítka). Ty si schovávají a  v  určitou dobu je pak směňují za zálohovaná posílení, která si mohou vybrat z  nabízených možností (volný čas, čas, který mohou strávit u  počítače, sladkosti). Příklady žetonového systému – návody, jak jej vytvářet a zavádět, najdete v kapitole 26. Klasifikace posílení podle formálních vlastností K  usnadnění komunikace s  organizacemi a  lidmi, jimž poskytují své služby, používají behaviorální analytikové klasifikaci posílení podle formálních vlastností. Většinou tak rozlišují posílení jedlá, smyslová, hmotná, posílení ve formě aktivity a posílení sociální. Jedlá posílení Vědci a  praktikové používají jako posílení oblíbená jídla, pamlsky nebo nápoje. Zajímavé a  významné uplatnění nacházejí jedlá posílení mimo jiné při modifikaci chronického odmítání potravy u dětí. Riordan, Iwata, Finney, Wohl a Stanley (1984) například použili „mimořádně oblíbená jídla“ jako posílení, s jehož pomocí zvyšovali příjem potravy u čtyř dětí v nemocničním zařízení. Intervenční program spočíval v tom, že děti dostaly jídlo, které měly rády (např. cereálie, jogurt, kompot, zmrzlinu), pokud snědly cílové jídlo (zeleninu, chleba, vejce). Kelley, Piazza, Fisher a  Oberdorff (2003) použili jedlé posílení, aby podpořili pití z hrníčku u Ala, tříletého chlapce, který odmítal pevnou stravu a byl závislý na kojenecké láhvi. Výzkumníci měřili, v kolika procentech případů se Al napil, když mu v hrníčku nabídli 7,5 ml pomerančového džusu, vody nebo kakaa. V počáteční fázi experimentu, kdy byl Al pochválen, jestliže nápoj z hrníčku neodmítl, přijal džus průměrně v 0 %, vodu ve 44,6 % a kakao v 12,5 % pokusů. Během následující fáze (pozitivní posilování) byl Al pokaždé, když se z hrníčku napil, nejen pochválen (stejně jako na začátku pokusu), ale navíc mu byla přímo do úst podána zarovnaná lžička s broskvemi, které mu během zkoumání zachutnaly. Pozitivní posilování u něj konzumaci všech tří nápojů natolik zvýšilo, že se jich napil ve 100 % pokusů. Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 7 1 Smyslová posílení Jako účinná posílení se osvědčily různé formy smyslové stimulace, jako jsou vibrace (např. masážní), taktilní stimulace (lechtání, hlazení péřovým boa), blikající světla a  hudba (např. Bailey a  Meyerson, 1969; Ferrari a Harris, 1981; Gast a kol., 2000; Hume a  Crossmann, 1992; Rincover a  Newsom, 1985; Vollmer a Iwata, 1991). Hmotná posílení Coby hmotná posílení často slouží drobnosti jako nálepky, různé ozdůbky, obrázky, sběratelské karty nebo malé hračky. Skutečná hodnota předmětu nemá na jeho posilovací účinnost žádný vliv. Jako posílení lze použít v podstatě cokoli. Vzpomeňte si na žluté proužky papíru, které vyžadovaly děti z Engelmannovy studie (1975). Posílení ve formě aktivity Pokud slouží jako posílení možnost zabývat se určitou aktivitou, pak mluvíme o posílení ve formě aktivity. Takovým posílením mohou být každodenní činnosti (jako třeba hraní deskové hry, čtení anebo poslech hudby), aktivity představující nějakou výsadu (moci obědvat s  učitelem, střílet na  koš v  tělocvičně, být první v řadě) nebo účast na nějaké mimořádné akci (jet na výlet do zoo). McEvoy a Brady (1988) zkoumali, jak bude správné spočítání matematických příkladů u tří žáků s autismem a poruchami chování ovlivněno tím, že díky němu získají přístup k věcem na hraní. Na začátku učitel žákům řekl, aby vypočítali příklady na pracovním listě, jak nejlépe umí, a pokud s nimi budou hotoví před uplynutím šesti minut, aby buďdopočítali jiné příklady, které ještě nemají vyřešené, nebo „si našli nějakou jinou činnost“. Za výchozích podmínek nedostali žádné další prompty ani pokyny, jak mají pracovní listy vyplňovat. Za vyplnění pracovního listu učitel žáky pochválil. V den, kdy byla zahájena intervence, zavedl vždy učitel žáka do  jiné místnosti, kde byly nachystány různé věci na hraní. Řekl mu, že si s nimi bude moci hrát zhruba šest minut, pokud splní denní kritérium pro výpočet příkladů z  matematiky. Výsledky ukazuje obr. 11.7. Za výchozích podmínek byl počet příkladů, které žáci spočítali správně, buď nízký (Dicky), nebo velmi proměnlivý (Ken a Jimmy). Poté co byl zaveden podmíněný přístup k herním aktivitám, frekvence správně vypočítaných příkladů u všech žáků vzrostla a nakonec i převýšila stanovené kritérium. Premack (1959) vyslovil hypotézu, že posílení ve  formě aktivity se dají identifikovat, jestliže zjistíme rozložení různých projevů chování v  situaci (s volným výběrem operantů). Domníval se, že i projevy chování lze použít jako posílení a  že relativní frekvence určitého chování je důležitým faktorem, který nám pomůže určit, jakou účinnost by mohlo mít jako posílení, pokud ho podmíníme jiným chováním. Premackův princip říká, že možnost zabývat se činností, které se člověk za výchozí situace věnuje s  vysokou relativní četností, bude u  dotyčného působit jako posílení činnosti, jejíž frekvence je u  něj naopak nízká. Například v případě žáka, který tráví mnohem více času sledováním televize než přípravou do školy, lze Premackův princip (známý také pod lidovým názvem „babiččino pravidlo“) uplatnit tak, že dítěti řekneme: „Až budeš mít hotové úkoly, můžeš se dívat na televizi.“ Timberlake a Allison (1974) na Premackův princip navázali a  navrhli hypotézu omezeného operantu (response-deprivation hypothesis). V ní představili model, s jehož pomocí lze predikovat, zda bude přístup k jednomu chování (podmíněné činnosti) účinkovat jako posílení jiného chování (posilovaného operantu), známe-li relativní četnost obou těchto typů chování ve výchozí situaci a  víme-li, jestli je přístup k  podmíněné činnosti nižší než za výchozích podmínek. Autoři této hypotézy předpokládají, že omezený přístup k nějaké činnosti je druhem deprivace, která působí jako EO, což činí z možnosti se touto činností zabývat účinnou formu posílení (Allison, 1993; Iwata a Michael, 1994). Iwata a Michael (1994) uvádějí tři na sebe navazující studie, které provedl Konarski s  kolegy, aby ověřili platnost hypotézy omezeného operantu v praxi. Když dostali žáci z první studie možnost si vymalovávat (chování s vysokou pravděpodobností) v podmíněné závislosti na řešení matematických příkladů (chování s nízkou pravděpodobností), pak se početním úlohám věnovali déle, ale jen v případě, že doba, kterou mohli vybarvováním strávit, byla při režimu posilování kratší než za výchozích podmínek (Konarski, Johnson, Crowell a Whitman, 1980). Výzkumníci zjistili, že mít na  vybarvování více času než ve  výchozí situaci nepředstavovalo pro vypracovávání příkladů z  matematiky účinné posílení. K  analogickým zjištěním dospěli i  v  následující studii, v  níž byla možnost si číst (nebo počítat, podle toho, o jaký subjekt šlo) podmíněna v  prvním případě počítáním a  ve  druhém čtením (Konarski, Crowell, Johnson a  Whitman, 1982). Ve  třetí studii postoupili Konarski, Crowell a  Duggan (1985) s  prověřováním hypotézy omezeného operantu ještě o  krok dále a  zkoumali „reverzibilitu posílení“: zajímalo je, zda může jako posílení Pouze pro studijníúčely. N ešířita nekopírovat. 2 7 2     č á s t 4     Posilování vysoce frekventované aktivity sloužit aktivita málo frekventovaná (ať už čtení, či počítání), pokud k  ní budou mít pokusné osoby omezený přístup. U zkoumaných subjektů, u nichž se stalo takovým omezeným podmíněným operantem čtení, se zvýšila frekvence počítání příkladů jakožto posilovaného operantu; naproti tomu u druhé skupiny žáků vedla snížená možnost počítat k nárůstu čtení. Ve všech třech studiích bylo omezení podmíněného operantu klíčovým faktorem, který rozhodoval o tom, zda bude přístup k  tomuto operantu účinkovat jako posílení. Podle Iwaty a  Michaela (1994) potvrzují souhrnné výsledky uvedených studií tři předpoklady, vyplývající z  hypotézy omezeného operantu. (Vycházejme z  toho, že v  následujících příkladech byl za  výchozího stavu poměr psaní úloh ke  sledování televize 1:2.). • Cílové chování s nízkou četností bude posilováno, jestliže se přístup k podmíněnému chování, jehož četnost je vysoká, sníží pod výchozí úroveň (např. když půlhodina věnovaná domácím úkolům dává subjektu možnost dívat se půl hodiny na televizi). • Chování s nízkou četností posilováno nebude, jestliže se přístup k podmíněnému chování, jehož četnost je vysoká, nesníží pod výchozí úroveň (např. když půlhodina věnovaná domácím úkolům dává subjektu možnost dívat se hodinu a půl na televizi). • Cílové chování s vysokou četností bude posilováno, jestliže se přístup k podmíněnému chování, jehož četnost je nízká, sníží pod výchozí úroveň (např. když půlhodina věnovaná sledování televize dává subjektu možnost dělat si pět minut domácí úlohy). 6.0 5.0 4.0 3.0 2.0 1.0 0 Dicky výchozí podmínky podmíněný přístup správně vyřešené příklady špatně vyřešené příklady 6.0 5.0 4.0 3.0 2.0 1.0 0 Ken (6.9) Početpříkladůzaminutu 6.0 5.0 4.0 3.0 2.0 1.0 0 Jimmy Sezení 5 10 15 20 25 30 (6.3) (6.3) Obrázek 11.7 Počet příkladů, které správně a špatně vypočítali za minutu tři žáci se speciálními vzdělávacími potřebami za výchozích podmínek a při podmíněném přístupu k věcem na hraní. Vodorovná přerušovaná čára označuje stanovené kritérium. Převzato z Contingent Access to Play Materials as an Academic Motivator for Autistic and Behavior Disordered Children M. A. McEvoy a M. P. Bradyho, 1988, Education and Treatment of Children, 11, s. 15. Copyright Editorial Review Board of Education and Treatment of Children 1998. Použito se svolením držitele autorských práv. Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 7 3 Přestože si Iwata a Michael (1994) uvědomují, že praktikové zřídkakdy vytvářejí programy k posilování chování, jako je kupříkladu sledování televize, které už má vysokou frekvenci, poznamenávají, že: Existuje řada případů, kdy je žádoucí silně akcelerovat dosavadní výkon (například učební nebo atletický). V takových případech nemusíme hledat aktivitu s vyšší frekvencí, která by sloužila jako posílení, jestliže je možné vytvořit vhodný deprivační režim u nějaké aktivity, jejíž frekvence je relativně nízká. (s. 186) Tak jako u posílení ze všech ostatních formálních kategorií není ani posilovací účinnost různých aktivit dána předem. Činnost, která působí u jednoho klienta jako funkční posílení, může mít na chování jiného klienta zcela jiný účinek. Ve výše zmíněné studii, kterou provedli Konarski, Crowell a kol. (1982), mělo u tří žáků posilovací účinek na čtení to, že mohli počítat příklady, zatímco u čtyř ostatních zase posilovala možnost si číst řešení matematických příkladů. Před lety krásně vystihl podstatu věci klasický kreslený vtip, zobrazující dva žáky, kteří mají za  úkol umýt po vyučování tabuli a vyprášit houbu. Jeden zde říká druhému: „Ty čistíš houbu za trest?! Já ji můžu vyprášit jako odměnu za to, že jsem si udělal domácí úkol.“ Sociální posílení Fyzický kontakt (objetí, poplácání po  zádech), blízkost druhých (přiblížení jiné osoby, možnost vedle někoho stát nebo sedět), pozornost nebo pochvala jsou příklady faktorů, které často působí jako sociální posílení. U dětí je jednou z nejsilnějších a všeobecně nejúčinnějších forem posílení pozornost dospělých. Skutečnost, že podmíněně závislá sociální pozornost má téměř univerzální posilovací účinky, vedla některé behaviorální analytiky k úvahám o tom, zda by se určité aspekty pozornosti druhých nedaly považovat za nepodmíněné posílení (např. Gewirtz a Pelaez-Nogueras, 2000; Vollmer a Hackenberg, 2001). Prvním, kdo se experimentálně zabýval otázkou, jak pozornost dospělých posiluje chování dětí, byl Montrose M. Wolf. Čtyři na  sebe navazující studie, které navrhl, provedli počátkem šedesátých let minulého století předškolní pedagogové na Ústavu vývoje dítěte Washingtonské univerzity (Allen, Hart, Buell, Harris a  Wolf, 1964; Harris, Johnston, Kelly a  Wolf, 1964; Hart, Allen, Buell, Harris a Wolf, 1964; Johnston, Kelly, Harris a Wolf, 1966). Risley (2005) o těchto studiích napsal: Vzhledem k zásadnímu významu tohoto dlouho známého, ale zřídka využívaného jevu se nyní podrobněji podíváme ještě na jednu studii, která dokládá schopnost podmíněně závislé sociální pozornosti posilovat chování dětí. V  prvním ročníku Journal of Applied Behavior Analysis bylo uveřejněno hned sedm studií navazujících na  pionýrský výzkum Wolfova týmu.8 Autory dvou z nich byl R. Vance Hall s kolegy. Z výzkumu provedeného Hallem, Lundem a Jacksonem (1968) jsme vybrali příklad uvedený na začátku kapitoly, kdy použila pozitivní posilování Robbieho učitelka. Stejně přesvědčivý důkaz toho, že pozornost učitele působí jako sociální posílení, poskytuje též studie Halla, Panyana, Rabona a Brodena (1968). Takový účinek jsme ještě nikdy neviděli! To, jak rychle a silně působily na chování dětí v reálném světě jednoduché úpravy něčeho tak běžného, jako je pozornost dospělých, bylo ohromující. Po čtyřiceti letech vychází ze sociálního posilování (jako je pozitivní komentář, pochvala, „nachytání žáků při žádoucím chování“) většina amerického poradenství a kurzů pro rodiče a učitele – což z něj bezpochyby činí nejvlivnější objev moderní psychologie (s. 280). Jednoho ze tří experimentů, které byly v  rámci této studie uskutečněny, se účastnil čerstvý učitel, vyučující v  šesté třídě, již tvořilo třicet žáků. Jeho žáci tak často vyrušovali a  nedávali pozor, že byla třída podle ředitele školy „zcela nezvladatelná“. V průběhu studie měřili výzkumníci vždy půl hodiny během první hodiny školního dne chování žáků a pozornost učitele. Tato půlhodinová sezení rozdělili do desetivteřinových dílčích úseků, v nichž zaznamenávali, zda se žáci právě učí (píšou si úlohy, dívají se do učebnice, odpovídají na otázku učitele), nebo dělají něco jiného (baví se, nesedí na svém místě, dívají se z okna, strkají do spolužáka nebo se s ním perou apod.). Zároveň v  každém desetivteřinovém úseku zaznamenávali, zda učitel věnuje jejich chování pozornost (pozornost učitele byla definována tím, že na žáka nebo skupinu žáků promluvil). Když takovou reakci pozorovali, poznamenali si buď „+“ (pokud šlo o  následek vhodného chování žáka/žáků), nebo „-“ (v případě odezvy na to, že se žák/žáci neučí). Během výchozí situace činil ve třídě průměrný podíl dílčích časových úseků, v nichž se žáci učili, 44 %. To, že se žák/žáci učí, komentoval učitel v této fázi pokusu průměrně v 1,4 případech za sezení (viz obr. 11.8) „Téměř bez výjimky byly ty [poznámky], které následovaly po  vhodném chování, pochvalné, zatímco ty, 8  První ročník časopisu Journal of Applied Behavior Analysis (1968) je pokladnicí klasických studií, v  nichž vědci pomocí jednoduše a  elegantně uspořádaných pokusů odhalovali silné účinky operantního podmiňování. Každému vážnému zájemci o studium aplikované behaviorální analýzy důtklivě doporučujeme, aby si ho celý přečetl. Pouze pro studijníúčely. N ešířita nekopírovat. 2 7 4     č á s t 4     Posilování které následovaly po  nevhodném chování, měly podobu napomenutí“ (Hall, Panyan a kol., 1968, s. 316). V jednom dni, kdy měl ve třídě ukázkovou hodinu jiný učitel, v ní míra učení dosáhla 90 % (viz body označené šipkou v prvním a druhém poli horního grafu na obr. 11.8). V počáteční fázi experimentu se s učitelem třikrát setkal ředitel školy, aby s ním probral jeho metody a pomohl mu zlepšit neuspokojivou situaci (viz tři body označené šipkami v prvním poli horního grafu). Výsledkem těchto konzultací bylo, že učitel začal psát všechny úkoly na tabuli (po první schůzce) a změnil zasedací pořádek (po třetí schůzce). Tyto změny však neměly na chování žáků žádný patrný vliv. Před započetím posilovací fáze výzkumníci učiteli předložili údaje o  tom, jak se žáci ve  výchozích podmínkách učili a  jak často jim v  této souvislosti věnoval pozornost. Instruovali učitele, aby zvýšil četnost pozitivních reakcí na  žáky ve  chvíli, kdy se zrovna učí. Během posilovací fáze pak učiteli po každém sezení vždy znovu ukázali zjištěné výsledky. V průběhu první fáze posilování se zvýšil průměrný počet učitelových pochval za to, že se žáci učí, na 14,6 za  sezení, a  průměrná míra učení u  žáků ve  třídě činila 72 %. Učitel, ředitel školy a behaviorální analytikové sbírající údaje zaznamenali, že se žáci dají lépe usměrnit a hluk ve třídě se znatelně snížil. Při krátkém opětovném nastolení výchozích podmínek, kdy učitel „téměř vůbec učení neposiloval“, se chování žáků prudce zhoršilo a  vyrušování a hluk při vyučování se zvýšily na původní úroveň. Během druhé posilovací fáze pak učitel žáky chválil průměrně čtrnáctkrát za  sezení a  průměrný podíl dílčích časových úseků, během nichž se žáci věnovali učení, dosáhl 76 %. Identifikace potenciálních posílení V laboratoři jsme se naučili používat jednoduchý test: položíte si na otevřenou dlaň bonbon, ukážete ho dítěti, sevřete ruku v pěst a čekáte, jestli se bude dítě snažit rozevřít vám prsty, aby se k bonbonu dostalo. Pokud se o to pokouší, i když svíráte prsty stále pevněji, je bonbon evidentně posílením. (Murray Sidman, 2000, s. 75) 100 80 60 40 20 0 Procentočasustrávenéhoučením výchozí podmínky 5 10 15 20 25 30 35 40 45 50 55 první fáze posilování1 návrat k výchozím podmínkám druhá fáze posilování2 následné kontroly 40 20 0 5 10 15 20 25 30 35 40 45 50 55 Sezení Početučitelovýchpochval zato,žesežák/žáciučí Obrázek 11.8 Míra učení a četnost učitelových pochval za učení u žáků z problematické šesté třídy. Výchozí podmínky = podmínky před zahájením experimentálních postupů; první fáze posilování = zvýšení učitelovy pozornosti v reakci na to, že se žák/ žáci učí; návrat k výchozím podmínkám = snížení učitelovy pozornosti v reakci na to, že se žák/žáci učí, na původní úroveň; druhá fáze posilování = opětovné zvýšení učitelovy pozornosti v reakci na to, že se žák/žáci učí. Následné kontroly probíhaly 20 týdnů po ukončení druhé posilovací fáze. Převzato z Instructing Beginning Teachers in Reinforcement Procedures Which Improve Classroom Control R. V. Halla, M. Panyana, D. Rabona a M. Brodena, 1968, Journal of Applied Behavior Analysis, 1, s. 317. Copyright Society for the Experimental Analysis of Behavior, Inc. Použito se svolením držitele autorských práv. Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 7 5 U mnoha programů modifikace chování je podmínkou úspěšnosti nalezení účinného posílení, jímž se dá manipulovat. Naštěstí je identifikace takových posílení u většiny klientů poměrně snadná. Sidman (2000) popsal rychlou a jednoduchou metodu, jak určit, zda bude bonbon pravděpodobně účinkovat jako posílení. Každé potenciální posílení si však do dlaně vzít nemůžeme. U studentů s těžkými kombinovanými postiženími bývá identifikace robustních, spolehlivých posílení náročný úkol. Třebaže mnohá běžná posílení mají víceméně univerzální účinnost (pochvala, hudba, volný čas, žetony), nemusí tyto stimuly působit jako posílení u každého. Kdyby měly plánované intervence ztroskotat, protože praktik použil předpokládané, ale nikoli skutečné posílení, znamenalo by to ztrátu času, energie a prostředků, které byly do programu vloženy. Preference posílení se také časem mění. Dočasný charakter preferencí je opakovaně zmiňován v literatuře (Carr, Nicholson a Higbee, 2000; DeLeon a kol., 2001; Kennedy a Haring, 1993, Logan a Gast, 2001; Ortiz a Carr, 2000; Roane, Vollmer, Ringdahl a Marcus, 1998). Mapování preferencí se bude lišit v závislosti na  věku dané osoby, její zájmové úrovni, denní době, sociálních interakcích s vrstevníky a přítomnosti určitých etablujících operací (EO) (Gottschalk, Libby a Graff, 2000, viz obr. 6.8). Otázky, které učitel položí při zjišťování preferencí v září, bude možná muset znova položit v říjnu; podobně může terapeut zjistit, že stimul, který klient při dopoledním rozhovoru označil za  posílení, nepovažuje během odpoledního sezení za preferovaný. Na základě analýzy třinácti publikovaných studií, v nichž byly hodnoceny preferované stimuly a jejich posilovací účinnost u  lidí s  těžkými kombinovanými postiženími, Logan a Gast (2001) dospěli k závěru, že preferované stimuly vždy nepůsobí jako posílení a že stimuly preferované v určitém okamžiku později preferovány být nemusejí. Navíc bývají lidé s těžkými vývojovými vadami mnohdy aktivní jen tak omezenou dobu, že je u nich obtížné nějakému podnětu jednoznačně přiřknout roli posílení. Aby tyto problémy překonali, vyvinuli výzkumníci a praktikové ABA celou řadu postupů, které slouží k mapování preferovaných stimulů a k mapování posilovací účinnosti stimulů. Obojí mapování se často provádí po sobě, jak to popisují Piazza, Fisher, Hagopian, Bowman a Toole (1996): Při mapování preferencí se hodnotí poměrně velké množství podnětů, mezi nimiž se hledají preferované stimuly. Malý podsoubor vysoce preferovaných stimulů pak prochází hodnocením svých posilovacích účinků. Mapování preferencí je sice efektivní metoda identifikace potenciálních posílení z velkého množství stimulů, nehodnotí však posilovací účinky těchto stimulů. (s. 1-2) Při mapování preferovaných stimulů se identifikují podněty, které pravděpodobně působí jako posílení, a poté následuje mapování jejich posilovací účinnosti pomocí přímého testování: jsou prezentovány v závislosti na určitém chování a měří se jejich účinky na četnost tohoto chování. V tomto oddílu si popíšeme různé metody používané k mapování preferovaných stimulů a posilovací účinnosti stimulů (viz obr. 11.9). Všechny dohromady tvoří plynulou škálu, sahající od přístupů jednoduchých a rychlých až ke složitějším a časově náročnějším. Osobní dotazování Dotazování se lidí důležitých v klientově životě Výběr z několika nabízených možností Pozorování v přirozené situaci Pozorování v aranžované situaci Metoda jednoho stimulu Metoda dvou stimulů Metoda více stimulů Střídavé posilování Přechodné posilování se vzrůstajícími požadavky na počet odpovědí Souběžné posilování Dotazování se Pozorování v situaci s volným výběrem operantů Pokusné metody Mapování preferovaných stimulů Mapování posilovací účinnosti stimulů Obrázek 11.9 Identifikace potenciálních posílení mapováním preferovaných stimulů a posilovací účinnosti stimulů. Pouze pro studijníúčely. N ešířita nekopírovat. 2 7 6     č á s t 4     Posilování Mapování preferovaných stimulů Jako mapování preferovaných stimulů (stimulus preference assessment) se označují různé postupy používané ke zjišťování (a) stimulů, jež daná osoba preferuje, (b) relativní preferenční hodnoty těchto stimulů (vysoká preference versus nízká preference) a (c) podmínek (jako jsou požadavky na výkon, deprivační stavy nebo aplikace nějakého posilovacího režimu), za nichž se tyto preferenční hodnoty mění. Mapování preferovaných stimulů se v podstatě provádí ve dvou krocích: (1) identifikuje se velké množství stimulů, které by mohly účinkovat jako posílení, a (2) tyto stimuly se systematicky prezentují cílové osobě, aby se výběr zúžil na podněty, u nichž je vysoká pravděpodobnost, že budou mít posilovací účinek. Konkrétně slouží k  mapování preferovaných stimulů tři základní metody: dotazování se cílové osoby (nebo lidí důležitých v jejím životě), které podněty upřednostňuje; pozorování dané osoby v  situaci, kdy má volný přístup k  nejrůznějším předmětům; a  měření odezvy dotyčného člověka na pokusně prezentované podněty. Při výběru vhodné metody musí praktikové najít rovnováhu mezi dvěma protikladnými přístupy: (a) získat maximum údajů o preferencích v co nejkratší době, ale bez falešně pozitivních výsledků, nebo (b) provést časově náročnější a pracnější mapování, které sice zdrží intervenci, zato poskytne spolehlivější údaje. Dotazování se na preferované stimuly Chceme-li zjistit něčí preferované stimuly, můžeme se jednoduše vyptat, co má dotyčný rád. Dotazování dokáže významně ušetřit čas, jenž mapování preferovaných stimulů vyžaduje, a často při něm získáme informace, které lze využít při intervenčním programu. Dá se k němu přistoupit několika způsoby: dotazovat se cílové osoby, vyptat se lidí důležitých v jejím životě nebo dát studentovi na výběr z několika možností. Dotazování se cílové osoby. Přímou metodu, s  jejíž pomocí se lze dozvědět, jaké stimuly cílová osoba preferuje, představuje osobní dotazování. Většinou k němu používáme otevřené otázky, výběrové otázky nebo seznam různých stimulů, jehož položky klient řadí podle oblíbenosti. • Otevřené otázky. Mapování preferovaných stimulů pomocí otevřených otázek se provádí ústní nebo písemnou formou – záleží na klientových jazykových schopnostech. Otázky můžeme směřovat k posílením, která dotyčný upřednostňuje v rámci jednotlivých kategorií: Co rád děláte ve svém volném čase? Jaká jsou vaše oblíbená jídla a nápoje? Líbí se vám nějaký hudební styl nebo konkrétní hudební interpreti? Další možností je klienta prostě požádat, aby vyjmenoval co nejvíc oblíbených činností či věcí. Tento výčet by neměl obsahovat jen každodenní stimuly, ale i aktivity a předměty, které nejsou tak běžné. Na obr. 26.6 můžete vidět ukázku formuláře s očíslovanými řádky, kam členové rodiny vepisují, čím by chtěli být odměněni za splnění úkolů. • Výběrové otázky. Tyto otázky mohou znít například následovně: „Co byste chtěl dostat za vynaložení velké námahy? Dal byste přednost nějaké sladkosti, jako jsou bramborové lupínky, sušenky nebo popkorn, nebo byste chtěl mít možnost něco dělat – třeba vytvořit něco vlastníma rukama, hrát počítačové hry, jít do knihovny?“ (Northup, George, Jones, Broussard a Vollmer, 1996, s. 204). • Řazení stimulů podle oblíbenosti. Klient obdrží seznam stimulů a je požádán, aby je seřadil od nejpreferovanějšího k nejméně preferovanému. U lidí s omezenými jazykovými dovednostmi můžeme používat obrázky stimulů, ikonky nebo ideálně stimuly samotné. Učitel například ukáže na  ikonku a zeptá se: „Máš rád džus, videohry, ježdění autobusem, nebo koukání na televizi?“ Žák vždy pouze přikývne, nebo zavrtí hlavou. U  žáků se dají k  mapování preferencí využít i  předpřipravené dotazníkové šablony. Učitelé základních škol mají například k dispozici Child Reinforcement Survey, obsahující 36 odměn ve čtyřech kategoriích: jedlé odměny (ovoce, popkorn apod.), hmotné odměny (např. nálepky), činnosti (umělecké projekty, počítačové hry atd.) a  sociální pozornost (např. pochvala od učitele nebo kamaráda) (Fantuzzo, Rohrbeck, Hightower a Work, 1991). Pro žáky od  čtvrté do  dvanácté třídy je určen School Reinforcement Survey Schedule (Holmes, Cautela. Simpson, Motes a  Gold, 1998), pro lidi s  těžkým postižením Reinforcement Assessment for Individuals with Severe Disabilities (Fisher, Piazza, Bowman a Amari, 1996). Osobní dotazování je poměrně jednoduchá metoda, na druhé straně však nezaručuje, že podnět, který klient označí za  preferovaný, bude později sloužit jako posílení. „Už dlouho je známo a mnohokrát bylo potvrzeno, že mezi tím, co o sobě člověk vypoví, a  jeho pozdějším chováním je pouze malá shoda“ (Northup, 2000, s. 335). Dítě například Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 7 7 uvede, že preferuje sledování kreslených filmů; tento stimul ale účinkuje jako posílení jen v sobotu dopoledne, když je doma, nikoli už v  neděli večer u babičky. Podobně je tomu u rozlišování vysoce preferovaných a málo preferovaných stimulů. Northup (2000) zjistil u dětí s poruchou pozornosti s hyperaktivitou (ADHD), že mezi údaji o preferencích poskytnutých při osobním dotazování a výsledky pozdějšího mapování posilovací účinnosti preferovaných stimulů není větší shoda, než by odpovídalo náhodě. „Poměrně vysoký počet falešně pozitivních výsledků a  nízký počet výsledků falešně negativních znovu vypovídá o  tom, že při dotazníkových šetřeních jsou patrně přesněji identifikovány podněty, které nemají posilovací účinnost, než ty, které ji mají“ (s. 337). Zeptáme-li se dětí na preference pouze jednou, může se stát, že získáme falešně pozitivní výsledky (tj. děti určí jako posílení nějaký stimul, který ve skutečnosti posílením není). Dotazování se lidí důležitých v klientově životě. Informace o  mnoha potenciálních posíleních můžeme získat od lidí, kteří jsou cílové osobě nablízku. Rodiče, sourozenci, kamarádi nebo pečovatelé dokážou jmenovat aktivity, předměty, pokrmy, záliby nebo hračky, které dotyčný preferuje. Dotazník RAISD (Reinforcer Assessment for Individuals with Severe Disabilities) je například adresovaný pečovatelům: vyplňují v něm, jaké upřednostňuje klient zrakové, sluchové, čichové, jedlé, hmatové a sociální stimuly (Fisher a  kol., 1996). Vybrané podněty potom seřadí na základě toho, nakolik jsou podle nich preferovány, a nakonec uvedou, za jakých podmínek by mohly účinkovat jako posílení (např. sušenky s mlékem, nebo jen samotné sušenky). I tady platí, že stimuly označené jako vysoce preferované nemusí mít posilovací účinek, nicméně často jako posílení opravdu působí. Výběr z několika nabízených možností. V tomto případě praktik klienta požádá, aby si zvolil odměnu, jakou za provedení úkolu chce. Dá mu na vybranou ze dvou nebo ze tří možností (Piazza a kol., 1996). Všechny nabízené stimuly musejí být předtím vyhodnoceny jinými mapovacími metodami jako preferované. Učitel například řekne: „Robyn, až spočítáš příklady do matematiky, můžeš hrát deset minut s Martinem lodě, číst si, nebo pomáhat paní Lewisové s přípravou nástěnky o zvířatech v zimě. Co z toho bys chtěla?“ Následek zvolený klientem přitom nemusí být nutně účinnějším posílením než následek, který vybere behaviorální analytik (Smith, Iwata a Shore, 1995). Pozorování cílové osoby v situaci s volným výběrem operantů Činnosti, kterými člověk stráví nejvíc času, jestliže si je může zvolit z  více možností, často slouží jako účinné posílení těch činností, jimiž se naopak dobrovolně zabývá jen málo. Sledování osoby v době, kdy má neomezený přístup k nejrůznějším aktivitám, se označuje jako pozorování v  situaci s  volným výběrem operantů. Při tomto pozorování se zaznamenává celková doba, již člověk jednotlivým činnostem věnuje. Čím je tato doba delší, tím větší je pravděpodobnost, že je daný operant preferovaný. V  situaci s  volným výběrem operantů nejsou kladeny žádné požadavky na počet odpovědí. Všechny předměty potřebné k  příslušným aktivitám jsou umístěny tak, aby na ně student viděl a měl je na dosah, a po celou dobu pozorování zůstávají na místě. Podle Ortize a Carra (2000) jsou lidé v situaci s volným výběrem operantů méně náchylní k nevhodnému chování, než když se vybrané stimuly odstraňují. Situace se svobodnou volbou operantů, v níž klienta pozorujeme, může být aranžovaná, nebo přirozená. Pozorování v  aranžované situaci s  volným výběrem operantů operantů. Praktici aranžované pozorování využívají k hodnocení toho, zda, kdy, jak a v jaké míře je pozorovaná osoba v kontaktu s předměty a aktivitami, které byly předem vybrány. Toto pozorování probíhá v prostředí obohaceném o různé předměty, které by mohly klienta zaujmout. Při pozorování v  aranžované situaci s  volným výběrem operantů se předpokládá, že má zkoumaná osoba dostatek času prozkoumat prostředí a jednotlivé stimuly v něm. Těsně předtím, než s pozorováním začneme, poskytneme klientovi krátký kontakt se všemi připravenými stimuly. Všechny stimuly jsou následně umístěny viditelně tak, aby na ně klient snadno dosáhnul. Klient má příležitost si mezi stimuly volně vybírat. Pozorovatelé zaznamenávají celkovou délku kontaktu s jednotlivými předměty a aktivitami. Pozorování v  přirozené situaci s volným výběrem operantů. V  tomto případě se mapování provádí v klientově běžném prostředí (na hřišti, ve třídě, doma). Co nejméně rušivě klienta pozorujeme a  zaznamenáváme, kolik času věnuje jednotlivým činnostem. Na  obr. 11.10 můžeme například vidět tabulku, která ukazuje, mezi jaké aktivity dělí ve všední den svůj čas náctiletý Mike během dvou hodin odpoledního volna. Záznamy vedli Mikeovi rodiče: každý den do  tabulky zapisovali celkový počet minut, který jejich syn tou kterou činností strávil. Z týdenního souhrnu je patrné, že Mike hrál Pouze pro studijníúčely. N ešířita nekopírovat. 2 7 8     č á s t 4     Posilování každý den videohry, díval se na televizi a telefonoval si s kamarády. Ve dvou různých dnech si deset minut četl knihu a ve středu si chvilku hrál s novou stavebnicí. Nejčastějšími a nejdéle trvajícími činnostmi u něj bylo sledování televize a hraní videoher. Kdyby chtěli Mikeovi rodiče pomocí Premackova principu prodloužit dobu, kterou jejich syn tráví čtením nebo stavěním z kostek (tj. chováním s nízkou pravděpodobností), mohli by u něj sledování televize nebo hraní videoher podmínit tím, že si bude určitou dobu číst nebo hrát se stavebnicí. Pokusné metody Při mapování preferencí pokusnými metodami (trial-based method) prezentujeme postupně cílové osobě různé stimuly a  zaznamenáváme její reakci. Měřítkem preferenční hodnoty podnětů jsou tři typy chování: přiblížení, přímý kontakt (DeLeon a Iwata, 1996) a interakce (DeLeon, Iwata, Conners a Wallace, 1999; Hagopian, Rush, Lewin a Long, 2001; Roanne a kol., 1998). Jako přiblížení se označuje jakýkoli detekovatelný pohyb směrem ke stimulu (člověk se na něj podívá, otočí k němu hlavu, skloní se k němu, vztáhne po  něm ruku). Přímým kontaktem rozumíme, že se člověk předloženého stimulu dotkne nebo ho vezme do ruky. U interakce pak měříme dobu (buď celkovou, nebo stanovíme procentuální podíl sledovaných časových úseků), během níž se podnětem aktivně zabývá (např. si přiloží masážní přístroj na nohu). Vychází se z předpokladu, že čím více času jedinec těmito typy chování stráví, tím spíš daný stimul upřednostňuje. Jak uvádějí DeLeon a  kol. (1999): „Doba kontaktu s  předmětem je validním ukazatelem jeho posilovací hodnoty“ (s. 114). Někdy se preferované stimuly dělí podle výše uvedeného měřítka na stimuly s vysokou preferencí (high-preferrence, HP), jimž dává pozorovaná osoba přednost v  75 a  více procentech, se střední preferencí (medium preferrence, MP) a  nízkou preferencí (low-preferred, LP) (Carr, Nicolson a  Higbee, 2000; Northup, 2000; Pace, Ivancic, Edwards, Iwata a Page, 1985; Piazza a  kol., 1996). Nevysloveným, nicméně ověřitelným předpokladem je, že vysoce preferovaný stimul bude účinkovat jako posílení. I když všichni tento předpoklad nesdílejí (Higbee, Carr, Harrison, 2000), osvědčil se jako dobrý výchozí bod. Četné varianty pokusného mapování preferencí lze podle způsobu prezentace stimulů rozdělit na metodu jednoho stimulu, metodu dvou stimulů a metodu mnoha stimulů. Metoda jednoho stimulu. Metoda jednoho stimulu (single stimulus), nazývaná též metoda „postupného výběru“ (successive-choice method), je nejzákladnější technikou mapování preferencí. Prezentace podnětů po jednom „je zvlášť vhodná u lidí, kteří mají potíže s výběrem ze dvou či více stimulů“ (Hagopian a kol., 2001, 477). Postupně jsou klientovi v náhodném pořadí předkládány stimuly ze všech oblastí smyslového vnímání (zrakové, sluchové, vestibulární, hmatové, čichové, chuťové, a multisenzorické (Logan, Jacobs a kol., 2001; Pace a  kol., 1985). Analytik zaznamenává výskyt odpovědi (zda byla odezva na  příslušný stimul kladná, nebo odmítavá) a frekvenci odpovědi (např. počet dotyků za minutu) nebo její délku (např. dobu interakce s  podnětem). Cílové osobě kupříkladu dáme zrcátko a do záznamu uvedeme, jak dlouho se do něj dívala či se ho dotýkala, případně že ho odmítla (odhodila). Každý předmět by měl být prezentován několikrát, a to pokaždé v jiném pořadí. Metoda dvou stimulů. U metody dvou stimulů (paired stimuli), někdy též označované jako „metoda nucené volby“, prezentujeme vždy dva stimuly zároveň a  zaznamenáváme, který z  nich si klient vybral. Postupujeme tak, že ke  každému stimulu náhodně přiřazujeme všechny ostatní stimuly, které jsou v nabídce (Fisher a kol., 1992). Získané údaje nám ukážou, Obrázek 11.10 Počet minut, které Mike strávil různými činnostmi během dvou hodin volného času v době po vyučování. Činnost Po Út St Čt Pá Celkem Čtení – 10 – 10 – 20 Sledování TV 35 50 60 30 30 205 Telefonování s kamarády 15 15 10 20 10 70 Hraní videoher 70 45 40 60 80 295 Hra se stavebnicí – – 10 – – 10 Sledovaná doba v min. 120 120 120 120 120 600 Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 7 9 kolikrát dala zkoumaná osoba každému ze stimulů přednost. Pak podněty seřadíme podle toho, zda jsou vysoce, středně nebo málo preferované. Pace a  kol. (1985) zjistili, že prezentace dvou stimulů umožňuje přesněji rozlišit mezi těmi, které jsou preferované vysoce a které málo, než předkládáme-li pokaždé jen jeden předmět. Metoda dvou stimulů někdy přináší lepší výsledky než prezentace jednoho stimulu co do počtu identifikovanýchposílení(Paclawskyja Wollmer,1995). Protože u  této mapovací metody je třeba prezentovat veškeré dvojice, které lze z celkové nabídky podnětů sestavit, může si vyžádat víc času než společné předkládání všech stimulů najednou (viz níže). DeLeon a  Iwata (1996) však tvrdí, že tento postup může být nakonec časově efektivnější, jelikož „konzistentnější výsledky, které metoda dvou stimulů poskytuje, nasvědčují tomu, že umožňuje zjistit stabilní preference s  použitím menšího počtu sezení, nebo i jen jednoho“ (s. 520). Metoda mnoha stimulů. Prezentace mnoha stimulů (multiple stimuli), metoda vyvinutá Fisherem a kol. (1992), vznikla rozšířením postupu dvou stimulů. Klient dostává na výběr ze tří nebo více podnětů (Windsor, Piche a Locke, 1994). Společná prezentace většího počtu stimulů je velmi časově úsporná. Chceme-li například zmapovat preference u šesti stimulů, předložíme je klientovi všechny zároveň, zatímco použití metody dvou stimulů by vyžadovalo postupně prezentovat všech patnáct dvojic, které se dají z šesti stimulů sestavit. Mapování preferencí touto metodou se provádí dvěma základními způsoby: s  nahrazováním stimulů a bez nahrazování stimulů. V prvním případě zůstává předmět, který si klient vybere, stále v nabídce a ostatní jsou nahrazeny jinými. U prezentace mnoha stimulů bez nahrazování se zvolený objekt z nabídky vyřadí a u zbývajících podnětů se obmění pořadí či konstelace. Nezávisle na tom, kterou z obou metod použijeme, začíná vždy prezentace otázkou „Co z toho byste chtěl nejvíc?“ (Higbee a  kol., 2000) nebo pobídkou „Vyberte si jednu věc!“ (Ciccone, Graff a  Ahearn, 2005). Tak pokračujeme, dokud nezbude poslední předmět. Obyčejně celý postup několikrát opakujeme, přestože někdy stačí k identifikaci posílení jediný pokus (Carr a kol., 2000). K  prezentaci můžeme používat samotné předměty, jejich obrázky nebo slovní popis. Higbee, Carr a Harrison (1999) srovnávali výsledky získané metodou mnoha stimulů, jestliže při ní použili samotné objekty, nebo jejich obrázky. Při prezentaci předmětů samotných byly zjištěny větší rozdíly mezi preferencemi než při předkládání obrázků. Cohen-Almeida, Graff a Ahearn (2000) zjistili, že mapování preferencí s využitím reálných objektů je zhruba stejně účinné, jako když jsou dané objekty slovně popsány, ale s použitím verbálního popisu trvá kratší dobu. DeLeon a  Iwata (1996) navrhli upravenou verzi metody mnoha stimulů, zvanou rychlé mapování preferovaných stimulů. U tohoto rychlého mapování se čas potřebný ke zjištění preferencí snižuje tím, že jakmile si student nějaký podnět vybere, je z nabídky odstraněn (metoda bez nahrazování stimulů, jak o ní píšeme výše). U každé další prezentace je tudíž v celkové nabídce, z níž má na výběr, o jeden předmět méně (Carr a kol., 2000; DeLeon a kol., 2001; Roanne a kol., 1998). DeLeon a Iwata (1996) zjistili, že při prezentaci mnoha stimulů bez nahrazování trvá identifikace preferovaných podnětů přibližně poloviční dobu oproti postupu, kdy se vyřazené předměty nahrazují. Higbee a kol. (2000) uvádějí, že „Rychlé mapování preferovaných stimulů je metoda, která dává praktikům možnost identifikovat posílení jak účinně, tak přesně“ (s. 72-73). Pokyny k mapování preferovaných stimulů Analytikové mohou při mapování preferencí kombinovat metodu jednoho stimulu a dvou stimulů, dvou stimulů a  mnoha stimulů, pozorování cílové osoby v  situaci s volným výběrem operantů a  nějakou pokusnou metodu a  podobně (Ortiz a  Carr, 2000). V  běžné praxi je vhodné provést několik pokusů k rychlému zmapování preferovaných stimulů a pak porovnat jejich výsledky, čímž se zkrátí doba potřebná k identifikaci posílení, takže je můžeme dříve použít k intervenci. Obecným cílem mapování preferencí je zjistit, jaké stimuly budou s největší pravděpodobností účinkovat jako posílení. Každá z  mapovacích metod má v tomto směru své výhody a limity (Roane a  kol., 1998). Při mapování preferovaných podnětů mohou být pro analytiky užitečné následující pokyny (DeLeon a  Iwata, 1996; Gottschalk a  kol., 2000; Higbee a kol., 2000; Ortiz a Carr, 2000; Roane a kol., 1998; Roscoe, Iwata a Kahng, 1999): • Sledujte aktivity studenta v době před sezením, abyste věděli, jaké EO by mohly ovlivnit výsledky mapování. • Vybírejte mapovací metody tak, abyste rychlé mapování, které však může dávat falešně pozitivní výsledky, vyvážili časově náročnějšími, zato přesnějšími postupy. • Mapovací metodu určující pořadí stimulů podle preferenční hodnoty kombinujte s takovou, která míru preference nerozlišuje, ale při níž se klient dostává do častějšího Pouze pro studijníúčely. N ešířita nekopírovat. 2 8 0     č á s t 4     Posilování kontaktu se stimuly, abyste zabránili zkreslení dat. • Pokud máte málo času, proveďte rychlé mapování preferencí s nižším počtem stimulů v celkové nabídce. • Je-li to možné, kombinujte údaje získané rychlým mapováním preferovaných stimulů s údaji poskytnutými jinými metodami (jako je dotazování se cílové osoby a lidí důležitých v jejím životě, pozorování klienta v situaci s volným výběrem operantů, výběr z několika nabízených možností, jiný druh pokusné metody atd). Mapování posilovací účinnosti stimulů Jediný způsob, jak zjistit, zda daný faktor je, či není pro daný organismus za daných podmínek posilující, je provedení přímého testu. (B. F. Skinner, 1953, s. 72-73) Vysoce preferované stimuly nemusejí pokaždé působit jako posílení (Higbee a kol., 2000); ani bonbon, který se dítě v  Sidmanově testu snaží vydrápnout experimentátorovi z ruky, za určitých podmínek jako posílení účinkovat nemusí. Na druhé straně mohou za jistých podmínek nabývat posilovacích účinků i  nejméně preferované stimuly (Gottschalk a  kol., 2000). Jediný způsob, jak se s jistotou dozvědět, zda daný stimul slouží jako posílení, spočívá v tom, že ho prezentujeme bezprostředně po  proběhnutí daného operantu a zaznamenáváme, jaké má účinky na jeho výskyt v budoucnu. Mapování posilovací účinnosti stimulů je termín označující metody, při nichž prezentujeme jeden nebo více stimulů v závislosti na cílové odpovědi a pak měříme jeho/jejich účinky na frekvenci této odpovědi. Výzkumníci a praktikové ABA tyto metody vyvinuli, aby mohli zjišťovat, jaké účinky bude mít potenciální posílení v různých podmínkách nebo jak se bude za určitého nastavení podmínek lišit posilovací účinnost různých podnětů. K mapování posilovací účinnosti stimulů se často používá režim souběžného posilování, režim střídavého posilování a přechodné režimy posilování se vzrůstajícími požadavky na počet odpovědí.9 9  Těmito a dalšími druhy posilovacích režimů a jejich účinky na chování se zabývá kapitola 13. Mapování posilovací účinnosti stimulů pomocí režimu souběžného posilování O režimu souběžného posilování (concurrent schedule of reinforcement) mluvíme tehdy, jestliže pomocí dvou nebovícena soběnezávislýchdílčíchrežimůsouběžně posilujeme dva nebo více operantů. Pokud používáme souběžné posilování k mapování posilovací účinnosti stimulů, v podstatě proti sobě stavíme dva podněty, abychom porovnali jejich účinnost: ten z nich, který povede k  většímu nárůstu frekvence odpovědí, bude-li prezentován jako jejich následek, představuje účinnější posílení. Můžeme tak například zjišťovat relativní účinnost vysoce preferovaných (HP) a málo preferovaných (LP) stimulů coby posílení (Koehler, Iwata, Roscoe, Rolider a O´Steen, 2005; Piazza a kol., 1996). Roscoe a  kol. (1999) použili režim souběžného posilování k porovnání posilovacích účinků HP a LP stimulů u  osmi dospělých s  mentálním postižením. Zavedení posilovacího režimu předcházelo mapování preferencí; jako stimuly byly použity různé pochutiny. Cílovými operanty bylo zmáčknutí jednoho ze dvou spínacích panelů odlišné barvy. Poté co se účastníci studie naučili ovládat spínací panely a měli možnost zjistit, jaký následek jim každý z obou operantů přinese, byla zahájena počáteční fáze. Během ní nevedlo zmáčknutí ani jednoho z panelů k získání posílení (výchozí podmínky). Následovala fáze posilování, kdy byl na talíř za jedním panelem pokládán HP stimul a na talíř za druhým panelem LP stimul. Při každém zmáčknutí student ihned dostal sladkost na talířku za příslušným panelem (jednalo se o posilovací režim označovaný jako FR 1, u něhož následuje posílení po každém výskytu cílové odpovědi). U  většiny pokusných osob, které v  rámci výše popsaného režimu dostaly na  výběr mezi posíleními, převažovalo mačkání na panel s navazujícím HP stimulem (viz např. výsledky u Seana, Petera a Matta na obr 11.11). Když měli však později titíž lidé možnost získat jako posílení pouze LP stimul (mačkat jenom jeden panel), zvýšila se u nich frekvence cílového operantu oproti výchozím podmínkám podobně, jako tomu bylo předtím při souběžném posilování u operantu, po němž následoval HP stimul. Ze studie Roscoe a kol. (1999) tak vyplývá, že použijeme-li režim souběžného posilování, abychom porovnali posilovací účinky více stimulů, nemusí získané výsledky vypovídat o absolutní účinnosti zkoumaných podnětů. V takových případech může být LP stimul nesprávně vyhodnocen jako neúčinný coby posílení. Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 8 1 Obrázek 11.11 Počet odpovědí za minutu při režimu souběžného posilování dvěma stimuly a režimu posilování jedním stimulem u čtyř dospělých s mentálním postižením. Převzato z Relative versus Absolute Reinforcement Effects: Implications for Preference Assessments E. M. Roscoea, B. A. Iwaty a S. Kahnga, 1999, Journal of Applied Behavior Analysis, 32, s. 489. Copyright Society for the Experimental Analysis of Behavior, Inc., 1999. Použito se svolením držitele autorských práv. Mapování posilovací účinnosti stimulů pomocí režimu střídavého posilování U  režimu střídavého posilování (multiple schedule of reinforcement) působí vždy na  jeden operant jeden ze dvou nebo více dílčích posilovacích režimů. Každý dílčí režim provází po celou dobu, kdy probíhá, určitý diskriminační stimul (SD ). Jedna z  možností, jak střídavé posilování použít k mapování posilovací účinnosti stimulů, je prezentovat daný podnět v rámci jednoho dílčího režimu po každém výskytu cílové odpovědi a v rámci druhého dílčího režimu ve fixní době (tj. nezávisle na odpovědi). Kdyby chtěl například analytik zjistit, zda sociální pozornost účinkuje jako posílení, mohla by být dětem během jednoho dílčího režimu věnována pozornost pokaždé, když budou spolupracovat při hře, zatímco během druhého dílčího režimu by se jim dostávalo stejné pozornosti, ale jen v určité stanovené době, nezávisle na tom, zda spolu při hře kooperovaly. Učitelka by třeba při dopoledním hraní vždy aplikovala posilování závislé na chování a při odpoledním pak posilování na chování nezávislé. Jestliže by měla sociální pozornost posilovací účinky, děti by spolu pravděpodobně začaly při dopoledních hrách více spolupracovat, zatímco odpoledne by si hrály stejně jako předtím. Uvedený posilovací režim obsahuje všechny prvky střídavého posilování: jeden operant (kooperativní hra), dvojí nastavení podmínek posilování (závislé na  chování a nezávislé na chování) a diskriminační stimul, jímž se vyznačuje působení každého z obou dílčích režimů (dopolední a odpolední doba). Mapování posilovací účinnosti stimulů pomocí přechodných režimů se vzrůstajícími požadavky na počet odpovědí Provádíme-li mapování posilovací účinnosti stimulů pomocí režimu s nízkým požadavkem na počet odpovědí, jako je FR 1, můžeme získat zkreslené výsledky. Někdy se totiž posilovací účinnost zkoumaného podnětu projeví teprve tehdy, když je prezentován po vyšším počtu odpovědí (např. když musí žák při režimu FR 10 vypočítat deset příkladů, aby si zasloužil posílení). Jak uvádějí DeLeon, Iwata, Goh a Worsdell (1997): Současné mapovací metody mohou být nepřesné při predikci účinnosti posílení, jestliže je úkol, který student provádí v rámci intervenčního programu, posilován teprve po větším množství odpovědí nebo po dosažení vyššího výkonu. … U některých tříd stimulů mohou při souběžném zvyšování nároků na posílení nabývat na významu drobné rozdíly preferencí, které zůstávají při nízkých požadavcích nerozpoznány. V takových případech neposkytne mapování preferovaných stimulů pomocí režimu s nízkými požadavky na počet odpovědí (FR 1) přesnou predikci relativní účinnosti posílení, jestliže nároky na počet odpovědí vzrostou. (s. 440, 446) K  překonání tohoto problému se používají přechodné posilovací režimy se vzrůstajícími požadavky na počet odpovědí (progressive-ration schedule of reinforcement). Při aplikaci takového režimu soustavně, nezávisle na chování klienta, zvyšujeme počet odpovědí nutných k prezentaci stimulu, až dosáhneme zlomového bodu a  frekvence odpovědi začne klesat (Roane, Lerman a  Vorndran, 2001). Nejprve například 10 8 6 4 2 0 Souběžné posilování dvěma stimuly BL Sr+ BL Sr+ Posilování jedním stimulem Sean 5 10 15 20 25 30 35 HP LP 10 8 6 4 2 0 Souběžné posilování dvěma stimuly BL Sr+ BL Sr+ Posilování jedním stimulem Peter 10 15 205 25 10 8 6 4 2 0 Souběžné posilování dvěma stimuly BL Sr+ BL Sr+ Posilování jedním stimulem Matt 10 155 20 10 8 6 4 2 0 Souběžné posilování dvěma stimuly BL Sr+ Mike 10 155 20 Sezení Početodpovědízaminutu Pouze pro studijníúčely. N ešířita nekopírovat. 2 8 2     č á s t 4     Posilování poskytujeme posilovací stimul při každém výskytu cílové odpovědi (FR 1), pak při každé druhé odpovědi (FR 2), při každé páté (FR 5), desáté (FR 10) a dvacáté odpovědi (FR 20). V určité chvíli mnohdy preferovaný stimul svoji posilovací schopnost ztratí (Tustin, 1994). DeLeon a  kol. (1997) kupříkladu použili u  dvou dospělých s mentálním postižením, Elaine a  Ricka, přechodný režim souběžného posilování se vzrůstajícími požadavky na počet odpovědí k tomu, aby porovnali účinnost dvou podobných stimulů (např. sušenky a krekru) a dvou rozdílných stimulů (např. nápoje a balonku) coby posílení dvou operantů: zmáčknutí modrého panelu a zmáčknutí žlutého panelu. Za každý z obou panelů experimentátoři umístili talířek, na který vždy položili předmět sloužící jako posílení. Při každé prezentaci (u  Ricka jich bylo 24 za  sezení a  u  Elaine 14 za sezení) zmáčkla pokusná osoba jeden ze dvou panelů a hned nato získala příslušný předmět. Po režimu FR 1, použitém v první fázi studie, následovaly režimy se stále vyššími nároky na počet operantů nutných k získání předmětu na talířku (FR 2, FR 5, FR 10 a FR 20). Oba rozdílné stimuly volili Elaine i  Rick ve  fázi FR 1 zhruba stejně často; to se nezměnilo, ani když se požadovaný počet zmáčknutí postupně zvyšoval (viz dva horní grafy na obr. 11.12). Naproti tomu u dvou podobných stimulů, u nichž byla předchozím mapováním určena přibližně stejná preferenční hodnota (brambo- rovélupínkyversuspreclíkyv případěElainea sušenky versus krekry u Ricka), se při režimu se vzrůstajícími požadavky na množství odpovědí projevil jasný a setrvalý rozdíl v preferencích (viz dva dolní grafy na obr. 11.12). U  Elaine začalo převažovat mačkání na  panel vedoucí k získání bramborových lupínků; Rick dával jednoznačně přednost sušenkám před krekry. Zvyšování nároků na počet odpovědí v rámci režimu souběžného posilování také umožňuje zjistit, zda a  za  jakých podmínek jsou dvě posílení navzájem nahraditelná. Pokud plní dvě posílení stejnou funkci (tj. jejich účinnost je dána toutéž etablující operací) a u jednoho z nich požadavek na počet odpovědí vzroste, pak se spotřeba tohoto posílení sníží, je-li k dispozici nějaké jiné, které ho dokáže nahradit (Green a Freed, 1993). DeLeon a kol. (1997) vysvětlují 14 12 10 8 6 4 2 0 5 10 15 20 30 40 4525 35 Elaine FR 1 FR 2 FR 5 FR 10 FR 20 FR 1 nápoj balonek 24 20 16 12 8 4 0 5 10 15 20 30 40 4525 35 Rick FR 1 FR 2 FR 5 FR 10 FR 20 sušenka masážní přístroj 5 10 15 20 30 40 4525 35 Elaine FR 1 FR 2 FR 5 FR 10 FR 1 bramborový lupínek preclík 14 12 10 8 6 4 2 0 24 20 16 12 8 4 0 5 10 15 20 30 40 4525 35 Rick FR 1 FR 2 FR 5 FR 10 sušenka krekr Početzvolenýchposílení Sezení Obrázek 11.12 Počet zvolených posílení při přechodném režimu souběžného posilování u dvou dospělých s mentálním postižením. Převzato z Emergence of Reinforcer Preference as a Function of Schedule Requirements and Stimulus Similarity I. G. DeLeona, B. A. Iwaty, H. Goha a A. S. Worsdella, 1997, Journal of Applied Behavior Analysis, 30, s. 444. Copyright Society for the Experimental Analysis of Behavior, Inc., 1997. Použito se svolením držitele autorských práv Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 8 3 výsledky znázorněné na  obr. 11.12 pomocí analogie s  hypotetickou osobou, která mírně upřednostňuje Coca-Colu před Pepsi: Za předpokladu, že láhev Coca-coly a Pepsi je k dostání za jeden dolar a člověk má kokakolu jen o trochu radši, bude každou z nich volit víceméně stejně často, možná v závislosti na časté saturaci preferovaným nápojem, celkově však bude kokakola v jeho výběru mírně převažovat. Nyní si představme, že cena obou nápojů vzroste na pět dolarů. Při podobném zvýšení ceny se u daného člověka patrně projeví preference kokakoly. Naproti tomu kdyby měl na výběr mezi kokakolou a žetony na autobus, výsledky by byly nejspíš odlišné. Jestliže by obojí stálo jeden dolar, podle očekávání by znovu volil mezi oběma možnostmi zhruba půl na půl, pokud bychom předpokládali, že jim etablující operace momentálně propůjčuje stejnou hodnotu. Tyto dva stimuly však plní zcela rozdílné funkce a nejsou vzájemně nahraditelné; vymění-li náš člověk jeden za druhý, nebude dál se stejnou četností dosahovat funkčně srovnatelného posílení. Pravděpodobně nezačne žádné z posílení upřednostňovat, ani když se obě výrazně zdraží. Totéž se dá říct o výsledcích předložené studie. Když si člověk vybíral mezi dvěma nahraditelnými sladkostmi, jako je sušenka a krekr, a u obou se nároky na jejich získání současně zvýšily, mohlo ho to „přimět“, aby dal najevo mírnou preferenci jednoho z nich. Když však byla posílení, která by se dala jen těžko vzájemně nahradit, jako je sušenka a masážní přístroj, dostupná zároveň a stejně preferovaná, měl narůst nároků na jejich získání na preferenci jen malý vliv. (s. 446-447). Třebaže stimul X a  stimul Y oba účinkují jako posílení, stačí-li k jejich poskytnutí splnění nízkého požadavku na výkon nebo na počet odpovědí, může se stát, že si klienti při zvýšení některého z těchto požadavků začnou vybírat pouze stimul Y. DeLeon a kol. (1997) poukazují na to, že praktikové, kteří si tyto souvislosti uvědomují, nebudou automaticky předpokládat, že v měnících se podmínkách prostředí zůstanou preference stejné jako na začátku, a budou při poskytování posílení postupovat uvážlivě. Bývá totiž vhodnější šetřit si některé typy preferovaných stimulů na později, až se požadavky na jejich prezentaci zvýší, než používat je místo jiných, stejně preferovaných podnětů v době, kdy jsou tyto nároky nízké. Kontrolní zkoušky pozitivního posilování Kontrolní zkoušky pozitivního posilování (control procedures for positive reinforcement) se provádějí pomocí metod, při nichž poskytujeme potenciální posílení a sledujeme, jak se to projeví na frekvenci příslušného chování. Cílem kontrolní zkoušky je experimentální důkaz, že prezentace následku v  závislosti na  výskytu cílové odpovědi působí jako pozitivní posílení této odpovědi. Při kontrolní zkoušce porovnáváme četnost odpovědi v  režimu bez podmíněně závislého posilování a  v  režimu podmíněně závislého posilování a poté prokazujeme, že přechodem z jednoho režimu na druhý se dá příslušné chování zapnout a  vypnout nebo zesílit a  zeslabit (Baer, Wolf a  Risley, 1968). Behaviorální analytikové používají od začátku ke kontrolním zkouškám pozitivního posilování především reverzní metodu s vyhasínáním. Je to postup založený na dvojím nastavení podmínek a minimálně čtyřech fázích (ABAB). V první fázi cílové chování průběžně měříme v režimu bez posilování (A), dokud se nestabilizuje. Režim bez posilování představuje kontrolní podmínky. Ve  druhé fázi zahájíme podmíněně závislé posilování a měřením cílového chování zjišťujeme, jaké má účinky. Režim podmíněně závislého posilování (B) představuje experimentální podmínky. Poté co se zvýší četnost odpovědi, vrátíme se opět k  režimu A  (třetí fáze) a  pak znovu k režimu B (čtvrtá fáze), abychom mohli určit, zda změna režimu zapíná a vypíná cílovou odpověď. Vyhasínání odpovědi během reverzní fáze, při opětovném nastavení kontrolních podmínek, s sebou ovšem nese praktické a koncepční problémy. Za prvé se mohou po přerušení posilování objevit vedlejší účinky vyhasínání (počáteční nárůst četnosti odpovědi, emoční reakce, agrese atd. – viz kapitola 21), které ovlivňují výsledky kontrolní zkoušky. Za druhé jsou situace, kdy není možné posilování zcela ukončit (Thompson a Iwata, 2005). Nelze kupříkladu očekávat, že by mohl učitel v režimu bez posilování žákům úplně přestat věnovat pozornost. Kromě toho Thompson a Iwata (2005) dále uvádějí, že: Ačkoli bývá vyhasínání často úspěšné, pokud jde o ústup behaviorálních účinků pozitivního posilování, jeho použití ke kontrolní zkoušce přináší interpretační potíže. Při vyhasínání se v podstatě nedá dostatečně oddělit podmíněně závislé posilování jakožto proměnná kontrolující cílovou odpověď, protože nemůžeme vyloučit, že tento účinek má i pouhá prezentace stimulu. (s. 261, zvýrazněno dodatečně) Pouze pro studijníúčely. N ešířita nekopírovat. 2 8 4     č á s t 4     Posilování Podle Thompson a Iwaty (2005) „je ideální taková kontrolní zkouška pozitivního posilování, u níž je eliminován podmíněný vztah mezi výskytem cílové odpovědi a prezentací stimulu a při níž kontrolujeme pouze účinky prezentace stimulu“ (s. 259). Hodnotí, jakou účinnost mají jako kontrolní zkoušky pozitivního posilování tři varianty výše uvedené reverzní metody: s posilováním nezávislým na chování (NCR), s diferencovaným posilováním jiného chování (DRO) a s diferencovaným posilováním alternativního chování (DRA).10 Posilování nezávislé na chování Posilování nezávislé na chování (noncontingent reinforcement, NCR) spočívá v  prezentaci posílení bez ohledu na výskyt cílového chování, a to buď ve fixní době (fixed-time, FT), nebo ve variabilní době (variable time, VT). Poskytování potenciálního posílení nezávisle na odpovědi eliminuje podmíněný vztah mezi cílovou odpovědí a prezentací následku, a tak umožňuje zjišťovat, jaké účinky má prezentace následku samotná. NCR tudíž splňuje kritéria ideální kontrolní zkoušky, jak je stanovili Thompson a Iwata (2005). Reverzní metoda s NCR sestává minimálně z pěti fází (ABCBC). A jsou výchozí podmínky, B je režim NCR, kdy je potenciální posílení poskytováno ve fixní nebo variabilní době nezávisle na cílovém chování (kontrolní podmínky), a  C je režim, u  něhož je následek prezentován v závislosti na výskytu cílového chování (experimentální podmínky). Podmínky B a C jsou pak znovu vystřídány ve čtvrté a páté fázi, aby se zjistilo, zda je četnost odpovědi kontrolována následkem, jenž je na ní podmíněně závislý. Kvalita, množství a četnost posílení by měly být v režimu B i C přibližně stejné. Při použití reverzního schématu využívajícího NCR dochází často k perzistenci chování. To je patrně způsobeno náhodným posilováním, které se někdy objevuje při prezentaci posílení nezávisle na odpovědi; nebo mohou perzistentní chování navozovat podobné etablující operace a  antecedentní podmínky. Ať už je příčinou cokoli, představuje perzistence chování nevýhodu této metody, jelikož prodlužuje dobu potřebnou k  dosažení reverzního účinku (poklesu četnosti odpovědi) ve srovnání s klasickou metodou založenou na vyhasínání. 10   O ABAB, NCR, DRO a DRA jako o metodách používaných ve výzkumu s jedním zkoumaným subjektem ke kontrolním zkouškám pozitivního posilování pojednává kapitola 8. Diferencované posilování jiného chování Při diferencovaném posilování jiného chování (differential reinforcement of other behavior, DRO) aplikuje analytik posílení vždy, když se cílové chování ve stanoveném časovém úseku nedostaví. Reverzní metodu s DRO tvoří minimálně pět fází (ABCBC): A jsou výchozí podmínky, B je režim, u něhož prezentujeme následek v závislosti na výskytu cílového chování (experimentální podmínky), a C je režim DRO, u něhož se potenciální posílení uděluje v závislosti na absenci cílového chování (kontrolní podmínky). Podmínky B a C pak znovu vystřídáme ve čtvrté a páté fázi, abychom zjistili, zda je četnost odpovědi kontrolována následkem, jenž je na ní podmíněně závislý. Schéma obsahující DRO umožňuje nepřerušovat v reverzních fázích podmíněně závislé posilování a  dále v  něm pokračovat. Použijeme-li ke  kontrolní zkoušce tuto metodu, dosáhneme reverzního účinku za kratší dobu než s pomocí NCR. Důvodem zřejmě je, že u DRO není cílové chování vystaveno náhodnému posilování. Diferencované posilování alternativního chování O diferencované posilování alternativního chování (differential reinforcement of an alternative behavior, DRA) se jedná tehdy, jestliže je posílení prezentováno v závislosti na výskytu žádoucí alternativy cílového chování.11 Reverzní metoda s DRA má minimálně pět fází (ABCBC): A jsou výchozí podmínky, B je režim, u  něhož je potenciální posílení aplikováno v  závislosti na  výskytu cílového chování (experimentální podmínky), a C je režim DRA, u něhož je poskytováno v závislosti na výskytu alternativního chování (kontrolní podmínky). Podmínky B a C se pak znovu vystřídají ve čtvrté a páté fázi, aby bylo možné určit, zda je četnost odpovědi kontrolována následkem, jenž je na ní podmíněně závislý. Thompson a  Iwata (2005) shrnují úskalí, která jsou s používání DRO a DRA ke kontrolním zkouškám pozitivního posilování spojena: [U DRO a DRA] zavádíme novou podmíněnou závislost, která v původním experimentálním uspořádání nebyla. Vzhledem k tomu lze připsat snížení frekvence cílové odpovědi v reverzních podmínkách buď (a) skončení podmíněné závislosti mezi cílovou odpovědí 11   V kapitole 22 se dočtete o DRO a DRA jako o intervenčních metodách, které slouží ke snižování frekvence nežádoucího chování. Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 8 5 a posílením, nebo (b) zavedení podmíněné závislosti mezi absencí cílové odpovědi nebo výskytem konkurenční odpovědi a posílením. Kromě toho, protože během reverzní fáze poskytujeme posílení v závislosti na nějakém znaku chování, bývá obtížné udržet míru jeho prezentace napříč experimentálními i kontrolními podmínkami. Pokud se rychle nesníží frekvence cílové odpovědi (DRO) nebo se adekvátně nezvýší frekvence odpovědi vedoucí k posílení (DRA), může být četnost posílení v kontrolních podmínkách ve srovnání s experimentálními nízká. Jestliže k tomu dojde, pak je tento reverzní přístup funkčně podobný klasickému postupu s vyhasínáním. (s. 267) Při uvažování nad reverzní metodou s  vyhasínáním a jejími třemi variantami nakonec Thompson a  Iwata (2005) dospěli k  závěru, že nejdůkladnější a nejméně problematickou metodou k ověření účinků pozitivního posilování je NCR. Jak provádět posilování efektivně Předkládáme praktikům devět pokynů, jejichž dodržování jim umožní používat pozitivní posilování efektivně. Tyto pokyny vycházejí ze tří hlavních zdrojů: z výzkumu věnovaného experimentální analýze chování, ze studií aplikované behaviorální analýzy a z našich osobních zkušeností. Na začátku stanovte kritérium pro posílení tak, aby bylo snadno splnitelné Častou chybou, jíž se praktikové dopouštějí, je stanovení příliš náročného počátečního kritéria pro poskytnutí posílení. Z toho důvodu pak chování, které chceme ovlivnit, na  posílení nedosáhne. Má-li být posilování efektivní, je třeba nastavit dané kritérium tak, aby se první klientovy odpovědi dostaly s posílením do kontaktu. Teprve spolu s tím, jak se chování zlepšuje, náročnost kritéria postupně zvyšujeme. Obr. 11.3 představuje metodu stanovení počátečního kritéria založenou na výchozím výkonu klienta, jak ji navrhl Heward (1980). VZORCE PRO STANOVENÍ POČÁTEČNÍHO KRITÉRIA PRO POSÍLENÍ U chování, jehož frekvenci chceme zvýšit: průměrný výchozí výkon < počáteční kritérium ≤ nejvyšší výchozí výkon U chování, jehož frekvenci chceme snížit: průměrný výchozí výkon > počáteční kritérium ≥ nejnižší výchozí výkon PŘÍKLADY Cílové chování Cíl modifikace Nejnižší výchozí výkon Nejvyšší výchozí výkon Průměrný výchozí výkon Rozmezí pro výběrpočátečního kritéria Doba samostatné hry zvýšit 2 minuty 14 minut 6 minut 7–14 minut Rozpoznávání písmen v abecedě zvýšit 4 písmena 9 písmen 5 písmen 6–9 písmen Počet dokončených cviků zvýšit 0 22 8 9–22 Procento správně vyřešených příkladů zvýšit 25 % 60 % 34 % 40–60% Počet překlepů v jednom dopise snížit 16 28 22 16–21 Množství kalorií přijatých za den snížit 2,260 3,980 2,950 2,260–2,900 Převzato z A Formula for Individualizing Initial Criteria for Reinforcement W. L. Hewarda, 1980, Exceptional Teacher, 1(9), s. 8. Copyright Exceptional Teacher 1980. Použito se svolením držitele autorských práv. Obrázek 11.13 Několik příkladů, jak použít údaje o studentově výchozím výkonu ke stanovení počátečního kritéria pro posílení. Pouze pro studijníúčely. N ešířita nekopírovat. 2 8 6     č á s t 4     Posilování U chování, jehož frekvenci si přejete zvýšit, nastavte počáteční kritérium tak, aby bylo vyšší než průměrný výchozí výkon dítěte a nižší nebo stejně vysoké jako jeho nejlepší výchozí výkon. U chování, jehož frekvenci chcete snížit, by mělo být počáteční kritérium pro posílení nastaveno níže než průměrný výchozí výkon dítěte a výše nebo stejně vysoko jako jeho nejnižší (nejlepší) výchozí výkon. (s. 7) Posilujte vysoce funkčními posíleními v dostatečné míře Posílení, která udržují žádoucí frekvenci jednoduchých behaviorálních odpovědí, nebývají vždy tak účinná, pokud jde o obtížnější či delší úkony. U chování vyžadujícího více úsilí nebo výdrže bude patrně zapotřebí posílení s vyšší funkčností. Jako vysoce funkční posílení někdy účinkuje stimul zvolený při mapování preferencí coby silně preferovaný. Neef a kolegové (1992) například zjistili, že u chování posilovaného méně často, zato vysoce funkčním posílením, frekvence narůstá, zatímco frekvence chování posilovaného častěji méně funkčním posílením klesá. Funkčnost posílení je ovlivňována též jinými následky studentova chování, které na něj právě působí. V  aplikované behaviorální analýze používáme pojem míra posilování, jež je definována jako (a) doba, po kterou trvá prezentace daného posílení, (b) počet posílení za jednotku času (tj. frekvence posílení) nebo (c) intenzita poskytovaného posílení. Zvyšování míry posilování může korelovat se zvyšováním jeho účinnosti. Zatím toho však o této korelaci mnoho nevíme, protože „jen málo aplikovaných studií se věnuje účinkům míry posilování na frekvenci odpovědi při režimu s jedním operantem“ (Lerman, Kelly, Vorndran, Kuhn a LaRue, 2002, s. 30). Při rozhodování o tom, jakou míru posilování použít, bychom se měli řídit maximou: „Posilujte vydatně, ale nevystřílejte hned veškerou munici.“ Je na místě míru posilování vhodně vyvážit s funkčností zvoleného posílení a s tím, kolik úsilí musí klient vynaložit na generování cílové odpovědi. Obměňujte posílení, abyste udrželi účinnost etablujících operací S častým používáním mnohdy posílení ztrácejí na své účinnosti. Prezentujeme-li určité posílení v nadměrné míře, bývá jeho momentální účinnost nižší v důsledku saturace. Pokud například působí jako posílení četba konkrétní knihy o  sportu a  učitel se uchyluje pouze k tomuto posílení, může nakonec čtení knížky o  svou posilovací schopnost přijít. Na  druhé straně mají posílení silnější účinek, jestliže k nim znovu sáhneme poté, co jsme je nějakou dobu nepoužívali. Jestliže učitelka zjistí, že „být první ve v řadě“ je posílení, a používá ho jen jednou za týden, bude to mít větší posilovací efekt, než kdyby žáky pouštěla na první místo v řadě častěji. Vliv saturace tak můžeme minimalizovat tím, že posílení obměňujeme. Střídáním posílení lze dosáhnout toho, aby působily jako posílení i méně preferované stimuly. Bowman a kol. (1997) kupříkladu zjistili, že u některých studentů přináší lepší výsledky použití různých méně preferovaných stimulů než nepřetržité působení jediného, byť více preferovaného podnětu. Obměňování posílení udržuje také účinnost všech používaných posílení na vyšší úrovni. V Egelově studii (1981) byli žáci při řešení úkolů úspěšnější tehdy, pokud mohli získat jedno ze tří náhodně zvolených posílení, než v případě, kdy bylo konstantně prezentováno vždy jen jedno z nich. I v rámci sezení mohou učitelé žáky nechat, aby si vybrali různá posílení z více nabízených možností. Obdobně dokáže prodlužovat dobu, během níž je posílení účinné, i změna nějakého znaku tohoto posílení. Pokud slouží jako posílení komiksy, jejich posilovací účinnost zůstane spíše zachována, budeme-li schopni žákům nabídnout několik různých komiksových žánrů. Dávejte přednost přímému posilování před nepřímým, je-li to možné O přímém posilování mluvíme tehdy, jestliže generování cílové odpovědi vede samo o sobě k posílení, aniž by ho musel někdo zprostředkovat. U nepřímého posilování je naproti tomu zapotřebí, aby praktik posílení prezentoval. Thompson a Iwata (2000), stejně jako někteří jiní, ztotožňují přímé posilování s automatickým a nepřímé posilování s posilováním zprostředkovaným další osobou. Výsledky svého výzkumu, věnovaného osvojování behaviorální odpovědi za pomoci přímého a nepřímého posilování, shrnují následovně: U obou druhů posilování mělo splnění téhož úkolu (otevření nádoby určitého typu) za následek stejné posílení. Při přímém posilování byl předmět sloužící jako posílení vložen do nádoby, kterou bylo třeba otevřít; při nepřímém posilování držel tento předmět terapeut a dával ho klientovi poté, co nádobu otevřel. Jedna účastnice výzkumu prováděla tento úkon se 100% přesnosti ihned po zahájení posilování, přímého i nepřímého. Tři účastníci vykazovali buď rychlejší odezvu, nebo výraznější zlepšení výkonu při přímém posilování. U dvou zbývajících jedinců došlo ke zlepšení výkonu jen při přímém posilování. Údaje o „irelevantním“ chování (např. natáhnutí se k posílení místo provedení úkolu), Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 8 7 objevujícím se při nepřímém posilování, nasvědčují tomu, že se toto chování mohlo křížit s cílovou odpovědí a jeho výskyt byl funkcí diferencované kontroly stimulem. (s. 1) Je-li to možné, měli by praktikové vždy dávat přímému posilování přednost, obzvlášť u  studentů s omezeným repertoárem chování. Kombinujte posilování s prompty Prompty jsou doplňkové antecedenty, používané jako podněty ke  generování správné odpovědi v  přítomnosti diskriminačního stimulu, který nad chováním nakonec přebírá kontrolu. Behaviorální analytikové aplikují prompty před proběhnutím cílového chování nebo v jeho průběhu. Třemi hlavními druhy promptů jsou slovní instrukce, modelování a fyzické prompty. U  slovní instrukce využíváme toho, že popis podmíněné závislosti často působí jako motivující operace, takže zvyšuje pravděpodobnost, že se student dostane s  posílením rychleji do  kontaktu. Mayfield a Chase (2002) například vysokoškolským studentům vysvětlili podmíněnou závislost, kterou používali, aby u nich posílili osvojení pěti základních algebraických pravidel. Použité postupy byly účastníkům studie na začátku popsány formou všeobecných instrukcí. Účastníci výzkumu dostávali za každou správnou odpověďpeníze a za špatné odpovědi nebyli penalizování. Na test navazovalo pokaždé sezení, kde obdrželi záznam o tom, kolik si při testu celkově vydělali. To byla jediná zpětná vazba, z níž se mohli dozvědět, jak si v testech vedli (s. 111) Bourret, Vollmer a Rapp (2004) používali slovní instrukce při hodnocení repertoáru vokálních mandů u tří jedinců s autismem. Všechna sezení k hodnocení vokalizací sestávala z deseti pokusů, které trvaly jednu minutu. Deset vteřin po zahájení pokusu byl vždycky účastník výzkumu pobídnut nespecifickým promptem [popisem podmíněné závislosti]. Po dvaceti vteřinách od začátku následoval prompt modelující úplný cílový projev (např. „Pokud to chceš, řekni „brambůrkaˋ “). Třicet vteřin po začátku pokusu byl účastník promptován, aby řekl alespoň první foném cílové odpovědi (např. „Pokud to chceš, řekni „bˋ “). S prompty se důkladněji seznámíte v kapitole 17, kde se dozvíte o konkrétních postupech, jak je kombinovat s posilováním, a najdete další příklady používání slovní instrukce, modelování a fyzických promptů. Zpočátku posilujte každý výskyt žádoucí odpovědi Během fází, kdy studenta učíte novému chování, aplikujte posílení při každém výskytu cílové odpovědi (nepřetržité posilování continuous reinforcement). Jakmile si klient chování osvojí, začněte postupně intervaly mezi posíleními prodlužovat a přejděte k občasnému posilování (tj. k režimu, kdy už se posílení neuděluje pokaždé, když se žádoucí chování dostaví, ntermittent reinforcement). Učitel například ze začátku prezentuje posílení vždy, když žák správně rozpozná paměťové slovo* vytištěné na kartičce, a pak odstupy mezi posíleními úměrně prodlužuje. K upevnění čerstvě naučené odpovědi poskytněte posílení vždy po dvou správných odpovědích z  několika pokusů, pak vždy po  čtyřech správných odpovědích atd. Hanley a  kol. (2001) postupovali tak, že postupně nahradili posilovací režim založený na fixních úsecích dlouhých 1 sekundu (při režimu založeném na časových úsecích fixní délky se posiluje první výskyt cílové odpovědi po uplynutí pevně stanovené doby) posilovacími režimy, u nichž prodloužili fixní úsek (fixed interval, FI) na 2 s, pak 4 s, 8 s, 16 s, 25 s, 35 s, 46 s a nakonec 58 s. V konečné etapě tak posílili vždy první cílovou odpověď po  uplynutí 58 sekund. Více informací o používání nepřetržitého a občasného posilování najdete v kapitole 13. *Paměťová slova (anglicky sight words) jsou slova, která si čtenář dokáže pamatovat jako celek a rozpozná je pouhým pohledem, aniž by je musel číst. (Pozn. překl.) Používejte podmíněně závislou pozornost a popisnou pochvalu Jak už jsme zmínili, působí u mnoha lidí jako výrazné posílení sociální pozornost a pochvala. Zlepšení chování poté, co ho někdo ocenil, však mnohdy nevzniká jen na základě posilování nebo není vůbec dáno přímým posilovacím účinkem takového stimulu. Michael (2004) v této souvislosti rozebírá častou koncepční chybu, jíž se dopouštíme tím, že považujeme zvýšenou frekvenci chování, které vyvolalo pozornost a sklidilo pochvalu, za důsledek posilování. Vezměte si běžné použití popisné pochvaly, kdy zareagujeme nějakým obecným projevem uznání (úsměvem spolu s komentářem jako „Dobrá práce!“) a kromě toho též stručně popíšeme chování, které chválíme („Líbí se mi, jak děláš…!“) Pokud takto pochválíme člověka s normální úrovní jazykových schopností staršího pěti nebo šesti let, bude to patrně účinkovat jako druh poučení o zákonitosti nebo instrukce, asi jako bychom řekli: „Jestli chceš, abych tě pořád chválil, musíš…“ Vedoucí Pouze pro studijníúčely. N ešířita nekopírovat. 2 8 8     č á s t 4     Posilování v továrně například přijde k zaměstnanci, který čistí podlahu od vylitého oleje, zeširoka se usměje a řekne: „Georgi, opravdu si cením toho, že tu louži utíráš, než do ní někdo šlápne. Je to od tebe velmi ohleduplné.“ Předpokládejme nyní, že od té doby George zem vždycky utře, když se na ni něco vylije – což je dost velká změna chování na to, že by k ní došlo v důsledku jediného posílení. Dá se usuzovat, že pochvala nezapůsobila jako pouhé posílení, nýbrž jako druh poučení o zákonitosti nebo instrukce, jímž se George z různých důvodů řídí pokaždé, když uvidí něco rozlitého (s. 164-165, zvýrazněno v originále). Goetz a Baer (1973) zkoumali popisnou pochvalu v rámci studie zabývající se účinky učitelovy pochvaly na kreativní hru předškoláků se stavebními kostkami. „Učitel vždy nadšeně řekl, když dítě umístilo a/nebo přemístilo kostky tak, že vznikla stavba, jaká se předtím na sezení neobjevila: … „To je moc krásné – je to něco jiného!ˋ)“ (s. 212). Výzkumu se účastnily tři čtyřleté dívenky. V každé fázi, v níž byla použita podmíněně závislá popisná pochvala, se zvýšila rozmanitost tvarů, které holčičky z  kostek postavily. Autoři studie ovšem nezjišťovali, do jaké míry se zlepšení výkonu u dívek dá připsat posílení v podobě pozitivní pozornosti („To je moc krásné!“) a do jaké míry poskytnuté zpětné vazbě („Je to něco jiného!“), z níž si mohly odvodit zákonitost, kterou se potom řídily (“Když se z kostek staví různé věci, upoutá to učitelovu pozornost.“) Goetz a Baer se domnívají, že: U některých dětí bude [posilující pozornost nebo popisná pochvala] sama o sobě stačit, zatímco u jiných bude účinnější kombinace jich obou. Je-li tomu tak, je patrně u dětí obecně nejlepší metodou, když při praktické aplikaci pozitivní pozornost a popisnou pochvalu spojíme (s. 216). Považujemeza vhodnézačleňovatpozornosta pochvalu do každého intervenčního programu s pozitivním posilováním, pokud nemá praktik údaje o tom, že by byly u konkrétního klienta kontraproduktivní. Prodlužujte postupně prodlevu mezi odpovědí a posílením Výše jsme doporučili, aby praktikové zpočátku posilovali každý výskyt cílové odpovědi a pak začali dobu mezi posíleními prodlužovat. Protože se však posílení, která udržují naše chování, v přirozených podmínkách často nedostavují ihned, Stromer, McComas a  Rehfeldt (2000) upozorňují, že „aplikace nepřetržitých a občasných režimů je jen prvním krokem k programování následků tak, aby odpovídaly každodenním situacím. Behaviorální analytik musí též časem přejít od okamžité prezentace posílení, zpravidla nezbytné při počátečním osvojování nového chování, k delším intervalům mezi odpovědí a posilujícím stimulem. Chování vedoucí k posílením s pozdějším nástupem je v každodenním životě vysoce adaptivní, ale jeho zavádění a udržování je obtížné“ (s. 359).12 K  postupům, s  jejichž pomocí praktikové ABA svým klientům pomáhají, aby se naučili na  posílení s  pozdějším nástupem efektivně reagovat, patří například: (a) pozvolné prodlužování intervalu mezi odpovědí a posílením (Dixon, Rehfeldt a Randich, 2003; Schweitzer a  Sulzer-Azaroff, 1988); (b) postupné zvyšování požadavků na  výkon během prodlevy mezi odpovědí a posílením (Dixon a Holcomb, 2000); (c) nějaká činnost během této prodlevy, která slouží jako „přemostění mezery“ mezi projevem daného chování a posílením (Mischel, Ebbesen a Zeiss, 1972); a (d) verbální ujištění, že se posílení po nějaké době dostaví: například „Na kalkulačce uvidíš, kolik peněz budeš mít uložených na  svém spořicím účtu. Ty jednou všechny dostaneš.“ (Neef, Mace a  Shade, 1993, s. 39). Používání následků s  pozdějším nástupem ke generalizaci a udržení modifikovaných projevů chování se podrobněji věnujeme v kapitole 28. 12   Někdy se považuje za prostředek prodlužování intervalu mezi odpovědí a posílením i přechod od nepřetržitého posilování k posilování občasnému (např. Alberto a Troutman, 2006; Kazdin, 2001). S „posíleními s pozdějším nástupem“ však režimy občasného posilování nepracují, pokud to není konkrétně uvedeno. Ačkoli jsou u  těchto režimů posilovány jen některé akty cílového chování (viz kapitola 13), je posílení vždy prezentováno bezprostředně poté, co proběhnou v požadovaném počtu. Tak například u režimu založeného na posilování fixního počtu odpovědí FR 10 následuje posílení bezprostředně po každém desátém výskytu cílové odpovědi. Jako prodleva mezi odpovědí a posílením se pak označuje doba, která uběhne mezi každou desátou odpovědí a poskytnutím posílení (např. 45 sekund). Pouze pro studijníúčely. N ešířita nekopírovat. k a p i t o l a 1 1    Pozitivní posilování    2 8 9 Postupně přejděte od přidaných posílení k posílením, k nimž dochází přirozeně Tuto kapitolu uzavřeme výňatkem ze zasvěceného a  inspirativního článku Murraye Sidmana (2000), v  němž líčí, co se naučil v  „prvních dnech“, kdy se behaviorální principy začaly používat u lidí. Když popisuje projekt z let 1965 až 1975, zaměřený na pozitivní posilování u chlapců od šesti do dvaceti let, kteří byli diagnostikováni jako mentálně postižení a  žili ve státní instituci, vzpomíná na to, jak se po zavedení žetonů coby zobecněných podmíněných posílení stala později silným posílením pochvala od lidí zapojených do projektu a nakonec i samotné učení: Začali jsme s žetony, které měly tu výhodu, že byly viditelné a dalo se s nimi snadno manipulovat. Později, když se chlapci naučili si žetony ukládat a rozumět číslům, jsme mohli zavést bodování. U některých jsme nakonec body nahradili penězi. Když kluci viděli, jakou máme radost, že dostali žetony a body, které jim přinesou jiná posílení, začala pro ně být důležitá i naše radost, a mohli jsme začít používat jako posílení pochvalu. Jak toho uměli pořád víc, mnozí z nich zjistili, že díky tomu, co se naučili, mohou efektivněji vstupovat do stále se zvětšujícího okolního světa. Pro ty se stalo posilujícím učení samo. (s. 19) Schopnost ovlivnit okolní prostředí může být konečným přirozeným posílením. Jak řekl Skinner (1989),totosilnéposílení„nenítřebapřidávatkvůli poučení; nesouvisí s žádným konkrétním typem chování, a proto je vždy dostupné. Říkáme mu úspěch.“ Shrnutí Definice a charakter pozitivního posilování 1. Pozitivní posilování je definováno dvoučlennou podmíněnou závislostí: bezprostředně po behaviorální odpovědi zapůsobí nějaký stimul, v důsledku čehož se zvýší výskyt podobných odpovědí v budoucnu. 2. Změně stimulu, která zapříčiní nárůst frekvence odpovědí, se říká posílení. 3. Je třeba klást zásadní důraz na  to, aby posílení následovalo ihned po odpovědi. I prodleva trvající jen jednu sekundu může zamýšlený účinek snížit, protože posílení zpevní to chování, které je mu časově nejblíž. 4. U člověka bychom neměli účinky dlouhodobých následků na  chování přičítat přímému vlivu posilování. 5. Někteří zastávají mylný názor, že posilování je pojem definovaný kruhem. Definice kruhem je druh logického omylu, u něhož je příčina zaměňována za  následek a  je s  ním ztotožněna. Posilování však není pojem definovaný kruhem, poněvadž jeho dvě složky, chování a  posílení, lze od sebe oddělit a posílením manipulovat tak, aby se zjistilo, zda zvyšuje frekvenci operantu, po němž následuje. 6. Kromě toho, že zvyšuje budoucí frekvenci chování, po němž následuje, posilování též mění funkci antecedentních stimulů. Antecedent, jenž navozuje určitouodpověď,protožejekorelováns následkem, který ji posiluje, se nazývá diskriminační stimul. 7. Diskriminovaný operant je definován trojčlennou podmíněnou závislostí SD → R → SR+ . 8. Momentální účinnost posílení je vždy závislá na aktuální míře motivace, která je s ním spjata. Etablující operace (EO) (např. deprivace) aktuální účinnost posílení zvyšují; aboliční operace (AO) (např. saturace) aktuální účinnost posílení snižují. 9. Kompletně popsaná podmíněná závislost u pozitivního posilování diskriminovaného operantu je čtyřčlenná: EO → SD → R → SR+ . 10. Automatičnost posilování znamená, že k  tomu, aby došlo k posílení, není nutné, aby člověk chápal vztah mezi svým chováním a posílením nebo si ho byl vůbec vědom. 11. Posílení zpevní jakékoli chování, které mu těsně předchází; k tomu, aby došlo k posílení, není nutná žádná logická souvislost nebo souvislost spočívající v adaptaci jedince na prostředí. 12. To, že se při posilování ve fixní době, bez ohledu na chování subjektu, často vyvine pověrčivé chování, je dokladem skutečnosti, že posilováním může být selektováno libovolné chování. 13. Při automatickém posilování vytváří chování své vlastní posílení, aniž by je museli zprostředkovávat druzí. Pouze pro studijníúčely. N ešířita nekopírovat. 2 9 0     č á s t 4     Posilování Klasifikace posílení 14. Nepodmíněnáposíleníjsoustimuly,kteréúčinkují jako posílení, aniž by s nimi jedinec získal nějakou předchozí zkušenost. Protože nepodmíněná posílení vznikají na  základě fylogenetického vývoje, jsou všichni příslušníci určitého druhu na stejná nepodmíněná posílení stejně citliví. 15. Podmíněná posílení jsou původně neutrální stimuly, které účinkují jako posílení na základě předchozího spárování s jedním či více jinými posíleními. 16. Generalizované (zobecněné) podmíněné posílení je podmíněné posílení, které je výsledkem párování s  mnoha nejrůznějšími nepodmíněnými a podmíněnými posíleními, takže jeho účinnost není závislá na stávající EO pro žádný konkrétní druh posílení. 17. Podle svých formálních vlastností jsou posílení většinou klasifikována jako jedlá, smyslová, hmotná, posílení ve formě aktivity a posílení sociální. 18. Premackův princip říká, že možnost zabývat se činností, které se člověk za výchozí situace věnuje s vysokou relativní četností, bude u dotyčného působit jako posílení činnosti, jejíž frekvence je u něj naopak nízká. 19. Hypotéza omezeného operantu je model, s jehož pomocí lze predikovat, zda bude podmíněný přístup k jednomu chování účinkovat jako posílení jiného chování, víme-li, jestli je přístup k podmíněné činnosti nižší než za výchozích podmínek. Identifikace potenciálních posílení 20. Jako mapování preferovaných stimulů se označují různé postupy používané ke  zjišťování (a) stimulů, jež daná osoba preferuje, (b) relativní preferenční hodnoty těchto stimulů (vysoká preference versus nízká preference) a (c) podmínek, za nichž se tyto preferenční hodnoty mění. 21. K  mapování preferovaných stimulů lze použít dotazování se cílové osoby a/nebo lidí důležitých v  jejím životě, pozorování dané osoby v  situaci s volným výběrem operantů operantů a pokusné metody (metoda jednoho stimulu, metoda dvou stimulů, metoda mnoha stimulů). 22. Preferované stimuly vždy nepůsobí jako posílení a preference stimulů se často mění v průběhu času. 23. Jako mapování posilovací účinnosti stimulů se označují metody, s jejichž pomocí zjišťujeme, jaké účinky bude mít potenciální posílení v různých podmínkách nebo jak se bude za určitého nastavení podmínek lišit posilovací účinnost různých podnětů. K mapování posilovací účinnosti stimulů se často používá režim souběžného posilování, režim střídavého posilování a přechodné režimy posilování se vzrůstajícími požadavky na  počet odpovědí. Kontrolní zkoušky pozitivního posilování 24. Kontrolní zkoušky pozitivního posilování se provádějí pomocí metod, při nichž poskytujeme potenciální posílení a  sledujeme, jak se to projeví na  frekvenci příslušného chování. Cílem kontrolní zkoušky je věrohodný důkaz, že prezentace následku v  závislosti na  výskytu cílové odpovědi působí jako pozitivní posílení této odpovědi. Při kontrolní zkoušce porovnáváme četnost odpovědi v režimu bez podmíněně závislého posilování a v režimu podmíněně závislého posilování a  poté prokazujeme, že přechodem z jednoho režimu na druhý se dá příslušné chování zapnout a vypnout nebo zesílit a zeslabit. 25. Ke kontrolní zkoušce pozitivního posilování slouží kromě reverzní metody s  vyhasínáním, u  níž představuje kontrolní podmínky režim bez posilování, také metody, kde se jako kontrola používá posilování nezávislé na chování (NCR), diferencované posilování jiného chování (DRO) a diferencované posilování alternativního chování (DRA). Jak provádět posilování efektivně 26. Efektivitu pozitivního posilování zvýšíte dodržováním následujících pokynů: • Na začátku stanovte kritérium pro posílení tak, aby bylo snadno splnitelné • Posilujte vysoce funkčními posíleními v dostatečné míře. • Posílení obměňujte • Dávejte přednost přímému posilování před nepřímým, kdykoli je to možné • Kombinujte posilování s prompty • Zpočátku posilujte každý výskyt žádoucí odpovědi a pak intervaly mezi posíleními prodlužujte • Používejte podmíněně závislou pozornost a pochvalu • Prodlužujte postupně prodlevu mezi odpovědí a posílením • Postupně přejděte od přidaných posílení k posílením, k nimž dochází přirozeně Pouze pro studijníúčely. N ešířita nekopírovat.