IX. MEDICÍNA ZALOŽENÁ NA DŮKAZU 39 MEDICÍNA ZALOŽENÁ NA DŮKAZU 39.1 ÚVOD - DEFINICE EBM Evidence-based medicine (EBM) - medicína založená na důkazu je definována jako integrace nejlepšího vědeckého důkazu s klinickou odborností a pacientovými hodnotami. Nejlepší vědecký důkaz pochází obvykle z výsledků správně organizovaných a správně prováděných epidemiologických studií, často multicentrického charakteru. V těchto studiích je tak zajištěn dostatečně velký počet subjektů a tím se také zvyšuje jejich validita. Studie jsou zaměřeny na všechny otázky klinické epidemiologie (Janout, 1998), zejména na přesnost a použitelnost diagnostických testů (včetně klinického vyšetřování), účinnost a bezpečnost léčebných, rehabilitačních a preventivních postupů a hodnotu a sílu prognostických markerů. Nové důkazy z takto orientovaného klinického výzkumu jednak mění názory na dosud používané diagnostické a terapeutické postupy a také je částečně nahrazují pokud jsou přesnější účinnější a bezpečnější. Klinická odbornost předpokládá schopnost lékaře používat jeho klinické dovednosti a zkušenost k rychlému identifikování pacientova zdravotního stavu včetně stanovení diagnózy, k odhadu jaký může mít pacient prospěch z potenciálních intervencí, případně jaká rizika z nich pro pacienta vyplývají. Současně musí vzít v úvahu pacientův žebříček hodnot a jeho očekávání. Pacientovi hodnoty představují jeho osobní preference, zájmy, očekávání a priority, které musí být integrovány do klinického rozhodování jestliže má být k jeho prospěchu. Jestliže se podaří tyto tři články vhodně integrovat, pak klinik i pacient tvoří diagnostickou i terapeutickou alianci, jejíž činnost může mít optimální dopad na klinický výsledek a kvalitu života pacienta. Medicína založená na důkazu je ale mnohem víc než jen čtení publikací za účelem získání informací o nových vědeckých důkazech. Podle nejvíce citované definice je to především „vědomé, zřetelné a soudné používání nejlepších současných důkazů při rozhodování o péči o jednotlivé pacienty". Jinými slovy „medicína založená na důkazu je zlepšení tradičních dovedností kliniků v diagnostice, léčbě, prevenci a přidružených oblastech prostřednictvím systematického formulování důležitých a zodpověditelných otázek a využití matematických odhadů pravděpodobnosti a rizika" (Greenhalgh, 2003). Profesor Dave Sackett v zahajovacím úvodníku úplně prvního čísla časopisu Evidence-Based Medicine shrnul hlavní kroky ve vyvíjející se vědě medicíny založené na důkazu: • převést potřebu informací na zodpověditelné otázky (tj. formulovat problém) • vypátrat s maximální účelností nejlepší důkazy, které na tyto otázky přinesou odpovědi - které mohou pocházet z klinického vyšetření, z diagnostické laboratoře, z publikované literatury nebo z jiných zdrojů • posoudit důkazy kriticky (tj. zvážit je), a stanovit jejich platnost (blízkost pravdě) a užitečnost (klinickou použitelnost) • začlenit výsledky tohoto posouzení do klinické praxe • vyhodnotit účelnost opatření. Proto medicína založená na důkazu vyžaduje nejen čtení publikací, ale čtení správných publikací ve správný čas a potom pozměnit chování (a co je často složitější, chování dalších lidí) ve světle toho, co bylo čtením publikací zjištěno. 39.2 HISTORIE VZNIKU EBM Nebylo žádným překvapením, že široká publicita dávaná tomu, čemu se nyní říká „medicína založená na důkazu", byla přivítána se smíšenými reakcemi těch, kteří se podílejí na péči o pacienty. Převážná část lékařské obce se zdá být trošku postižena jejím pojetím, které naznačuje , že veškerá lékařská praxe až donedávna byla tím, co se někdy popisuje jako lehkovážný a nezodpovědný druh lidského experimentování, založený pouze na pokusu a omylu a obvykle vedoucí k přesně takovým důsledkům. Na druhé straně politikové a ti, kteří řídí zdravotní služby, tuto představu přivítali s obrovskou radostí. Všichni měli podezření, že lékaři jsou zcela nekritičtí, a nyní to měli na papíře. Medicína založená na důkazu přišla jako dar z nebes, protože, jak ji nakonec vnímali, účelnost jí vlastní musí nevyhnutelně vést k úspoře nákladů. Avšak myšlenka kontrolovaných klinických pokusů a medicíny založené na důkazu není nová. Je zaznamenáno, že Fridrich II., císař římský a král sicilský a jeruzalémský, který žil od roku 1192 do roku 1250 n.l. a který se zajímal o účinky tělesné námahy na trávení, vzal dva rytíře a dal jim stejné jídlo. Jeden byl poslán ven na lov a druhý do postele. Po několika hodinách oba zabil a vyšetřil jejich zažívací trakt; trávení pokročilo dále v žaludku spícího rytíře. V 17. století Jan Baptista van Helmont, lékař a filozof, začal mít pochybnosti o praxi pouštění žilou. Proto navrhl to, co bylo téměř určitě prvním klinickým pokusem včetně velkého počtu účastníků, randomizace a statistické analýzy. Obnášelo to vzít 200-500 chudých lidí, rozdělit je do dvou skupin metáním losu a jedny uchránit flebotomie, zatímco ty druhé ošetřit puštěním žilou do té míry, do jaké by jeho kolegové považovali za vhodné. Počet pohřbů v každé skupině by se použil k vyhodnocení účinnosti pouštění žilou. Dějiny nezaznamenaly, proč tento skvělý experiment nikdy nebyl proveden. Pokud lze říci, že moderní vědecká medicína měla někdy počátek, tak to bylo v Paříži uprostřed 19. století, kde měla kořeny v práci a vyučování Pierra Charlese Alexandra Louise. Louis zavedl statistickou analýzu do hodnocení lékařské léčby a náhodou ukázal, že pouštění žilou je bezcenná forma léčby, ačkoli to nezměnilo chování lékařů v té době ani v letech následujících. Naproti tomu několik kliniků na obou stranách Atlantiku tvrdilo, že by se měly přijmout klinické pokusy zaměřené na klinické výsledky, avšak numericky založené experimentální designy byly jasně formulovány ve 20. letech 20. století genetikem Ronaldem Fisherem. Obor začal mít závažný vliv na klinickou praxi po druhé světové válce po seminární práci Sira Austina Bradforda Hilla a britských epidemiologů, kteří jej následovali, což byli zvláště Richard Doll a Archie Cochrane. Ale třebaže myšlenka medicíny založené na důkazu není nová, moderní následovníci jako David Sackett a jeho kolegové prokazují velkou službu klinické praxi ne pouze tím, že by tuto myšlenku popularizovali, ale tím, že klinikům důkladně objasňují představu, že to není jen akademická záležitost, ale způsob myšlení, který by měl prostoupit každou stránku lékařské praxe. I když mnoho z toho je založeno na megastudiích a metaanalýzách, měla by to také být použito k ovlivňování téměř všeho, co lékař dělá. Ostatně lékařská profese je po léta nucena examinátory z lékařských škol, aby věřila, že je jen jeden způsob vyšetřování pacienta. Také rituály u lůžka by měly být opřeny o kritické vyhodnocení 684 zrovna tak jako operace a lékové režimy; totéž platí téměř pro každé hledisko lékařské práce. Jak se klinická praxe stává časově náročnější a čas na čtení a sebereflexi je stále vzácnější, bude pro lékaře nezbytnou dovedností schopnost účelně prostudovat lékařskou literaturu a v budoucnu si osvojit získávání znalostí o správné praxi z moderních komunikačních systémů. Myšlenkové principy medicíny založené na důkazu se dají nalézt již v dávné minulosti. V porevoluční Paříži, již zmíněný klinik Pierre Louis odmítal názory medicínských autorit (na příklad, že venesekce je dobrá k léčení cholery) a hledal pravdu v systematickém pozorování pacientů. Ještě dříve, ve starověké Číně, za vlády císaře Qianlonga, byl pro interpretaci starověkých Konfuciánských textů používán termín „průkazný výzkum". V současné době, byl pojem „Evidence Based Medicine" - medicína založená na důkazu, poprvé použit v roce 1992 skupinou pracovníků, vedenou Gordonem Guyattem z Univerzity McMaster v Kanadě. Od té doby vzrostl počet publikací o medicíně založené na důkazu exponenciálně a vznikla řada časopisů, publikujících práce tohoto typu. Následující rychlé rozšíření této nové filozofie medicíny bylo podmíněno následujícími faktory: • každodenní potřebou validních informací o diagnostických, léčebných, prognostických a preventivních metodách • nedostatečnou kvalitou tradičních zdrojů informací pro jejich zastaralost (učebnice), častou frekvencí mylných názorů (experti), neefektivnost (způsob celoživotního vzdělávání) a nebo pro jejich nadměrné množství a rozdílnou kvalitu-validitu pro klinické použití (časopisy) • nevyvážeností mezi diagnostickými schopnostmi a klinickým úsudkem lékaře na jedné straně, které se zkušeností vzrůstají a nejčerstvějšími znalostmi a nejnovějšími klinickými metodami, jejichž znalost s postupem času klesá • omezenými možnostmi lékaře, který má při své práci málo času na průběžné studium literatury a hledání důkazů pro svoje klinické rozhodování • rozvojem metod pro zjišťování důkazu a pro jeho kritické hodnocení • vydáváním systematických přehledů a jiných sumari-začních materiálů, týkajících se lékařské péče (Cochrane Collaboration) • vydáváním „evidence-based" lékařských časopisů, které publikují tak zvané sekundární publikace, tj. práce, publikované v jiných časopisech a prověřené experty, že jejich výsledky jsou jednak platné (validní) a jednak okamžitě použitelné v klinické praxi • vytvořením informačních systémů, které přinášejí nové poznatky během několika sekund • vytvořením a aplikací nových efektivních strategií pro celoživotní vzdělávání a pro zlepšení klinické praxe Zjevný odpor mezi mnoha zdravotnickými pracovníky vůči hnutí medicíny založené na důkazu je většinou reakcí na předpoklad, že lékaři (a sestry, porodní asistentky, fyzio-terapeuti a další zdravotničtí pracovníci) jsou funkčně negramotní, dokud se jim neukáže světlo, a že těch několik, kteří nejsou negramotní, záměrně ignorují publikované medicínské důkazy. Kdokoli, kdo pracuje tváří v tvář pacientům, ví, jak často je nutné hledat nové informace před klinickým rozhodnutím. Lékaři tráví čas v knihovnách od té doby, co byly knihovny zavedeny. Pacientovi nebude nasazen nový lék bez důkazu, že bude pravděpodobně fungovat kromě jiného také proto, že takové neoprávněné použití medikace je nezákonné. Je otázkou, zda všichni lékaři již léta provádí medicínu založenou na důkazu kromě situací, kdy dá se říci úmyslně klamou (využívají „placebo" účinku z dobrých lékařských důvodů) nebo když jsou nemocní, nadměrně stresovaní nebo vědomě líní? Odpověď zní „ne, neprovádí"! Je řada přehledných prací o chování lékařů, sester a ostatních zdravotníků a většina z nich dosáhla stejných závěrů: klinická rozhodování se jen vzácně zakládají na nejlepších dostupných důkazech. Odhady ze začátku 80. let naznačují, že jen okolo 10-20 % lékařských intervencí (farmakoterapie, chirurgické operace, rtg vyšetření, krevní testy a tak dále) bylo založeno na řádných vědeckých důkazech. O tato čísla se od té doby vedou spory, jelikož byla odvozena zhodnocením všech v současnosti používaných diagnostických a terapeutických procedur, takže každá procedura dostala bez ohledu na svou výpovědní hodnotu v konečné fázi stejnou váhu. Novější vyhodnocení používající tuto metodu klasifikovalo jen 21 % zdravotnických technologií jako založených na důkazech. Přehledy, které berou v úvahu intervence vybraných, po sobě jdoucích sérií pacientů, které odrážejí spíše skutečně používané technologie než prostě ty, které jsou na trhu, naznačují, že 60-90 % klinických rozhodnutí, v závislosti na odbornosti, je „založeno na důkazu". Ale tyto odhady měly svá metodologická omezení. Kromě jiného byly prováděny na specializovaných jednotkách a braly v úvahu praxi světových expertů v medicíně založené na důkazu; proto mohou být počty, k nimž se dospělo, stěží zevšeobecňovány za hranici jejich bezprostředního použití. Podívejme se na různé přístupy, jichž v reálné praxi používali zdravotníci ke svým rozhodnutím, přičemž ve všech případech jde o příklady toho, co medicína založená na důkazu není. 39.2.1 ROZHODOVÁNÍ SE NA ZÁKLADĚ VYPRÁVĚNÍ PŘÍBĚHU Profesor, který při své každodenní vizitě uvidí nového pacienta, dotáže se na jeho příznaky a otočí se k šiku juniorů nahlou-čenému kolem postele a vypráví příběh o podobném pacientovi, s nímž se setkal o 20 či 30 let dříve. „O, ano. Pamatuji si, že jsme jí dali to a to a ona po tom byla v pořádku." Vyjadřuje se cynicky, často správně, o nových lécích a technologiích a jeho klinický postřeh si s ničím nezadá. Nicméně mu zabralo 40 let, aby nashromáždil své odborné znalosti, a největší lékařská učebnice ze všech - sbírka případů mimo jeho osobní zkušenosti - mu zůstala navždy zavřena. Vyprávění takového příběhu má důležité místo v odborném studiu , ale nebezpečí rozhodování podle vyprávěného příběhu dobře ilustruje zvážení poměru riziko-prospěch u léků. Významná lékařka a odborník na EBM popisuje svoji osobní zkušenost při jejím prvním těhotenství, kdy se u ní objevilo těžké zvracení a byl ji dán lék proti nevolnosti pro-chlorperazin (Stemetil). Za chvíli dostala nekontrolovatelnou a velmi vyčerpávající nervovou křeč. Za dva dny se z této idiosynkratické reakce plně zotavila, ale od té doby tento lék už nikdy nepředepsala, i když odhadovaná prevalence neurologických reakcí na prochlorperazin je pouze jeden na několik tisíc případů. A obráceně, je lákavé nemyslet na možnost vzácných ale potenciálně závažných nežádoucích účinků známých léků - jako je trombóza u antikoncepčních pilulek, když se člověk nikdy s takovými potížemi nesetkal ani u sebe, ani u svých pacientů. 685 Klinici by nebyli lidmi, kdyby přehlíželi své osobní klinické zkušenosti, ale lepší radou pro všechny je, zakládat svá rozhodování na kolektivních zkušenostech tisíců kliniků léčících miliony pacientů, než na tom, co sami jako jednotlivci viděli a pocítili. 39.2.2 ROZHODOVÁNÍ SE NA ZÁKLADĚ VÝSTŘIŽKŮ Z TISKU Rada lékařů, zvláště v prvních letech po promoci uchovává různé články z časopisů. Pokud se zdá, že článek má co nového říci, pozmění svou klinickou praxi v souladu s jeho závěry. Jeden takový článek kdysi říkal: „všechny děti s podezřením na infekci močových cest by měly být poslány na zobrazovací vyšetření ledvin, aby se vyloučily vrozené anomálie". A tak řada lékařů začala posílat každého mladšího 16 let s močovými příznaky na speciální vyšetření. Ta rada byla v tisku a byla nová, tak musela určitě nahradit tradiční praxi - v tomto případě odesílat pouze děti mladší 10 let, které měly dvě dobře doložené infekce. Tento přístup ke klinickému rozhodovacímu procesu je stále velice běžný. Mnoho lékařů stále ospravedlňuje svůj přístup k určitému klinickému problému tím, že citují výsledky jednotlivé publikované studie, i když nedokáží říci vůbec nic o metodách použitých k získání takových výsledků! Byl ten pokus randomizovaný a kontrolovaný? Kolik pacientů a jakého stáří, pohlaví a závažnosti onemocnění bylo zahrnuto? Kolik odstoupilo ze studie a proč? Podle jakých kritérií byli pacienti vybráni k léčbě? Pokud se zdá, že zjištění studie odporují výsledkům z jiných výzkumných projektů, jaké úsilí bylo vynaloženo, aby byla prokázána jejich platnost a aby byla tato zjištění zopakována ? Byly statistické testy, které údajně prokázaly názor autorů, vhodně vybrány a správně provedeny? Lékaři (a také sestry, porodní asistentky, manažeři v medicíně, psychologové, studenti medicíny a aktivisté z řad pacientů), kteří rádi citují výsledky lékařských výzkumných studií, si mají nejprve odpovědně a se znalostí věci projít tak zvaný kontrolní seznam otázek, podle kterého mohou posoudit validitu dané studie (publikace). 39.2.3 ROZHODOVÁNÍ SE PODLE NÁZORU EXPERTŮ (MEDICÍNA ZALOŽENÁ NA VÝZNAČNÝCH LIDECH - „EMINENCE BASED MEDICINE') Důležitou obměnou rozhodování se podle výstřižků z tisku je použití „konfekčních" přehledů, úvodníků, společných souhlasných prohlášení a oficiálních doporučení. Firemní propagační dárky (bezplatné lékařské časopisy a jiné „informační listy" sponzorované přímo nebo nepřímo farmaceutickým průmyslem) jsou plné odjinud vytažených doporučení a zjednodušených návodů. Ale kdo říká, že rady předkládané v sadě oficiálních doporučení, aktuálním úvodníku nebo v „přehledu" s obšírnými odkazy jsou správné? Profesorka Cynthia Mulrowová, jedna ze zakladatelů vědy o systematických (kritických) přehledech ukázala, že u expertů v určitém klinickém oboru je ve skutečnosti méně pravděpodobné, že poskytnou objektivní kritický přehled všech dostupných důkazů, než u neodborníků, kteří přistupují k literatuře s nezaujatýma očima. V krajních případech může „expertem pořízený (kritický) přehled" sestávat prostě z celoživotních špatných návyků a osobních časopisových výstřižků stárnoucího klinika. 686 39.2.4 ROZHODOVÁNÍ SE NA ZÁKLADĚ MINIMALIZACE NÁKLADŮ Veřejnost je obvykle zděšena, když se dozví, že léčba byla u pacienta přerušena kvůli nákladům. Řídící pracovníci, politici a stále více i lékaři mohou počítat s tím, že budou pranýřováni tiskem, když dítě s mozkovým tumorem nepošlou na specializovanou jednotku někde v zahraničí, nebo když je křehké stařence odepřena neomezená (stravování a uložení) hospitalizace na jednotce intenzivní péče. Přesto v reálném světě je veškerá zdravotní péče poskytována z omezeného rozpočtu a stále více se zjišťuje, že klinická rozhodnutí musí brát v úvahu ekonomické náklady na danou intervenci. Klinická rozhodnutí učiněná čistě na základě nákladů („minimalizace nákladů" - nákup nejlevnější možnosti bez ohledu na to, jak je účinná) jsou obvykle necitelná a krutá a je správné nahlas protestovat, když se něco takového stane. Drahé intervence by ale neměly být ospravedlňovány prostě proto, že jsou nové, nebo proto, že by teoreticky měly fungovat, nebo proto, že jedinou alternativou je nedělat nic - ale jen proto, že velmi pravděpodobně zachrání život nebo významně zlepší jeho kvalitu. Jak ale lze smysluplně porovnat výhody náhrady kyčelního kloubu u 751etého člověka s prospěchem z léku snižujícího cholesterol u muže středního věku či vyšetření neplodného páru ve třetí dekádě jejich života? Tak trochu navzdory očekávání tu bohužel není žádná sada etických principů nebo analytických nástrojů, které by bylo možno použít ke sladění omezených zdrojů s neomezenými požadavky. Některé ukazatele, jako na příklad rok života o standardní (plné) kvalitě (QALY) a podobné jednotky založené na prospěchu pacienta jsou prostě výrazem snahy propůjčit trochu objektivity nelogickým ale nevyhnutelným srovnáním jablek s pomeranči v oblasti lidského utrpení. Je ještě další důvod, proč je pro některé lidi termín „medicína založená na důkazu" těžko přijatelný. Medicína založená na důkazu je o zvládání změn, nikoli o znalosti všech odpovědí ještě předtím, než se s něčím začne. Jinými slovy, není tolik o tom, co lékař přečetl v minulosti, ale o tom, jak se mu daří rozpoznávat současné i budoucí studijní potřeby, jak jim vyhovět a jak využívat své znalosti vhodně a důsledně v nových klinických situacích. Lékaři odchovaní stylem staré školy, kde neznalost je nepřijatelná, mohou obtížně přijmout, že mohou být konfrontováni s některými hledisky vědecké nejistoty, v průměru třikrát na každé dva pacienty vyšetřené zkušeným kolegou v daném oboru (a nepochybně dokonce častěji, jde-li o lékaře z terénu, s menší znalostí nejnovějších poznatků). Přístup založený na důkazech a použitý při vizitách na pokojích, může na hlavu převrátit tradiční hierarchii v medicíně, pokud sestra nebo mladý lékař používá nové důkazy, jež jsou srovnávány s tím co, předešlý týden vyučoval zkušenější kolega. 39.3 SOUČASNÁ SITUACE PŘI PROVÁDĚNÍ EBM Celé provádění praxe EBM lze rozdělit do následujících kroků: • potřebu informace o diagnóze, léčbě, prognóze apod. je třeba vyjádřit formou zodpověditelné otázky • nalézt nejlepší důkaz jako odpověď na tuto otázku • kriticky posoudit tento důkaz z hlediska jeho validity (blízkosti pravdě), jeho dopadu (rozsah efektu) a jeho použitelnosti (výhodnost v klinické praxi) • integrace kritického posouzení s klinickou schopností lékaře a s pacientovou unikátní biologií, jeho prioritami, hodnotami a jinými okolnostmi • evaluace efektivity použití výše uvedeného postupu a případně jeho modifikace. Posuzujeme-li provádění praxe EBM v jednotlivých klinických situacích, můžeme najít tři způsoby: • v prvním případě se jedná o každodenní klinické situace (nestabilní angina pectoris apod.), kdy je třeba být nejen „up to date" ale spíše „up to the minute" a s velkou dávkou jistoty o tom co se u daného pacienta provádí. V tomto případě se obvykle investuje do obou kroků, tj. do pátrání po důkazu i do jeho kritického posouzení a dále se pracuje již v tomto „kriticky posuzujícím" modulu • ve druhém případě, u stavů se kterými se lékař nesetkává tak často (otrava léky apod.), je veškerý čas obvykle věnován pátrání po důkazu, který byl již kriticky posouzen jinými odborníky (Cochrane Reviews, Best Evidence a jiné zdroje). Nesmí se ovšem zapomenout na třetí bod postupu, zda nalezený důkaz je relevantní pro daného pacienta. Jinak se ovšem dále postupuje v tomto „vyhledávacím" modulu V obou těchto modulech je obsažena jistota, že péče o pacienta je založena na principech EBM. • tato jistota však chybí v třetím případě, kdy se jedná o klinické situace velmi zřídka se vyskytující a kdy v těchto situacích jsou často slepě přebírány informace a aplikována doporučení od autorit v dané oblasti medicíny.Tento „replikativní" modul většinou nerozlišuje zda přebírané informace byly získány na základě kritického posouzení nebo pouze na základě osobní zkušenosti a osobního názoru. Někdy je možno se orientovat o validitě přebíraného názoru podle citované literatury, podle toho zda autoři jsou členy Cochrane Collaboration apod. Některá péče podle tohoto způsobu může být efektivní, některá neúčinná a některá škodlivá. V replikativním modulu však není jistota o který případ se bude jednat. Většina článků objevujících se v současných lékařských časopisech je více méně předkládána ve standardním formátu IMRAD: úvod (Introduction; proč se autoři rozhodli provést tento konkrétní výzkum), metody (Methods; jak jej provedli a jak se rozhodli analyzovat své výsledky), výsledky (Results; co zjistili) a diskuse (Discussion; co si myslí, že výsledky znamenají). Pokud se rozhodujete, jestli má cenu nějakou publikaci číst, měli byste to dělat podle designu studie z oddílu metod a ne podle poutavosti hypotézy, podle povahy či možného dopadu výsledků nebo podle spekulací v diskusi. Protože, špatná věda je špatnou vědou bez ohledu na to, zda se studie zaměřila na důležitý klinický problém, zda výsledky jsou „statisticky významné", zda se věci změnily v tom směru, jak by se to líbilo vám, a zda, pokud opravdu, nálezy slibují nezměrný prospěch pro pacienty nebo úspory ve zdravotnictví. Přísně řečeno, pokud se chystáte vyhodit nějakou publikaci, měli byste to učinit dokonce ještě předtím, než se podíváte na její výsledky. Je mnohem jednodušší nalézt mezery v práci někoho jiného, než sám provést metodologicky dokonalý kus výzkumné práce. Většina dobrých vědeckých časopisů odesílá články recenzentům, aby se vyjádřili k jejich vědecké platnosti, k tomu, nakolik jsou původní, a k jejich důležitosti, předtím než se rozhodnou je otisknout. Tento proces je znám jako recenzní praxe. Vyhodnocení metodologické kvality (kritické posuzování) je podrobně popsáno v mnoha učebnicích medicíny založené na důkazu. Byly vytvořeny strukturované návody na to, jak číst publikace pojednávající o léčbě, diagnóze, scree-ningu, prognóze, etiologii, kvalitě péče, ekonomické analýze a přehledech a tyto návody slouží jako rozhodující kontrolní seznamy pro kritické posuzování (viz dodatek 1). Při posuzování kvality publikace je třeba položit tři předběžné otázky. 39.3.1 PROČ BYLA STUDIE PROVEDENA A JAKOU HYPOTÉZU AUTOŘI TESTOVALI? Úvodní věta výzkumné práce by měla v kostce uvádět, jaké je pozadí daného výzkumu. Například „Založení tubotym-panální drenáže je běžnou procedurou u dětí a ukázalo se, že ne všechny operace jsou z klinického hlediska nezbytné". Za tímto tvrzením by měl následovat krátký přehled publikované literatury, například „Prospektivní průřezová studie Gupty a Browna o zavádění tubotympanálních drenáží ukázala, že...". Autoři běžně zapomínají zasadit svůj výzkum do souvislostí, jelikož pozadí vědeckého úkolu je jim nad slunce jasné až do chvíle, kdy se dostanou do stadia sepisování výsledků. Pokud tak již nebylo učiněno v úvodu, v části metody by měla být jasně uvedena hypotéza, již se autoři rozhodli testovat, jako ,Záměrem této studie bylo určit, zda jednodenní operace hernie je pro pacienty bezpečnější a přijatelnější, než standardní procedura za hospitalizace". A opět, tento důležitý krok může být vynechán nebo, což je běžnější, pohřben někde uprostřed odstavce. Pokud je hypotéza předložena negativně (což obvykle je), jako „Přídavek metforminu k maximální dávce sulfonylurey nezlepší kontrolu diabetů 2. typu", je známa jako nulová hypotéza. Autoři studie jen vzácně skutečně věří v nulovou hypotézu, když se pouštějí do svého výzkumu. Jelikož jsou to jen lidé, jsou již obvykle rozhodnuti ukázat rozdíl mezi dvěma sledovanými soubory ve své studii. Ale způsob, jakým to dělají vědci, je říci „Předpokládejme, že žádný rozdíl není; nyní se pokusme tuto teorii vyvrátit". Tento hypoteticko--deduktivní přístup (formulace zpochybňujících hypotéz a poté přechod k jejich testování) je skutečnou podstatou vědecké metody. 39.3.2 JAKÝ TYP STUDIE BYL POUŽIT? Nejprve je třeba zjistit, zdali daná publikace popisuje primární nebo sekundární studii. Primární studie zprostředkují výzkum z první ruky, zatímco sekundární (integrující) studie se pokoušejí shrnout a vyvodit závěry ze studií primárních. Primární studie, základ většiny výzkumu publikovaného v lékařských časopisech, obvykle spadají do jedné ze tří kategorií. • Experimenty, při nichž se nějaký manévr provádí na zvířatech nebo dobrovolnících za umělých a kontrolovaných podmínek. • Klinické pokusy, při nichž intervence, jako je farmako-terapie, se nabídne skupině pacientů, kteří jsou pak dále sledováni, aby se vidělo, co se s nimi bude dít. • Průzkumy, při nichž se něco měří ve skupině pacientů, zdravotníků nebo některých dalších vybraných skupin osob. Sekundární výzkum tvoří: • přehledy které je možno dělit na: - (nesystematické) přehledy, které shrnují primární studie 687 - systematické přehledy, které toto dělají podle přísné a předem definované metodologie - meta-analýzy, které v sobě spojují číselné údaje z více než jedné studie • oficiální doporučení, které vyvozují závěry z primárních studií a jsou o tom, jak by klinici měli postupovat • rozhodovací analýzy, které používají výsledky primárních studií k tvorbě rozhodovacích schémat pravděpodobnosti, které pakvyužívají zdravotníci i pacienti při rozhodování o klinických otázkách nebo o přidělování zdrojů • ekonomické analýzy, které vycházejí z výsledků primárních studií a mají říci, zdali postup určité činnosti je dobrým využitím zdrojů. 39.3.3 BYL POUŽITÝ DESIGN VHODNÝ VZHLEDEM K OBLASTI PROVÁDĚNÉHO VÝZKUMU? Byla randomizovaná kontrolovaná studie tou nejlepší metodou k testování dané hypotézy a pokud ona studie nebyla randomizovaným kontrolovaným pokusem, měla jím být? Jakou oblast výzkumu studie pokrývá? Byl proveden správný typ studie pro danou oblast výzkumu? Randomizované kontrolované studie V randomizované kontrolované studii (RCT = randomized conrol trial) jsou její účastníci náhodně přidělováni procesem odpovídajícím házení mince buď do skupiny k intervenci (jako je farmakoterapie) nebo do kontrolní skupiny (jako je podání placeba). Obě skupiny se sledují po určené časové období a analyzují se v pojmech specifických výsledků definovaných na počátku studie (například úmrtí, srdeční záchvat, hladina cholesterolu v séru atd.). Protože jsou tyto skupiny v průměru totožné až na intervenci, jakékoli rozdíly ve výsledku lze teoreticky přisoudit intervenci. Avšak ve skutečnosti ne každá RCT je přesná. Některé publikace předkládající studie porovnávající intervenční a kontrolní skupinu ve skutečnosti vůbec nejsou randomizované. Jejich označení je jiné kontrolované klinické studie, což je pojem užívaný k popisu srovnávacích studií, v nichž byly subjekty přiděleny do intervenční a kontrolní skupiny nenáhodným způsobem. Tato situace může například vzniknout tam, kde náhodné přidělování není možné, praktické nebo etické. Některé studie se počítají za kompromis mezi pravými randomizovanými a nerandomizovanými studiemi. V takových studiích se randomizace (náhodné přidělování účastníků studie do jedné ze dvou skupin) neděje doopravdy namátkově (například použitím postupně číslovaných zapečetěných obálek, které mají uvnitř počítačem vytvořená náhodná čísla), ale nějakou metodou připouštějící to, že klinik ví, ve které skupině pacient bude, ještě předtím, než učiní konečné rozhodnutí o randomizaci pacienta. To dovoluje, aby se vloudily jemné systematické chyby, jelikož může být více (či méně) pravděpodobné, že klinik zahrne určitého pacienta do studie, pokud doufá, že pacient dostane účinnou léčbu. Zejména pacienti s těžším onemocněním mohou být podvědomě vyloučeni ze skupiny, která dostává placebo. Příklady nepřijatelných metod zahrnují randomizaci podle poslední číslice v datu narození (sudá čísla do skupiny A atp.), házení mince, postupné přidělování (pacient A do skupiny 1, pacient B do skupiny 2 atp.) a podle datumu návštěvy kliniky (všichni pacienti z tohoto týdne do skupiny 1 a všichni, kteří přijdou příští týden, do skupiny 2). Následují příklady klinických otázek, na něž by nejlepší odpověď přinesla randomizovaná kontrolovaná studie: • Je tento lék lepší na určité onemocnění než placebo nebo jiný lék? • Je nový chirurgický postup lepší než současná oblíbená praxe? • Je lepší leták nebo ústní rada, chceme-li pomoci pacientovi při jeho informované volbě léčebných možností v určité situaci? • Ovlivní přechod z margarínu bohatého na nasycené tuky na margarín bohatý na tuky s více nenasycenými vazbami významně hladinu sérového cholesterolu? Říká se, že RCT jsou zlatým standardem v lékařském výzkumu. Je to pravda, ale jen pro určité typy klinických otázek . Otázky, které se nejlépe hodí pro design RCT, jsou všechny ohledně intervencí a týkají se hlavně léčby nebo prevence. Mělo by se však pamatovat na to, že i když zkoumáme léčebné intervence , existuje řada důležitých nevýhod spojených s randomizovanými studiemi. Pamatujte také na to, že výsledky RCT mohou mít omezenou použitelnost v důsledku vylučovacích kritérií (pravidel toho, kdo nemůže být zahrnut do studie), systematické chyby při zahrnutí do studie (výběr subjektů ze skupiny, která nereprezentuje všechny se sledovaným stavem , odmítnutí určitých skupin pacientů aby byli zařazeni do studie , analýzy pouze předem definovaných „objektivních" ukazatelů, což může vyloučit důležitá kvalitativní hlediska intervence a publikační systematické chyby (tj. výběrové uveřejnění pozitivních výsledků). Dále, RCT mohou být dobře nebo špatně provedeny a jak již jsou jednou publikovány, jejich výsledky mohou být překrouceny přehnaně nadšenou vědeckou obcí nebo dychtivostí veřejnosti po novém zázračném léku. Zatímco všechny tyto problémy se mohou vyskytnout i u jiných designů studií, jsou obzvláště aktuální tehdy, pokud je nějaká RCT předkládána jako čistá po metodologické stránce. Navíc je mnoho situací, v nichž RCT jsou buď po-stradatelné, nepraktické nebo nevhodné. RCT jsou postradatelné • Když byla objevena jasně úspěšná intervence u jinak fatální zdravotní situace. • Pokud předchozí RCT nebo meta-analýza daly konečný výsledek (buď pozitivní nebo negativní ). Někteří lidé mohou argumentovat , že je skutečně neetické iááaX pacienty, aby se nechali randomizovat pro klinickou studii, aniž by byla nejprve provedena systematická rešerše literatury za účelem zjištění, je-li vůbec třeba takovou studii provádět. RCT jsou nepraktické • Tam, kde by bylo neetické usilovat o souhlas k randomizaci. • Tam, kde je počet pacientů potřebný na to, aby se ukázal významný rozdíl mezi skupinami, nevýhodně vysoký RCT jsou nevhodné • Tam, kde studie sleduje prognózu nemoci. Pro takovou analýzu je vhodnou cestou k nejlepším důkazům longitu-dinální studie s řádně sestavenou počáteční kohortou • Tam, kde studie sleduje platnost diagnostického nebo screeningového testu. Pro takovou analýzu je správnou cestou k důkazům průřezová studie u pacientů s klinickým podezřením na odpovídající poruchu • Tam, kde předmětem studie je „kvalita péče" a kde kri- 688 téria „úspěchu" ještě nebyla stanovena. Například RCT srovnávající farmakologické a chirurgické metody potratu může hodnotit „úspěch" v takových pojmech jako počet pacientek, u nichž se dosáhlo kompletní evakuace dělohy, velikost krvácení a úroveň bolesti. Avšak pacientky mohou trvat na tom, že jsou důležitá jiná hlediska dané procedury, jako možnost vědět dopředu, jak dlouho bude výkon trvat, to, aby neviděly nebo necítily odchod potočeného embrya, a tak dále. Pro takovou analýzu je odpovídající cestou k dobrým důkazům nějaká kvalitativní výzkumná metoda. Všechny tyto položky podrobně diskutuje klinická epidemiologie, která připomíná, že ohrnování nosu nad neran-domizovanou studií může ukazovat na nedostatek vědecké moudrosti a ne, jak mnozí lidé běžně předpokládají, intelektuální důkladnost. Kohortové studie V kohortové studii jsou dvě nebo více skupin osob, vybrány na základě odlišností v expozici určitému činiteli (jako je očkování, lék nebo toxická látka z prostředí) a jsou pak sledovány, aby bylo vidět, u kolika z nich v každé skupině se vyvine určité onemocnění či jiný následek. Období sledování v kohortové studii se obecně počítá na roky (a někdy desetiletí), jelikož to je doba, jakou zabere vývoj mnohých nemocí, zvláště rakoviny. Zatímco RCT obvykle studují pacienty, většina kohortových studií se zaměřuje na zdravé osoby, u kterých se onemocnění může nebo nemusí vyvinout. Zvláštní typ kohortové studie je možno použít ke stanovení prognózy nemoci (tj. co se pravděpodobně stane s člověkem, který má uvedenou nemoc). Sestaví se skupina pacientů, u nichž bylo diagnostikováno, že mají časné stadium nemoci, nebo mají pozitivní screeningový test (počáteční kohorta), a potom se sledují při opakovaných příležitostech, aby se zjistila incidence (nové případy za rok) a časový průběh různých následků. Světově nejproslulejší kohortovou studii, která svým dvěma původním autorům vysloužila rytířský stav, provedli Sir Austen Bradford Hill, Sir Richard Doll a později Richard Peto. U 40 000 britských lékařů rozdělených do čtyř kohort (nekuřáci a dále slabí, střední a silní kuřáci) sledovali jak celkovou mortalitu (úmrtí z jakékoli příčiny) tak mortalitu podle jednotlivých příčin (úmrtí na určitou nemoc). Publikování jejich předběžných výsledků po 10 letech v roce 1964 ukázalo podstatný rozdíl jak v celkové mortalitě tak v mortalitě na rakovinu plic u kuřáků se vztahem „dáv-ka-odpověď" (tj. čím víc kouříte, tím větší máte šanci dostat rakovinu plic). Také se prokázalo, že vztah mezi kouřením a poškozením zdraví je spíše příčinný než náhodný. 201eté a 401eté výsledky této závažné studie (která dosáhla působivého sledování 94% těch, kteří byli vzati do studie v roce 1951 a o nichž nebylo známo, že zemřeli) názorně předvedly nebezpečnost kouření i sílu důkazů, které lze získat z řádně vedené kohortové studie. Klinické otázky, které by měly být předmětem kohortové studie, jsou například následující: • ,Způsobuje" orální antikoncepce rakovinu prsu? (slovo „způsobuje" je potenciálně zavádějící termín skrývající v sobě nebezpečí. Jak řekl John Guillebaud ve své vynikající knize The Pili, pokud by 1000 žen zítra začalo s orální antikoncepcí, některé z nich by dostaly rakovinu prsu. Ale některé z nich by ji dostaly i tak. Otázka, kterou se pokoušejí epidemiologové zodpovědět prostřednictvím kohortových studií, je „Jaké je přídatné riziko rozvoje rakoviny prsu u ženy, v důsledku orální antikoncepce ve srovnání s jejím „základním" rizikem, jež lze přisoudit její vlastní hormonální rovnováze, rodinné anamnéze, výživě, alkoholu a tak dále?" • Způsobuje kouření rakovinu plic? • Zlepšuje se časem vysoký krevní tlak? • Co se stane s dítětem, které se narodilo velice předčasně, pokud jde o následný tělesný vývoj a dosažené vzdělání? Studie případů a kontrol Ve studii případů a kontrol jsou pacienti s určitou nemocí nebo stavem (případy) „spárováni" s kontrolami (pacienty s nějakou jinou nemocí, všeobecnou populací, sousedy nebo příbuznými). Poté se sbírají údaje (například zpětným prohledáváním chorobopisu nebo dotazováním se na jejich osobní anamnézu) o minulé expozici možnému etiologické-mu agens dané nemoci. Podobně jako kohortové studie se studie případů a kontrol obecně zabývají spíše etiologií nemoci (tj. co ji způsobuje) než její léčbou. V hierarchii důkazů stojí níže, ale tento design je obvykle jedinou možností při studiu vzácných stavů. Důležitým zdrojem potíží (a možné systematické chyby) je u studie případů a kontrol přesná definice toho, kdo se počítá za „případ", jelikož jeden špatně označený subjekt může podstatně ovlivnit výsledky. Navíc studie případů a kontrol nemůže prokázat kauzalitu ; jinými slovy vztah (asociace) mezi A a B ve studii případů a kontrol neprokazuje, že A je příčinou B. Klinické otázky vhodné pro studii případů a kontrol jsou například následující: • Zvyšuje poloha na břiše ve spánku riziko úmrtí kojence ve spánku (syndrom náhlého úmrtí kojenců, SIDS)? • Způsobuje očkování proti černému kašli poškození mozku? • Způsobují nadzemní elektrické kabely leukémii? Průřezové studie Pravděpodobně jsme byli již všichni požádáni o účast v nějaké průřezové studii, i když to byla jen paní na ulici, která se nás tázala, které značce zubní pasty dáváme přednost. Průřezové studie vedené epidemiology mají zcela nezbytně stejné rysy: s reprezentativním výběrem osob (nebo pacientů) se vedou rozhovory, vyšetřují se nebo se jinak studují za účelem získání odpovědí na nějakou specifickou klinickou otázku. U průřezových studií se data sbírají v jednom časovém okamžiku, ale mohou se zpětně vztahovat na zdravotní otázky v minulosti, jako například studium zdravotní dokumentace pacientů, aby bylo vidět, jak často jim byl měřen krevní tlak v posledních pěti letech. Klinické otázky, které by měly být zodpověděny průřezovou studií, jsou například následující: • Jaká je „normální" výška 31etého dítěte? (Toto, podobně jako jiné otázky o normálních rozmezích, lze zodpovědět jednoduše měřením výšky u dostatečného počtu zdravých 31etých dětí. Takové měření ale nepřinese odpověď na přidruženou klinickou otázku „Kdy by se mělo neobvykle malé dítě vyšetřovat na přítomnost nemoci?", jelikož, jako téměř u všech biologických měření, se fyziologické (normální) překrývá s patologickým (abnormálním). • Co si psychiatrické sestry myslí o hodnotě elektrokonvul-zívní terapie (ECT) v léčbě těžké deprese? • Je pravda, že „polovina všech případů diabetů je nedia-gnostikována"? (Toto je příklad obecnější otázky „Jaká je prevalence (podíl lidí s určitým stavem) dané nemoci v této společnosti?" Jediným způsobem, jak najít odpověď, je provést definitivní diagnostický test u reprezentativního vzorku populace.) 689 Kazuistiky Kazuistika popisuje historii vzniku onemocnění u jednotlivého pacienta v podobě příběhu („Paní B je 541etá sekretářka, u níž se objevila bolest na hrudi v červnu 2000..."). Popisy jednotlivých případů se často mohou sdružit a pak tvoří sérii případů, v níž se popisuje historie vzniku zdravotních potíží u více než jednoho pacienta s konkrétním onemocněním, aby byly ukázány na příklad výsledky léčby nebo v současnosti nejčastěji, nežádoucí reakce na léčbu. Ačkoli je tento typ výzkumu tradičně považován za poměrně slabý vědecký důkaz, dá se kazuistikou sdělit hodně informací, které by se v klinické studii ztratily. Navíc kazuistiky jsou okamžitě pochopitelné pro praktické lékaře a laickou veřejnost. Je-li to nutné, mohou být sepsány a uveřejněny za několik dní, což jim dává jistou převahu nad meta-analýzami (které se chystají na svět celé roky) a klinickými studiemi (několik měsíců). Určitě existuje v rámci lékařského stavu silná nátlaková skupina volající po znovu-uvedení skromné kazuistiky do role užitečného a platného příspěvku lékařské vědě. Mezi klinické situace, v nichž je kazuistika nebo série případů vhodným typem studie, patří na příklad následující: • Lékař si všimne, že dvě děti narozené v jeho nemocnici nemají končetiny (fokomelie). Obě matky braly v raném těhotenství nový lék (thalidomid). Lékař chce co nejrychleji upozornit své kolegy po celém světě na možnost postižení v souvislosti s lékem. (Každý, kdo si myslí, že kazuistiky nemají žádné vědecké oprávnění, by si měl vzpomenout na tento příklad.) • Pacient, který užíval dva různé léky, terfenadin (na sennou rýmu) a itrakonazol (na mykózu), bez jakýchkoli nežádoucích účinků v minulosti, je nyní užívá oba současně a rozvíjí se u něj život ohrožující porucha srdečního rytmu. Jeho ošetřující lékaři mají podezření, že jde o interakci těchto dvou léků. Tradiční hierarchie důkazů Různé typy primárních studií, pokud jde o rozhodnutí o klinických intervencích („hierarchie důkazů"), mají následující pořadí od nejlepší až po nejméně validní. • Systematické přehledy a meta-analýzy • Randomizované kontrolované studie s validními výsledky (tj. intervaly spolehlivosti, jež se nepřekrývají s prahem klinicky významného účinku) • Randomizované kontrolované studie s méně validními výsledky (tj. výstup ze studie naznačuje klinicky významný účinek, ale intervaly spolehlivosti se překrývají s prahem pro tento účinek) • Kohortové studie • Studie případů a kontrol • Průřezové studie • Kazuistiky Je zcela na místě, že vrchol hierarchie je vyhrazen pro sekundární výzkumné práce, v nichž jsou obsaženy všechny primární studie na určité téma, které byly kriticky posouzeny podle přísných kritérií. Ale ani zastánci nejtvrdší linie medicíny založené na důkazu by neumístili nepořádnou meta--analýzu či randomizovanou kontrolovanou studii s vážnými metodologickými trhlinami nad velkou, dobře uspořádanou kohortovou studii. Mnoho důležitých a platných studií na poli kvalitativního výzkumu vůbec v této konkrétní hierarchii důkazů nefiguruje. Jinými slovy, vyhodnocení příspěvku určité studie lékařské vědě vyžaduje značně více úsilí, než abychom si ji pouze na základě jejího designu zaškrtli na výše uvedené sedmibodové stupnici. 39.4 PŘÍNOS EBM PRO LÉKAŘE A PRO PACIENTA V souvislosti s novou filozofií medicíny založené na důkazu se nabízí otázka, zda kliničtí lékaři mohou z časových i jiných důvodů skutečně tento nový přístup aplikovat ve své klinické praxi. Studie u praktických lékařů ve Spojeném království ukázala, že většina lékařů věnovala alespoň část svého času nalezení nejlepšího důkazu v tzv. „vyhledávacím modulu" tím, že používala sumarizující informace od jiných autorů (72%) nebo EBM směrnice a protokoly (84%). Na druhé straně asi jenom 20% z nich umělo kriticky zhodnotit význam intervalů spolehlivosti. Konečně jenom 5% bylo přesvědčeno, že získáním těchto nových znalostí a dovedností EBM je tou správnou cestou k přechodu od medicíny založené na zkušenosti a názoru k medicíně založené na důkazu. Další otázkou je, zda klinický lékař i když je přesvědčen o významu a nezbytnosti postupů EBM, je schopen ve své časově náročné klinické praxi získat potřebný důkaz dostatečně včas. Na několika málo příkladech se ukázalo že ano. Když velmi vytížená ambulance lůžkového oddělení (180 a více příjmů za měsíc) používala elektronické sumarizace důkazu, které byly již kriticky zhodnoceny zkušenými členy týmu (CATs = critically appraised topics = kriticky zhodnocená témata), nebo sumarizace z časopisu Best Evidence, ukázalo se, že k okamžitému vyhodnocení tohoto materiálu pro konkrétního pacienta stačí 10-25 sekund. Navíc z hlediska mladších členů ošetřujícího týmu změnily tyto důkazy ve 25% jejich diagnostické a terapeutické názory a u dalších 23% jim přidaly další vědomosti. Konečně třetí otázkou zůstává, zda lékař, i když je schopen získat potřebný důkaz pro své rozhodování, jej může aplikovat pro „evidence-based" péči o své pacienty. Z auditu na pracovištích, která praktikovala jak vyhledávací tak i kritický modul vyplynulo, že 82% rozhodnutí bylo „evidence--based"(53% na základě výsledků klinických pokusů nebo systematických přehledů a 29% na základě přesvědčivých ale neexperimentálních důkazů). Podobné výsledky byly získány z auditů na psychiatrických, chirurgických, dětských i interních odděleních. Kromě přínosu EBM pro lékaře je také důležité, zda tyto nové postupy přináší zlepšení výsledků lékařské péče pro pacienta. Zatím žádná studie neodpověděla na tyto otázky, protože nebyly dosud překonány problémy jako je velikost vzorku, působení bias, zaslepení a dlouhodobé sledování, což by vědecká studie na toto téma vyžadovala. Navíc jsou zde i významné etické otázky při rozdělování pacientů do skupiny používající důkaz, nebo do skupiny kontrolní. Na druhé straně řada populačních studií, zaměřených na vyhodnocení následků ukázala, že pacienti, kteří byli léčeni na základě „důkazu", měli lepší výsledky. Jeden z pozitivních příkladů je nižší mortalita u pacientů po infarktu myokardu, kterým byla ordinována léčba aspirinem nebo betablokátory, dalším příkladem může být snížení mortality na akutní ce-rebrovaskulární příhodu o více než 20% tam, kde pracoviště častěji aplikovalo Warfarin a byla v provozu speciální cereb-rovaskulární jednotka intenzivní péče. Naopak negativním příkladem může být třikrát častější akutní cerebrovaskulární příhoda nebo smrt v nejbližších měsících u pacientů operovaných na karotidách, pokud nesplňovali „evidence-based" operační kritéria. 690 39.5 LIMITACE EBM Ověřování koncepce a provádění EBM klinickými pracovníky i teoretiky přineslo jak pozitivní tak i negativní reakce. Diskuse o těchto problémech připomněla , že existují 3 obecné limitující faktory ve vědecké práci ať už v základním nebo aplikovaném výzkumu a také v medicíně - nedostatek souvislých a pevných vědeckých důkazů, problémy při aplikaci jakéhokoliv důkazů do péče o jednotlivého pacienta a překonávání barier při snaze o provádění lékařské praxe na vysoké vědecké úrovni. Současně byly identifikovány 3 limitující faktory, které jsou unikátní pro provádění EBM. Předně potřeba nabytí nových dovedností při vyhledávání a kritickém hodnocení důkazů může být odrazující, i když lékařská péče založená na principech EBM může být úspěšně prováděna i při zvládnutí pouze vyhledávacích technik a používání už předem kriticky zhodnocených materiálů. Za druhé - časově zaneprázdnění klinici mají jen omezený časový prostor pro zvládnutí a aplikaci těchto nových dovedností a navíc zdroje požadované pro stálou dostupnost důkazů jsou v řadě zdravotnických zařízení nedostatečné. A konečně důkaz, že EBM skutečně funguje často přichází pomalu a pozdě. Na druhé straně diskuse o významu EBM odhalily také řadu „pseudolimitujících" faktorů, které většinou vznikly z nepochopení vlastního principu EBM. Prověření definice a jednotlivých kroků EBM rychle odmítlo kritiku, že EBM pouze očerňuje klinickou zkušenost lékařů, omezuje se pouze na klinický výzkum, ignoruje pacientovi hodnoty a preference a vytváří systém přístupu „kuchařky" k medicíně. Navíc EBM není v žádném případě přístup, který by zlevnil lékařskou praxi, protože prováděním EBM péče, za účelem zlepšení kvality života pacientů, náklady spíše stoupají a „hněv" zdravotnických manažerů a ekonomů také. Kromě toho řada praktických lékařů spontánně přiznala používání vyhledávacího modulu ve své praxi a tím jednoznačně vyvrátila tvrzení, že EBM je postupem, který je vhodný jen pro špičku vyvolených. Na řadě příkladů byla vyvrácena i domněnka, že EBM vede k „terapeutickému nihilismu" v případech, kde nejsou k dispozici výsledky klinického pokusu v daném problému. Kritikové medicíny založené na důkazu by ji mohli definovat jako „stále módnější tendence skupiny mladých, sebejistých a vysoce matematicky zdatných lékařských vědeckých pracovníků, snižovat práci zkušených kliniků pomocí kombinace epidemiologického žargonu a statistických kejklí" nebo „argument, obvykle předkládaný s téměř evangelizačním zápalem, že by žádný lékař, sestra, spotřebitel zdravotních služeb ani politik neměl vůbec nic podniknout ve vztahu ke zdraví, pokud a dokud se výsledky několika velkých a drahých výzkumných studií neobjeví v tisku a nejsou schváleny výborem expertů". Jiní staví své výhrady ještě silněji: „zdá se, že medicína založená na důkazu nahrazuje původní nálezy subjektivně vybranými, arbitrárne shrnutými, přepranými a ovlivněnými závěry neurčené platnosti či úplnosti. Provozují ji lidé neznámých schopností, zkušeností a dovedností, kteří používají metody, jejichž neprůhlednost brání vyhodnocení původních údajů". Tyto názory však byly již na základě opakované pozitivní zkušenosti s EBM vyvráceny. Přesto přirozeně, jako u každého jiného postupu zde existují výše popsané limitace, které ovšem nijak nesnižují základní význam EBM pro provádění lékařské praxe ve všech oborech medicíny. 691 40 ZÁKLADNÍ SOUČÁSTI EBM 40.1 SPRÁVNÁ FORMULACE KLINICKÉ OTÁZKY Prakticky ve všech případech, kdy pacient přichází k lékaři, vzniká potřeba nové informace, k některým otázkám diagnostiky, terapie i prognostické úvahy. Tyto informace jsou ve formě existujícího externího důkazu, který je třeba najít. Pro mnoho kliniků představuje formulace správné klinické otázky a pak vyhledávání odpovědi ve formě validního důkazu takový problém, že se i vzhledem k časové tísni k tomu nikdy neodhodlají. 40.1.1 FORMULACE PROBLÉMU Když by na příklad studenti medicíny byli požádáni, aby napsali pojednání o vysokém krevním tlaku, vyprodukují často dlouhé, učebnicové a v zásadě správné výpovědi o tom, co je vysoký krevní tlak, co je jeho příčinou a jaké jsou léčebné možnosti. Toho dne, kdy svá pojednání odevzdávají, ví většina z nich o vysokém krevním tlaku více než již praktikující lékař. Je jim jasné, že vysoký krevní tlak je nejběžnější jednotlivou příčinou mozkové mrtvice a že odhalení a léčba vysokého krevního tlaku u každého sníží incidenci mozkové mrtvice téměř o polovinu. Většina z nich si je vědoma toho, že mozková mrtvice, ač devastující, když k ní dojde, je spíše vzácnou příhodou a že léky na krevní tlak mají vedlejší účinky jako je únavnost, závratě, impotence a situace, kdy člověk „nedoběhne", je-li daleko k toaletě. Ale když je jim položena praktická otázka jako „U paní Novákové došlo k závratím pří užívání těchto léků na krevní tlak a ona chce ukončit veškerou medikaci; co byste jí poradili?", jsou zmateni. Cítí s paní Novákovou v jejích nesnázích, ale nedokáží vytáhnout ze svých stránek hustě psaného textu to jediné co paní Nováková potřebuje vědět. Zkušení lékaři (a mnohé sestry) by si mohli myslet, že dokáží zodpovědět otázku paní Novákové na základě vlastních osobních zkušeností a několik z nich může mít pravdu. A i kdyby měli v tomto případě pravdu, potřebovali by všezahrnující systém na převedení změti informací o pacientovi (soubor chorobných příznaků, fyzikální známky, výsledky testů a znalost toho, co se minule přihodilo tomuto nebo podobnému pacientovi), pacientových strachů a hodnot a dalších věcí, jež mohou mít ve vztahu k dané situaci význam (tušení, napůl zapamatovaný článek, názor staršího a moudřejšího kolegy nebo náhodou objevený odstavec při listování učebnicí) na krátký souhrn toho, o jaký problém jde a jaké specifické doplňující informace jsou potřeba, aby mohl být tento problém vyřešen. Sackett a spol. nedávno publikovali návod na položení dobré klinické otázky (Sackett, 1991): • Nejprve přesně definujte, o kom otázka je (tj. ptejte se , Jak bych popsal skupinu pacientů podobnou této?"). • Potom definujte, jaký manévr zvažujete u tohoto pacienta nebo populace (například farmakoterapii) a, je-li to nutné, manévr pro porovnání (například placebo nebo běžnou standardní léčbu). • Nakonec definujte žádoucí (nebo nežádoucí) výsledek (například snížení mortality, lepší kvalitu života, celkovou úsporu nákladů na zdravotní služby a tak dále). Druhý krok se ve skutečnosti nemusí týkat farmakotera-pie, chirurgické operace nebo jiné intervence. Tím „manévrem" může například být expozice domnělému karcinogénu nebo rozpoznání určitého náhradního cílového ukazatele v krevním testu nebo v jiném vyšetření. (Náhradní cílový ukazatel je něco, co předpovídá, nebo se říká, že předpovídá, pozdější vývoj nebo progresi onemocnění).Ve skutečnosti je velmi málo testů, které spolehlivě fungují jako křišťálová koule pro pacientovu budoucnost, pokud jde o zdraví (tvrzení „Lékař se podíval na výsledky testů a řekl mi, že mám šest měsíců života" obvykle odráží buď špatnou paměť nebo nezodpovědný lékařův přístup!). V obou těchto případech bude „výsledkem" vývoj rakoviny (nebo jiného onemocnění) o několik let později. Avšak u mnoha klinických problémů s jednotlivými pacienty sestává onen „manévr" ze specifické intervence zahájené zdravotníkem. Tedy, v případě paní Novákové by mohla otázka vypadat asi takto: „U 681eté pacientky s esenciální hypertenzí, žádným dalším onemocněním a nevýznamnou anamnézou, převáží výhody pokračování léčby hydrochlorothiazidem (především snížené riziko mozkové mrtvice) nad obtížemi?". Za povšimnutí stojí, že při formulaci této specifické otázky bylo již stanoveno, že paní Nováková nikdy neměla srdeční záchvat, mozkovou mrtvici nebo časné varovné známky jako přechodnou paralýzu nebo ztrátu zraku. Pokud by měla, riziko následné mozkové mrtvice u ní by bylo mnohem vyšší a bylo by třeba pozměnit rovnici riziko-prospěch, aby tyto skutečnosti odrážela. Pro zodpovězení položené otázky, je třeba určit nejen riziko mozkové mrtvice u neléčené hypertenze, ale také pravděpodobný pokles rizika, který je možno očekávat u far-makoterapie. To je ve skutečnosti parafráze obecnější otázky („Převáží v tomto případě prospěch z léčby nad riziky?"), která však měla být položena na prvním místě předtím, než byl paní Novákové předepsán hydrochlorothiazid, a kterou by si ovšem měli klást všichni lékaři pokaždé, když sahají po bloku s recepty. U paní Novákové není nezbytnou alternativou k pokračování léčby tímto lékem neužívat vůbec žádný lék, protože mohou být jiné léky se stejným účinkem, ale s méně významnými vedlejšími účinky nebo nefarmakologická intervence , jako je cvičení, omezení soli, nebo akupunktura. Ne všechny z těchto přístupů by paní Novákové pomohly nebo byly pro ni přijatelné, ale bylo by docela vhodné pátrat po důkazech zdali by jí mohly pomoci. Odpovědi na některé z těchto otázek by se jistě našly v lékařské literatuře a kapitola 2.2 popisuje, jak hledat odpovídající publikace, jakmile už byl problém formulován. Ale než bude započato vyhledávání důkazu, je dobré věnovat ještě jednomu aspektu významnou pozornost v případě pacientky s vysokým krevním tlakem. Aby bylo možno stanovit její osobní priority (jak hodnotí 10% pokles rizika mozkové mrtvice během pěti let ve srovnání s neschopností jít dnes bez doprovodu nakupovat?), je třeba jít přímo za paní Novákovou a ne za specialistou přes vysoký krevní tlak či do databáze Medline! V raných dnech medicíny založené na důkazu bylo značné nadšení pro používání schémat v rozhodovacích procesech lékařů. Aby ale byla i pacientova perspektiva zahrnuta do léčebné volby založené na důkazu, to se v praxi často ukazovalo jako nemožné, protože zkušenosti pacientů jsou složité příběhy, které odmítají být omezeny na schéma s rozhodováními typu ano/ne. Možná nejsilnější kritikou medicíny založené na důkazu je, že potenciálně vypouští pacientovu vlastní perspektivu při jeho nemoci ve prospěch průměrného účinku na vzorek populace nebo různé průměr- 692 ně ukazatele vypočítané lékařskými statistiky. V několika minulých letech dosáhlo hnutí medicíny založené na důkazu rychlého pokroku v rozvoji praktičtější metodologie pro začlenění perspektivy pacienta do klinického rozhodování, v zavedení politiky opírání se o důkazy a v designu a provádění výzkumných pokusů. Správnou formulaci klinických otázek je možno prezentovat na následujícím příkladu: Na interní oddělení byl přijat 77letý muž s dusností a teplotou. Onemocněl před 4 dny s příznaky mírné teploty, rýmy, mrazením, bolestmi ve svalech a s neproduktivním kašlem. Den před přijetím se objevila dusnost po námaze, hnisavé sputum, bolest na boku hrudníku v inspiriu a třesavka. Jeho celkový zdravotní stav je docela dobrý. Již 12 let má esenciální hypertenzi, dobře kompenzovanou diuretickou léčbou. Nekouří a doma se sám o sebe postará. Při vyšetření byl počet dechů 28, puls 108 a teplota 39.2 °C. Měl lehkou cya-nózu, hrudník se rozevíral symetricky a neměl prodloužené expirium. Byla zjištěna leukocytóza a hyponatremie. Jako přijímací diagnóza byla určena pneumonie s hypoxemic, byl naplánován rtg plic, vyšetření sputa a ordinován kyslík a antbiotika. Při vizitě byli požádáni lékaři o otázky k tomuto případu. První otázka, která se nabízí je: „jaké mikrobiální agens způsobuje pneumonii?" Tato otázka patří mezi tzv. základní otázky, které mají obvykle dvě komponenty - kořen (základ) otázky .. .kdo, co, kde, kdy, jak proč - porucha (nemoc), aspekty poruchy Příklad: „co způsobuje cyanózu? " Tyto základní otázky mohou pokrývat celou škálu biologických, psychologických a sociologických aspektů lidského zdraví a nemoci. Další otázky od zkušenějších lékařů by mohly vypadat asi takto: • „jsou u pacientů se suspektní pneumonii některé příznaky dostatečně průkazné, aby samy o sobě potvrdily nebo vyloučily pneumonii a nebo je rtg plic nezbytným vyšetřením pro určení diagnózy?" • „je u pacientů s pneumonii pravděpodobnost Legionelové infekce dostatečně velká k tomu, aby byly do počátečního léčebného spektra oprávněně zahrnuta i antibiotika proti této infekci?" • „mohou u pacientů s pneumonii klinické příznaky dostatečně předpovídat průběh a výsledek nemoci, aby nerizi-koví pacienti mohli být bezpečně léčeni doma?" Tyto otázky požadují specifické znalosti o diagnostice, léčbě a prognóze u pacientů s pneumonii, které by mohly být nazývány jako nástavbové znalosti. A otázky, které se na tyto znalosti ptají můžeme také nazývat nástavbové a mají obvykle čtyři komponenty: • pacient a/nebo problém • intervence (velmi široce definovaná zahrnující expozici, léčbu, diagnostický test, prognostický faktor, pacientovo vnímaní apod.) • srovnání intervencí (pokud to je relevantní) • klinický výsledek Příklad: „může u starších pacientů se srdečním selháním v důsledku izolované diastolické dysfunkce přidání digoxinu ke standardní terapii ACE inhibitory a diuretiky poskytnout dostatečnou redukci morbidity a/nebo mortality, aby to vyvážilo jeho nežádoucí vedlejší účinky? " Stejně jako základní otázky, také tyto nástavbové otázky zahrnují široké spektrum biologických a ostatních aspektů zdraví a nemoci. Potřeba základních a nástavbových otázek podle klinické zkušeností Obr. 1 nástavbové otázky základní otázky A B klinická zkušenost Klinik potřebuje jak základní tak i nástavbové znalosti v poměru, který se s časem mění v závislosti na zkušenosti s daným klinickým problémem (obrázek 1 ). Jestliže zkušenost je na úrovni bodu A jako u studenta medicíny, tak většina otázek bude mít charakter otázek na základní znalosti. Jak narůstá klinická zkušenost - bod B - bude vzrůstat poměr otázek nástavbových a nabytím dalších zkušeností - bod C - bude většina otázek nástavbového charakteru. Z obrázku je zřetelné, že nikdo není úplný „zelenáč", aby se nemohl poučit i z nástavbové otázky a na druhé straně nikdo není tak zkušený aby nemohl potřebovat i základní znalosti. 40.2 KDE HLEDAT NEJLEPŠÍ DŮKAZY Již před více než 50 lety řekl dr. Sydney Burwell, děkan Harvardské lékařské fakulty svým studentům: „Polovina toho, co se dnes učíte, nebude za 10 let již pravda, ale problém je v tom, že nevím, která polovina to bude". A v dnešní době je tento problém možná ještě aktuálnější vzhledem k rychlému vývoji znalostí v jednotlivých lékařských oborech. Jedním z řešení tohoto problému rychlého stárnutí vědomostí je „učení se otázkou". To znamená, jestliže existuje nějaká klinická otázka u které není jistota správné a nejlepší odpovědi je třeba se naučit efektivnímu hledání této nejlepší odpovědi v dostupných výstupech lékařské vědy (termín nejlepší odpověď je částečně rizikový, protože někdo může oprávněně namítat, že to co platilo jako nejlepší odpověď vloni, již letos neplatí). Proces učení se otázkou závisí na schopnosti rychlého a efektivního nalezení „nejlepšího důkazu" na daný klinický problém. Zda tento proces bude úspěšný záleží na tom, jak je otázka položená, jaké informační zdroje se používají a na zkušenosti s vyhledáváním nejlepšího důkazu v těchto zdrojích. V této oblasti jsou hodně zkušení knihovníci a jiní odborníci v lékařské informatice, od kterých lze získat cenné informace. Kde tedy hledat nejlepší důkaz? • spalte všechny tradiční učebnice i když se v nich dá nalézt něco užitečného (např. o patofyziologii klinického problému, ale už asi nic moc přínosného o příčinách, diagnostice, léčbě, prognóze a prevenci dané nemoci) 693 • mohou být ale i moderní netradiční učebnice, většinou elektronického charakteru, které však musí být pravidelně a často revidovány (alespoň jednou za rok) a měly by obsahovat řadu odkazů na literaturu, aby se čtenář mohl podívat do originálních zdrojů na detaily (některé moderní učebnice splňují tyto požadavky např. Clinical Evidence, Evidence-Based on Call, Evidence-based Cardiology aj.) • investujte do databází, obsahující potřebné důkazy • v dnešní době již existuje řada elektronických databází, které i když se většinou nesoustřeďují na jednu klinickou oblast, mohou poskytnout potřebné důkazy (Evidence-based Medicine Reviews, Cochrane Database of Systematic Reviews, Best Evidence, Cancerlit, Aidsline, MEDLINE a jiné) • přestaňte používat předplatné pro vaše oblíbené časopisy, protože jsou dnes lepší zdroje platných informací • investujte do „evidence-based" časopisů ve vašem oboru, které mimo jiné přinášejí strukturovaná abstrakta nejlep-ších'studií (někdy se používá termín „sekundární pubika-ce") • dále existují počítačové podpůrné systémy pro klinická rozhodování Jak hledat důkaz pro řešení problémů u daného pacienta? Je třeba se zaměřit na 3 problémy: • položit správně formulovanou otázku (viz kapitola 2.1) • na nejlepší odpověď, kterou jste v současnosti schopni poskytnout • na nejlepší zdroje důkazů, které budete konzultovat při vyhledávání nejlepší odpovědi Příklad: Pan Vomáčka je 56letý účetní, mírně obézní, s diabetem 2 typu, který byl u něho zjištěn před 11 lety. Kouří 25 let a snaží se přestat. Zatím u něho nebyly zjištěný žádné komplikace diabetů. Hladina cukruje dobře kontrolovánaperorálnímipřípravky, ale má mírně zvýšený krevní tlak, v průměru 158194 mmHg. Je navržena léčba na snížení krevního tlaku. Během posledních 2 let nebyl schopen snížit svoji váhu. Preferuje přírodní přípravky a nechce užívat další předepsanou léčbu. Je přístupný přesvědčování, ale chce vidět důkazy, že snížením krevního tlaku pomocí léčby se pacientům jako je on tj. s diabetem a s hypertenzí více prospěje než uškodí. Jako účetní by rád slyšel určitou kvantifikaci prospěchu, kterou může očekávat z další léčby, kterou mu chcete předepsat. Nyní zkuste sami cvičně odpovědět na 3 výše uvedené problémy. Dále jste zjistili od jeho manželky, že užívá vitamin E a beta-karoten pro snížení rizika srdečního onemocnění, na doporučení své manželky, která informace získala z Internetu. Zkuste opět cvičně odpovědět na 3 výše uvedené problémy. Vaše odpověď by mohla znít asi takto: Správně formulovaná otázka: „může u 561etého muže s diabetem 2 typu a s neléčenou hypertenzí medikamentózni kontrola krevního tlaku snížit následnou morbiditu a mortalitu?" Rozhodnutí, kde hledat důkaz - můžeme začít na příklad s Evidence-Based Medicine Reviews a zadáme-li heslo „diabetes mellitus a hypertenze", dostaneme více než 100 odkazů, jestliže přidáme „randomizovaný klinický pokus", sníží se počet odkazů na zvládnutelných 19. Z nich získáme informaci: „antihypertenzivní léčba sníží mortalitu u osob s diabetem, s cílovým krevním tlakem 130/85, doporuče- ným experty". Tento abstrakt však nepodává kvantitativní informaci o prospěchu léčby. V MEDLINE můžeme na toto téma nalézt více než 10000 odkazů a kombinujeme-li naše vyhledávací požadavky, dostaneme se k počtu 63 kontrolovaných studií na toto téma. A na příklad United Kingdom Prospective Diabetes Study ukázala, že intenzivní kontrola krevního tlaku ve srovnání s mírně hypertenzivními pacienty s diabetem 2 typu vedla ke snížení relativního rizika (RR) u 24% pokud cílovým stavem (end point) je diabetes, u 32% pokud jde o úmrtí na diabet, u 44% pokud jde o cerebro-vaskulární příhodu a 37% u mikrovaskulárních komplikací diabetů. Aplikace důkazu: Pokud jste se přesvědčili, že nalezený důkaz je validní a použitelný u pana Vomáčky, pak je třeba s ním tyto poznatky diskutovat a nakonec pan Vomáčka bude souhlasit s navrženou léčbou hypertenze. Ukazovat někomu cestu džunglí, jež se nazývá lékařská literatura, není jednoduchý úkol. Můžete správně číst publikaci podle všech pravidel, ale pokud čtete tu nesprávnou, tak už můžete rovnou dělat něco úplně jiného. V regálech knihovny je obrovské množství lékařských článků a každý měsíc vychází na celém světě okolo 5000 lékařských časopisů a počet různých časopisů, které dnes existují, jen aby shrnuly články v těch ostatních, pravděpodobně přesahuje 250. Jen u 10-15 % materiálu, který se dnes objeví v tisku, se následně prokáže trvalá vědecká hodnota. Množství výzkumných studií ukazuje, že klinici si často nejsou vědomi rozsahu lékařské literatury a toho, jak se k ní dostat. Dr. David Jewell ve své vynikající knize Critical reading for primary care připomíná, že jsou tři úrovně čtení. 1. Listování, kdy se zběžně probíráme knihami a časopisy a pátráme po něčem, co by nás mohlo zaujmout. 2. Čtení pro informace, kdy v literatuře hledáme odpovědi na specifické otázky, obvykle ve vztahu k problému, s nímž jsme se setkali v reálném životě. 3. Čtení pro výzkum, kdy se snažíme získat vyčerpávající pohled na existující stav vědění, neznalosti a nejistoty v definované oblasti. V praxi mnozí z nás většinu svých informací získávají z listování. Nadměrně užívat pravidel kritického posuzování by znamenalo zabít radost z pnležitostného čtení. Avšak Jewell nás upozorňuje, abychom řídili své kroky mezi povolnou důvěřivostí vůči všemu a přehnaně náročným inte-lektualizmem formálně kritického posuzování. Databáze MEDLINE Pokud jen tak listujete, můžete číst, co se vám zlíbí, a v libovolném pořadí. Pokud čtete kvůli informacím (cílené vyhledávání) nebo z důvodu výzkumu (systematický přehled), promrháte čas a unikne vám mnoho hodnotných článků, jestliže jen tak náhodně hledáte. Mnohé lékařské články jsou indexovány v obrovské databázi Medline, k níž je téměř univerzální přístup v lékařských a vědeckých knihovnách v rozvinutých zemích. Když pátráte po systematickém přehledu (kontrolované kvality) všech důkazů k určitému námětu, pravděpodobně byste měli začít s databází Cochrane (Cochrane Database of Systematic Reviews) spíše než s Medline, která užívá velice podobných vyhledávacích principů. Pokud však nejste obeznámeni ani s jednou z nich, bude asi snadnější osvojit si Medline. Medline sestavuje knihovna National Library of Medicine v USA a indexuje (vede ve svém rejstříku) přes 4000 časopisů publikovaných ve více než 70 zemích. Informace v Medline jsou k dispozici ve třech podobách. 694 • Tištěná (Index Medicus, příručka ve formě rejstříku každoročně doplňovaná o novinky, z níž se tvoří elektronická verze). • On-line (celá databáze je od roku 1966 do nynějška ve výkonném centrálním počítači a přístupná elektronickou cestou, například přes Internet). • CD-ROM (celá databáze na 10 až 18 CD v závislosti na výrobci). Databáze Medline je vždy stejná, ať ji prodává jakákoli společnost, ale příkazy, jež potřebujete napsat, abyste se k ní dostali, se liší podle programu na CD-ROM. Komerční poskytovatelé Medline on-line a/nebo na CD-ROM zahrnují O vid Technologies (O VID), Silver Platter Information Ltd (WinSPIRS), Aries Systems lne (Knowledge Finder) a PubMed. Nejlepší způsob, jak se naučit používat Medline, je sejít se s proškoleným knihovníkem, informatikem nebo jiným zkušeným uživatelem. Nemáte-li odpor k technice, můžete pochytit základy za necelou hodinu. Pamatujte, že články lze najít dvěma způsoby: • Podle kteréhokoli slova v seznamu databáze včetně slov v názvu publikace, abstraktu, podle jména autora a instituce, která výzkum provedla (nepřehlédněte: abstrakt je krátký souhrn toho, o čem je článek, a najdete jej jak v databázi, tak na začátku vytištěného článku). • Podle autorizovaného tematicky uspořádaného seznamu medicínských názvů, známého jako MeSH termíny (pojmy) neboli kategorizované termíny medicínských subjektů. Pro znázornění, jak pracuje Medline, byly zpracovány některé běžné úkoly, jež je třeba zvládnout při vyhledávání. K vytvoření následujících scénářů byl použit program O VID. Vloženy jsou poznámky o programech WinSPIRS (což je systém přednostně užívaný mnoha univerzitami) a PubMed (jenž je bezplatně dostupný na Internetu, přichází s již hotovými vyhledávacími filtry, které můžete vložit stiskem tlačítka, a připojuje vyhledávání PreMedline, databáze toho, co má být brzy publikováno, a nově publikovaných článků). Všechny tyto systémy (Ovid, WinSPIRS a PubMed) jsou určeny k použití s Booleovskou logikou, tj. vkládání určitých slov (jako „hypertension", „therapy" a tak dále) spojených operátory (jako „and", „or" a „not"). Knowledge Finder je odlišný program s Medline, který je nabízen jako systém s „neostrou logikou" (angl. „fuzzy logic"); jinými slovy je zaměřen na zvládnutí celých otázek jako „Jaká je nejlepší léčba hypertenze?" a říká se, že se hodí spíše pro hodně nenáročného uživatele (tj. někoho s malým nebo žádným výcvikem). Pojetí neostré logiky Knowledge Finderu bylo shledáno jako rychlé a účinné a doporučeno jako investice pro vaši organizaci, pokud očekáváte, že hodně neškolených lidí bude provádět své vlastní vyhledávání. Praktická cvičení vložená do této kapitoly jsou rovnocenně proveditelná se všemi typy programů s Medline. Úkol 1: Pokoušíte se najít určitou publikaci, níž víte, že existuje Řešení: Prohledávejte databázi pomocí přípony pole (název, autor, časopis, instituce atd.) nebo pomocí slov v textu. To by nemělo trvat dlouho. Nepotřebujete vyčerpávající hledání tématu. Jděte do té části databáze, jež zahrnuje přibližný rok uveřejnění publikace (obvykle posledních pět let). Výběr tohoto je jednou z prvních věcí, o kterou vás systém požádá, abyste učinili na hlavní vyhledávací obrazovce Medline; pokud již jste v hlavní nabídce Medline, vyberte „database" (Alt-B). Pokud znáte název publikace (nebo přibližný název) a snad i časopis, ve kterém vyšla, můžete použít vyhledávací klíč pro název a časopis nebo (to je rychlejší) pnpony oblastí .ti a .jn. Tabulka 2.1 ukazuje některé užitečné pnpony užívané OVIDem, z nichž většina již vysvětluje sama sebe. Ale všimněte si, že přípona .ui představuje jedinečné číslo, které můžete použít k identifikaci určité položky v Medline. Pokud najdete článek, který si možná budete chtít vyvolat znovu, je často rychlejší napsat tento jedinečný identifikátor než autora, název, časopis a tak dále. Pokoušíte se třeba najít publikaci něco jako „A survey of cervical cancer screening in people with learning disability", 0 níž si pamatujete, že jste ji viděli v BMJ před pár lety. Ujistěte se, že jste NEzaškrtli rámeček „Map term to subject heading" a potom na počítači zadejte následující. 1 cervical cancer.ti To vám nabídne přibližně 750 možných článků v sestavě 1. Nyní napište: 2 survey.ti Tím dostanete přibližně 4500 možných článků v sestavě 2. Nyní napište: 3 learning disability.ti Dostanete přibližně 100 možných článků v sestavě 3. Nyní napište: 4 BMJ.jn Tímto dostanete několik tisíc článků v sestavě 4, tj. všechny články uvedené v této části databáze Medline pro roky, jež jste vybrali z BMJ. Nyní zkombinujte tyto sestavy tak, že napíšete: 5 1 and 2 and 3 and 4 To vám nabídne cokoli s „cervical cancer" a „survey" a „learning disability" v názvu a zároveň co bylo uveřejněno v BMJ: jediný článek v pěti krocích. Všimněte si, že v OVIDu můžete také kombinovat sestavy použitím tlačítka „combine" nahoře na obrazovce. To vše jste bývali mohli udělat v jednom kroku využitím následujícího příkazu (zkuste jej nyní): 6 (cervical cancer AND survey AND learning disability)^ and BMJ.jn Tento krok znázorňuje použití boolovského operátoru „and", který vám nabídne články společné oběma sestavám. Použití operátoru „or" jednoduše spojí dohromady obě sestavy. Všimněte si, že v OVIDu byste neměli obecně používat zkratky názvů časopisů, avšak jiné programové balíčky mohou užívat standardních zkratek. Dvěma důležitými výjimkami z tohoto pravidla v OVIDu jsou Journal of the American Medical Association (JAMA) a British Medical Journal, který změnil svůj oficiální název na BMJ v roce 1988. K vyhledávání článků z BMJ od roku 1988 do nynějška musíte použít BMJ; články do roku 1987 včetně musíte hledat jak pod British Medical Journal, tak pod British Medical Journal clinical research ed. Dalším důležitým bodem je, že vyhledávání podle slova v názvu odhalí pouze přesně dané slovo; například toto vyhledávání pomine článek, jehož název je o „learning disabilities" a ne „disability". K zvládnutí tohoto problému potřebujete použít náhradní znak za libovolné znaky (viz dále v tomto oddíle). Často neznáte název publikace, ale víte, kdo ji napsal. Nebo na vás mohl udělat dojem článek, který jste četli (nebo přednáška, již jste slyšeli) od určitého autora a chcete vědět, co ještě publikoval. Odstraňte vaše předchozí vyhledávání výběrem „edit" z nabídkové lišty nahoře na hlavní vyhledávací obrazovce a následnou volbou „delete all". Pokusme se najít publikace profesora Sira Michaela Marmota za posledních pět let. Syntaxe je následující. Napište: 695 1 marmot-m.au Dostanete všechny články v této části databáze, v kterých M. Marmot figuruje jako autor nebo spoluautor - približne 35 publikací. Ale jako u mnoha autora, Michael není jediným M. Marmotem v lékařské literatuře a - další potíž - má prostřední iniciálu, kterou ve svých publikacích používá nedůsledně. Pokud již jeho prostřední iniciálu neznáte, musíte použít pravostranné rozšíření resp. zkrácení, abyste ji zjistili. Zadejte: 2 marmot-m$.au Takto získáte okolo 60 článků, jež zahrnují předchozích 35, jež jste našli pod M. Marmotem, plus články od MA. Marmota, MD. Marmota a dalších 25 článků od - našli jsme jej - MG. Marmota! Povšimněte si, že v OVIDu znak dolaru je náhradním znakem za libovolné znaky znamenajícím „jakékoli písmeno nebo písmena". U vyhledávacího programu od Silver Platter je odpovídajícím znakem hvězdička (*). Můžete použít náhradní znak při zkrácení slova, abyste hledali slovní základ v rámci vyhledávání pomocí slova v textu; například syntaxe electric$.tw (v OVIDu) odhalí články s „electric", „electricity", „electrical" a tak podobně v názvu nebo abstraktu. Též jste mohli použít následující jednořádkový příkaz: 3 (marmot-m or marmot-mg).au Dostanete celkem okolo 60 článků, které nyní potřebujete ručně prolistovat, abyste vyloučili jakéhokoli M. Marmota jiného než profesora Sira Michaela! Užitečné také může také být vyhledávání podle instituce. To vám poskytne všechny publikace, které vznikly v určité výzkumné instituci. Například napište: 4 (withington hospital and man ehester) .in a najdete tak všechny publikace, kde se „Withington Hospital, Manchester" vyskytuje v poli „institution" (buď jako hlavní adresa, kde výzkum proběhl, nebo jako jedna ze spoluautorských institucí). Pokud si nemůžete vzpomenout na název článku, který chcete, ale znáte nějaké přesné klíčové slova z abstraktu, mohlo by být rychlejší hledat pod slovem v textu než pod MeSH termínem (které jsou vysvětleny v oddíle 2.4). Přípony oblastí, jež potřebujete, jsou .ti (název), .ab (abstrakt) a .tw (slovo v textu = buď v názvu nebo v abstraktu). Řekněme, že jste se pokoušeli vyhledat úvodník z jednoho z lékařských časopisů (nemůžete si vzpomenout z kterého) z roku 1999 o medicíně založené na důkazu. Vymažte vaše předešlé vyhledávání a zadejte: 1 evidence based medicine.tw and 1999.yr Dostanete dohromady okolo 100 článků. Nyní byste mohli ručně listovat abstrakty, abyste identifikovali ten hledaný. Nebo můžete zdokonalit vaše vyhledávání pomocí typu publikace, jak níže vidíte. Napište: 2 limit 1 to editorial Ve skutečnosti jste mohli toto vše udělat v jednom kroku s následujícím příkazem: 3 evidence based medicine.tw and 1999.yr and edito-rial.pt kde .tw znamená „slovo v textu" (v názvu nebo abstraktu), .yr znamená „rok uveřejnění" a .pt znamená „typ publikace". (Mohli jste rovněž použít tlačítko „limit set" zde nahoře na obrazovce a potom vybrat typ publikace jako „editorial".) Ale všimněte si, že tato metoda vytáhne pouze články s přesným řetězcem „evidence based medicine" jakožto slovem v textu. Pomine například články, jež hovoří o „evidence based health care" místo o medicíně založené na důkazech. V takové situaci potřebujeme hledat pod MeSH termíny, jak je níže vysvětleno, a/nebo pokrýt všechny možné obměny slova v textu (včetně různých způsobů pravopisu každého slova). Cvičení 1 1. Pokuste se vyhledat následující články s použitím co nejmenšího počtu příkazů. a) Systematický přehled publikovaného zhotovený Craigem a kolegy o měření teploty u dětí v axille v porovnání s rektem uveřejněný ve významném časopise v angličtině přibližně v roce 2000. (Nezapomeňte, že systém OVID potřebuje iniciálu autorova jména.) b) Publikace od týmu profesora Marshe z Oxfordu ohledně vlivu fenobarbitalu na četnost záchvatů. (Všimněte si, že nepotřebujete úplnou adresu instituce, abyste hledali pod touto oblastí.) c) Publikace popisující úmrtnost z různých příčin u účastníků studie HOPE (Heart Outcomes Prevention Evaluation) od Salima Yusufa a kolegů, uveřejněná buď v New England Journal of Medicine nebo v Journal of the American Medical Association (nezapomeňte, že Medline indexuje ten první pod jeho úplným názvem a ted druhý jako JAMA). d) Dva články uveřejněné v roce 1995 y American Journal of Medical Genetics ohledně dědičnosti schizofrenie u izraelských subjektů. Podívejte se, zda je nedokážete najít jediným příkazem s použitím přípon oblastí. 2. Vysledujte sérii článků na pokračování uveřejněnou v Journal of the American Medical Association od roku 1992 do nynějška, nazvanou „Users' guides to the medical literature". 3. Kolik dokážete najít článků od profesora Davida Sacketta, který jako profesor Marmot používá nedůsledně svou prostřední iniciálu? 4. Zjistěte, kolik bylo uveřejněno článků od Sandry Goldbeck-Wood v BMJ v roce 1999. Pamatujte, že abyste v OVIDu omezili vaše vyhledávání na určitý rok, použijte tlačítko „limit set" nahoře na obrazovce a potom vyberte „publication year" nebo, jiná možnost, použijte příponu pole .yr (např. 1994.yr). Úkol 2: Chcete zodpovědět velmi specifickou klinickou otázku Řešení: Vytvořte cílené (specifické) vyhledávání kombinací dvou nebo více obsáhlých (senzitivních) vyhledávání. Matka mladé dívky s mentální anorexií, jejíž menstruační cykly ustaly, požádala o hormonální léky k zastavení řídnutí kostí. Zdálo se to jako rozumný požadavek, ačkoli tu byly etické problémy ke zvážení. Ale je nějaký důkaz, že podání hormonu za těchto okolností opravdu předejde dlouhodobému úbytku kostní hmoty? Je třeba ověřit tento námět s použitím Medline. Abyste tuto otázku zodpověděli, potřebujete hledat velmi obsáhle pod „anorexia nervosa", „osteoporosis" a „oral contraceptives". Nejprve vymažte z obrazovky předešlá vyhledávání. Pak se ujistěte, že je zatrženo „Map text to subject heading". Teď napište: 1 anorexia nervosa Nenapsali jste příponu pole (jako .tw), tak i když zapomenete zatrhnout rámeček „Map text to subject heading", systém OVID to automaticky udělá, tj. pokusí se najít shodu mezi vaším požadavkem a jednou ze svých standardních kategorií medicínských témat (zkráceně MeSH a hovorově známých jako „mesh termíny"). Chvilku počkejte a měli byste na obrazovce spatřit dvě volby. První je „anorexia nervosa" jakožto MeSH termín a jsou vám nabídnuty dvě doplňkové volby: „Explode" a „Focus". Pro tuto chvíli ignorujte rámeček „explode" (je vysvětlen dále v tomto oddíle) a vezměte v úvahu rámeček „focus". Chcete pouze články, jež jsou skutečně o mentální anorexii, nebo chcete jakýkoli článek, který se o mentální anorexii jen mimochodem 696 zmiňuje? Řekněme, že se opravdu chceme omezit na hlavní předmět (angl. „focus"). Potom nám obrazovka nabídne volbu podkategorií, ale my si jich teď nebudeme všímat. Vyberte „Include all subheadings" („včetně všech podkategorií"). Mohli jsme dosáhnout téhož použitím následujícího jednořádkového příkazu. Napište: 2 *anorexia nervosa/ kde * ukazuje, že termín je hlavním předmětem článku, a/ představuje MeSH termín. V této sadě byste měli mít kolem 750 článků. Druhou volbou, jež vám byla nabídnuta, bylo vyhledávání podle slova v textu („textword search") pro termín „anorexia nervosa" v názvu nebo abstraktu. Jinými slovy kdykoli požádáte OVID, aby termín zmapoval, nabídne vám také provést vyhledávání v názvu nebo abstraktu, tj. najde vám články (řekněme) se slovy „anorexia nervosa" v názvu nebo abstraktu, dokonce i když článek nebyl indexován pod touto MeSH kategorií. Tento rámeček byste také měli zatrhnout. Syntaxe, kterou spatříte na obrazovce, jakmile byl termín zmapován, je: 1 anorexia nervosa.mp [title, abstract, registry number word, or MeSH] Všimněte si, že ne všechny programové balíčky s Medline automaticky zmapují vaše doporučení na MeSH termíny. U vyhledávacího programu od Silver Platter například potřebujete vstoupit do vaší předmětové skupiny (angl. heading) a kliknout na tlačítko „suggest". V tomto případě vám obrazovka nabídne buď „eating disorders" nebo „anorexia nervosa" a požádá vás, abyste vybrali ten významově nejbližší. Zvolte „anorexia nervosa" (mezerník ke zvýraznění textu, pak stiskněte „return"). Podobně abyste získali články o osteoporóze (což je v angličtině také MeSH termín), použijte následující jednořádkový příkaz: 2 osteoporosis/ Měli byste získat kolem 3000 článků. Povšimněte si, že v OVIDu, pokud víte, že téma, který chcete, je oficiálním MeSH termínem, můžete zkrátit proces mapování napsáním lomítka (/) za slovem. To může značně ušetřit čas. Rovněž si všimněte, že jsme zde nepoužili hvězdičku, protože osteoporóza nemusí být hlavním tématem článku, který hledáme. Nakonec vložte termín „oral contraceptives" (bez hvězdičky a bez lomítka), abyste viděli, co je zde MeSH termínem. MeSH termín je „contraceptives, oral" (pokud jste to věděli, mohli jste použít syntaxi contraceptives,oral/, ale nedělejte to z důvodu, který vám hned vysvětlím). 3 oral contraceptives OVID zmapuje váš dotaz na „contraceptives,oral" a zeptá se vás, zdali chcete omezit vaši sestavu na hlavní předmět (angl. focus; pravděpodobně ne, tak tento rámeček nezatrh-něte) a zdali chcete rozvinout termín (tj. najít všechny jeho specifičtější varianty; angl. explode). MeSH termíny jsou jako větve stromu, například s „asthma", jež se dále dělí na „asthma in children", „occupational asthma" a tak dále. Tvůrci rejstříku Medline jsou instruováni tak, aby indexovali položky použitím tak specifických MeSH termínů, jako to jen jde. Pokud jen žádáte články na „asthma", uniknou vám všechna konečná rozvětvení, pokud termín „nerozvinete". (Avšak všimněte si, že takovéto vyhledávání variant daného termínu je možné jen dolů po stromové struktuře MeSH, nikoli vzhůru.) Pokud nezatrhnete rámeček „explode" pro „contracep-tives,oral", vaše sestava bude pravděpodobně obsahovat okolo 700 článků, zatímco rozvinutý termín jich zahrne přibližně 5000! Znáte-li MeSH termín, je rychlou cestou k jeho rozvinutí: 3 exp contraceptives, oral/ Pokud tyto tří sestavy zkombinujete, buď použitím jejich čísel 1 and 2 and 3 nebo napsáním jednořádkového příkazu: 4 *anorexia nervosa/ and osteoporosis/ and exp contraceptives, oral/ prohledáte přes 6000 článků a získáte sadu pouze tří odkazů - dopis, původní výzkumnou studii a důležitý přehledný článek (Pokud je nenajdete, zkontrolujte si pečlivě syntaxi vašeho vyhledávání, pak zkuste nechat proběhnout stejné vyhledávání databází za předchozích pět let použitím tlačítka „database" nahoře na obrazovce.) Cvičení 2 Pokuste se najít sadu méně než pěti článků týkajících se některé z následujících otázek či klinických problémů. 1. Lze vysokou incidenci ischemické nemoci srdeční u určitých asijských etnických skupin přičíst rozdílům v hladinách inzulínu? 2. Hypotéza spojující vitamín C s léčbou nachlazení má zjevně něco společného s jeho úlohou jakožto antioxidan-tu. Je nějaký (klinický nebo teoretický) důkaz, který tuto hypotézu podporuje? 3. Jaká by měla být péče u tyreotoxikózy v těhotenství? Ujistěte se, že provádíte vyhledávání MeSH termínů pro každé téma použitím hvězdičky, abyste se omezili na hlavní oblast, a použitím lomítka k označení toho, o čem víte, že je to MeSH termín. (Pokud vás daná databáze zklame, nechte znovu proběhnout vyhledávání v předchozích databázích výběrem tlačítka „database".) Úkol 3: Chcete rychle získat všeobecné informace o dobře definovaném tématu Řešení: Použijte podkategorie a/nebo volbu „limit set". Tohle je jeden z nejběžnějších důvodů, proč v reálném životě přistupujeme k Medline. Nemáme na mysli určitou publikaci ani velmi specifickou otázku a ani se nesnažíme o vyčerpávající přehled literatury. Chceme jen vědět, řekněme, jaká jsou nejnovější doporučení expertů ohledně far-makoterapie astmatu, nebo zdali bylo napsáno něco nového o vakcínach proti malárii. Jednou metodou, jak toho dosáhnout, je hledat s použitím MeSH termínů a potom, pokud objevíme velký počet článků, ale jen za této situace, použijte podkategorie (angl. subheadings) rejstříku. Podkategorie představují jakési jemné ladění indexovacího systému Medline a třídí články podle určitých MeSH subjektů na etiologii, prevenci, terapii a tak dále. Seznam těch nejužitečnějších je v tabulce 2.2 (nemusíte se je učit zpaměti, jelikož mapovací proces OVIDu vám podkategorie automaticky nabídne k zatržení, ale můžete zkrátit proces mapování a ušetřit čas, pokud náhodou potřebnou podkategorii znáte). Všimněte si, že podkategorie /th v tabulce 2.2 se týká nefarmakologické terapie nemoci, zatímco /dt se používá pro farmakoterapii. Podkategorie /tu se používá výhradně pro léky a znamená „terapeutické použití něčeho". Podkategorie /px se používá u nepsychiatrických nemocí jako v tomto příkladě - diabetes/px = psychologie diabetů. Ne všechny podkategorie v indexovacím systému se používají pro každý subjekt. K nalezení podkategorií MeSH termínu jako je asthma napište: 1 sh asthma Tento příkaz vám řekne, které podkategorie se používají v indexovacím systému pro tento MeSH termín. Nabídne vám množství položek k volbě včetně diagnózy, ekonomiky, etnológie a tak dále. Měli byste vybrat /dt (farmakoterapie). Mohli jste napsat jednořádkový příkaz: 697 2 *asthma/dt kde * znamená hlavní předmět článku, / znamená MeSH termín a dt znamená farmakoterapii. Toto vám nabídne okolo 2000 článků, abyste si z nich vybrali. Nyní potřebujete omezit sadu (angl. limit set) článků, a tak začněte s často užívanými volbami k jejímu omezení, jejichž seznam je v podobě zatrhávacích rámečků pod tabulkou na vaší obrazovce („human", „reviews" a tak dále). Pokud si skutečně chcete zkopírovat celý článek ještě dnes, vyberte „local holdings" (vlastnictví dokumentů). To omezí vaši sadu časopisů na ty, jež jsou majetkem určité knihovny, jejímž prostřednictvím máte přístup k Medline. Pokud se připojujete k Medline v knihovně BMA pomocí počítačového modemu, „local holdings" znamená časopisy v majetku knihovny BMA, nikoli knihovny, z níž se připojujete! Povšimněte si, že volby jako „local holdings" sníží počet vašich článků nesystematicky; pravděpodobně je mnoho vynikajících a důležitých článků uveřejněných v časopisech, které vaše místní knihovna neodebírá. Pokud máte po výběru vhodných možností z často užívaných rámečků „limit set" stále příliš mnoho článků, vyberte nyní tlačítko „limit set" nahoře na obrazovce. Nyní si musíte vybrat dodatečné volby ke zmenšení sady článků na množství, které můžete pohodlně prolistovat. Skutečně netrvá dlouho prolistovat na obrazovce kolem 50 článků. Je lepší to udělat, než se spoléhat na program, že vám z celého balíku vydá to nejlepší. Jinými slovy neužívejte nadměrně příkazy „limit set", které najdete v přehledu 2.3. Pokud jste si jisti, že chcete přehledný článek, vyberte tuto možnost. Můžete získat nejnovější přehled publikovaného výběrem nejprve „review articles" a potom „latest update". Avšak to úplně nejnovější nemusí být tím nejlepším přehledem napsaným v posledním roce, tak může být lepší vybrat „publication year" jako běžný rok a probrat se jím. Pamatujte si, že bude zahrnut pouze systematický přehled, bude obsahovat podrobnosti hledaného a bude výsledkem důkladného prohledávání odpovídající literatury . Volba „AIM journals" představuje všechny časopisy v seznamu Abridged Index Me die us, tj. v „hlavním proudu" lékařských časopisů. Nebo pokud chcete články týkající se spíše ošetřovatelské než lékařské péče, můžete omezit sadu na „Nursing journals". To je často lepší způsob omezení širokého nastavení, než požadovat jen to, co je ve vlastnictví místní knihovny. Pokud vás nezajímá nic, co není v angličtině (i když abstrakt v angličtině může být), vyberte tuto možnost a opět mějte na mysli, že je to nesystematický (skutečně zavádějící) způsob, jak vyloučit články z vaší sady. Všimněte si, že místo použití funkční klávesy „limit set" můžete využít přímý jednořádkový příkaz jako: 3 limit 2 to local holdings 4 limit 3 to human Cvičení 3 Pokuste se najít jednotlivou publikaci (prolistováním větší sady článků), která by vám dala odpověď na následující otázky: 1. Je někdy vůbec indikována hormonální substituční terapie u žen, které měly v minulosti karcinom prsu? 2. Severoamerická literatura často zmiňuje „health maintenance organisations". Co to je? 3. Představte si, že jste novinářem v oblasti medicíny, který byl požádán, aby napsal článek o sereeningu karcinomu prostaty. Chcete jako svůj zdroj dva docela krátké přehledné články z lékařské literatury patřící k hlavnímu proudu. 4. Vede sledování násilí v televizi k násilnému chování u adolescentů? Úkol 4: Výsledkem Vašeho vyhledávání bylo mnoho bezvýznamných článků Řešení: Jak při vašem vyhledávání postupujete dále, dolaďujte je ve světle výsledků, které prozatím máte. Často vyhledávání objeví tucty článků, které jsou vzhledem k vaší otázce nepodstatné. Zde může pomoci booleovský operátor „not". Bylo provedeno vyhledávání, pro identifikaci článků o náhradních cílových ukazatelích v klinickém farmakologickém výzkumu. Bylo hledánov Medline pomocí MeSH termínů, ale též podle slov v textu, aby byly zachyceny články, které unikly indexovacímu systému MeSH . Bohužel toto vyhledávání objevilo stovky článků, nesouvisejících s tématem, všechny o náhradním mateřství. Syntaxe k vyloučení nežádoucích článků je následující: 1 (surrogate not mother$).tw Rozhodnutí použít operátor „not" je dobrým příkladem toho, jak můžete (a měli byste) postupně zdokonalovat a zjemňovat vaše vyhledávání, což je mnohem plynulejší než ihned připravit formálně perfektní vyhledávání. Jiným způsobem, jak se zbavit nepodstatných článků, je zúžit vaše vyhledávání podle slova v textu na sousední slova (angl. adjacent words). Například termín „home help" obsahuje velice běžná slova spojená ve specifickém kontextu. Propojte je následovně: 2 home adj help.tw kde adj znamená „adjacent" (sousední). Podobně „community adj care", „Macmillan adj nurse". Můžete dokonce specifikovat počet slov tvořících mezeru mezi dvěma propojenými slovy jako v tomto příkladě: 3 community adj2 care.tw což by vyhledalo „community mental health care" a rovněž „community child care" a „community care". Cvičení 4 Najděte články o profesionálním astmatu (angl. occupational asthma) způsobeném cukrem. Lék Chlorochin se velmi běžně užívá k léčbě malárie (falciparum malaria). Zjistěte, jaká jsou jeho další použití. (Tip: použijte podkategorii /tu znamenající „terapeutické použití něčeho" a pamatujte, že odkazy na malárii jsou často pod jejím latinským názvem Plasmodium falciparum. Měli byste ovšem omezit široké vyhledávání na přehledné články, pokud čtete spíše kvůli rychle získaným informacím než z důvodu sekundárního výzkumu). Úkol 5: Vaše vyhledávání vám nedává vůbec žádné články nebo ne tolik, kolik jste očekávali Řešení: Za prvé, neužívejte nadměrně podkategorie nebo možnosti „limit set". Za druhé, hledejte jak pod slovy v textu, tak pod MeSH termíny. Za třetí, obeznamte se s příkazem „explode" a rutinně jej používejte. Pokud vámi pečlivě sestavené vyhledávání nese málo nebo žádné ovoce, je možné, že v databázi nejsou žádné články k vašemu tématu. Pravděpodobnější ale je, že vám unikly. Mnoho důležitých článků se propásne ne proto, že jsme sestrojili děravou vyhledávací strategii, ale proto, že jsme se příliš spoléhali na děravý indexovací systém. Také MeSH termíny mohou být chybně označeny nebo nemusí být označeny vůbec. Proto byste měli hledat jak pod slovy v textu, tak podle MeSH. Ostatně je obtížné napsat článek o psychologii diabetů, aniž byste zmínili slova „diabetes", „diabetic", „psychology" nebo „psychological", a tak zkrá- 698 cene slovní kmeny diabet$.tw a psychol$.tw doplní vyhledávání pod MeSH termínem „diabetes mellitus" a podkate-gorií /p x (psychologie). Smažte předchozí z obrazovky a potom uvažujte o tomto příkladu. Pokud byste chtěli zodpovědět otázku: jaká je úloha aspirinu v prevenci a léčbě infarktu myokardu?, mohli byste napsat jednořádkový příkaz: 1 (myocardial infarction/pc or myocardial infarction/ dt) and aspirin/tu což vám poskytne všechny články ze seznamu této části databáze Medline, která zahrnuje terapeutické použití aspirinu a prevenci nebo léčbu infarktu myokardu - asi tak 190 článků, ale žádnou okamžitou odpověď na vaši otázku. Mohli byste lépe upustit od podkategorií a omezit sadu článků následovně: 1 myocardial infarction/ and aspirin/ 2 limit 1 to AIM journals 3 limit 2 to review articles což je strategie, jež vám nabídne okolo 25 přehledných článků včetně minimálně jednoho velice užitečného, který byl vaším prvním vyhledáváním vynechán. Nyní k této strategii přidejme jeden řetězec navíc. Vymažte dosavadní zadání a postupujte následovně: 1 (myocardial infarction and aspirin) .mp 2 limit 1 to AIM journals 3 limit 2 to review articles Přípona .mp (viz oddíl 2.4) vám automaticky nabídne vyhledávání podle slova v textu názvu nebo abstraktu a měla by vám poskytnout přes 50 článků, z nichž většina vypadá, že se vaší otázky určitě týkají, a některé z nich byly vynechány, když jste hledali pouze MeSH termíny. Abyste předešli neúplnému vyhledávání, je jinou důležitou strategií využití silného příkazu „explode". Tuto funkci byste měli rutinně používat, pokud nemáte dobrý důvod k opaku. Zkuste následující vyhledávání jako příklad. Pokoušíme se dostat dobrý přehledný článek o gonokokové artritíde (vzácném typu akutní artritídy způsobeném gonokokem). Vymažte předchozí z obrazovky a napište MeSH termín: 1 *arthritis/ Dostanete kolem 1300 článků, kde artritída je jejich hlavním předmětem. Nyní pátrejte po článcích o artritíde, ve kterých je slovo „gonococcal" zmíněno v názvu nebo abstraktu. Napište: 2 gonococcal.tw 31 and 2 Toto významně zúží vaše vyhledávání na jeden nebo dva články, z nichž ani jeden nenabízí vyčerpávající přehled daného tématu. A kolik jste jich nenašli? Odpověď je několik, protože MeSH termín „arthritis" se dělí na několik větví včetně „arthritis, infectious". Zkuste vše znovu (bez vymazání prvního vyhledávání), ale tentokrát zvolte rozvinutí termínu „arthritis" (angl. explode) předtím, než začnete, a potom omezte vaši sadu (angl. limit set) na přehledné články: 4 exp arthritis/ 5 2 and 4 6 limit 5 to review articles Nyní máte asi pět článků včetně vynikajícího přehledu, který byl předtím při vyhledávání bez rozvinutí termínu vynechán. Můžete to předvést napsáním: 7 6 not 3 což vám ukáže, o co více se toho našlo při vyhledávání termínu s jeho rozvinutím (funkce „explode") oproti vyhledávání bez jeho rozvinutí. Pokud byste náhodou také uvažovali o vyhledávání pod slovem v textu, syntaxe pro identifikaci článků o problémech u mužů by byla (male not female).tw a (men not women).tw, jelikož ženské termíny v sobě formálně obsahují ty mužské! Úkol 6: Nevíte, kde začít hledat Řešení: Použijte volbu „permuted index". Vezměme si pojem „stress". Hodně se vyskytuje, ale vyhledávání konkrétních typů stresu by bylo pracné a vyhledávání pojmu „stress" jako slova v textu by bylo příliš necílené. Potřebujeme vědět, kde v MeSH indexu různé typy stresu leží, a když to zjistíme, můžeme si vybrat ten druh stresu, na který se chceme podívat. K tomu použijeme příkaz ptx („permuted index", což znamená „permutovaný rejstřík"). Napište: 1 ptx stress Obrazovka ukáže mnoho možností včetně posttrauma-tických stresových poruch, stresových fraktur, oxidativního stresu, stresové inkontinence a tak dále. ptx je užitečný příkaz, když se termín, který zkoumáte, může nacházet v několika tematických oblastech. Pokud váš pojem je jednotlivým MeSH termínem, užijte příkazu tree (strom). Například: 2 tree epilepsy vám ukáže, kde v rejstříku MeSH je umístěna epilepsie (jako větev stromu „brain diseases"), jež se sama větví na generalizovanou epilepsii, parciální epilepsii, posttraumatic -kou epilepsii a tak dále. Cvičení 5 1. Najděte, kde se může slovo „nursing" objevit jako součást MeSH termínu. 2. Použijte příkaz tree k rozvinutí stromové struktury MeSH termínu „diabetes mellitus". Úkol 7: Váš pokus omezit sadu vede ke ztrátě důležitých článků, ale nevyloučí ty o nízké metodologické kvalitě Řešení: Aplikujte nějaký filtr kvality založený na důkazech. Co uděláte, když vám vaše úzce cílené vyhledávání stále poskytuje několik set článků, z nichž si máte vybrat, a jestliže se zdá, že použití podkategorií nebo funkcí omezení sady ztrácí hodnotné (a důležité) publikace? Nejprve byste měli uvážit možnost, že vaše vyhledávání nebylo zase tak cílené, jak jste si mysleli. Ale pokud je nemůžete už dále vylepšit, měli byste zkusit vložit řetězec pro kvalitativní třídění určený k omezení vaší sady článků na terapeutické intervence, etiologii, diagnostické procedury nebo epidemiologii. Nebo můžete použít vyhledávací řetězce k identifikaci typu publikace, jako je randomizovaná kontrolovaná studie, systematický přehled nebo meta-analýza. Tyto filtry kvality založené na důkazech jsou velmi složité vyhledávací strategie vyvinuté a tříbené některými z nejzkušenějších expertů na lékařskou informatiku. Jsou vyvíjeny další maximálně senzitivní vyhledávací strategie, které identifikují kohortové studie, studie případů a kontrol a tak dále a brzy budou k dispozici od UK Cochrane Centre, Summertown Pavilion, Middle Way, Oxford 0X2 7LG, email general@cochrane.co.uk. 40.3 ZHODNOCENÍ METODOLOGICKÉ KVALITY PUBLIKACE Při posuzování zda nalezená publikace je kvalitní, je třeba zvažovat pět otázek, které by měly tvořit základ pro rozhodnutí, zda publikaci „hodit do koše", odložit její posouzení nebo ji použít k ovlivnění praxe: 699 • Byla studie původní? • Koho se studie týkala? • Byl použit správný design ? • Zabránilo se systematické chybě (tj. byla studie dostatečně „kontrolovaná")? • Byla dost velká a trvala dost dlouho na to, aby přinesla věrohodné výsledky? Byla studie původní? Teoreticky nemá smysl testovat vědeckou otázku, která již byla nějakým způsobem ověřena někým jiným. Ale ve skutečnosti pouze nepatrná část lékařského výzkumu přijde s něčím zcela novým a stejně nepatrná část opakuje přesně kroky předchozích badatelů. Velká většina výzkumných studií nám řekne (pokud jsou metodologicky v pořádku), že určitá hypotéza je pravděpodobně o trošku správnější nebo naopak méně správná, než byla před naším zapojením do výzkumu daného problému. Proto může být dokonale platné provést studii, která je na první pohled „nepůvodní". Vlastně celá věda meta-analýzy závisí na existenci několika studií v literatuře, které se zabývaly stejnou otázkou a přistupovaly k ní stejným způsobem. Praktická otázka ohledně nové výzkumné práce není „Udělal již někdo předtím podobnou studii?", ale „Je tento nový výzkum v nějakém ohledu přínosem pro literaturu?" Především z následujících hledisek: • je tato studie větší, trvala déle nebo je jinak důkladnější než ta nebo ty předchozí? • jsou metody této studie v něčem přesnější (zvláště, zabý-vají-li se nějakým kritizovaným metodologickým problémem dřívějších studií)? • přispějí číselné výsledky této studie významně k meta--analýzám předchozích studií? • liší se nějak studovaná populace (například brala studie, oproti těm předchozím, v úvahu různé etnické skupiny, věk nebo pohlaví)? • má studovaná klinická otázka potřebnou důležitost a je v myslích veřejnosti nebo lidí s klíčovou rozhodovací pravomocí dostatečná nejistota, aby nové důkazy plynoucí ze studie byly „politicky" žádoucími, i když to není z vědeckého hlediska nezbytné? Koho se studie týkala? Výzkum, týkající se pacientů někoho jiného ještě nemusí být směrodatným pro praxi jiného lékaře. V takovém případě nejde o pouhou xenofóbii ale hlavní důvody, proč se účastníci nějaké klinické studie mohli lišit od pacientů žijících v „reálných podmínkách", jsou následující: • byli buď více nebo méně nemocní, než jiní pacienti • byli z jiných etnických skupin nebo měli jiný životní styl • bylo jim věnováno během studie více (nebo jiné) pozornosti, než by mohlo být v běžné klinické praxi • oproti pacientům z reálného života neměli žádnou jinou poruchu kromě studovaného problému • nikdo z nich nekouřil, nepil alkohol a neužíval orální antikoncepci Proto je nezbytné položit si před úplným převzetím výsledků jakékoli studie následující otázky: • Jak byly osoby získávány do studie? Kdybyste chtěli provést dotazníkovou studii o názorech pacientů na pohotovostní službu, mohli byste se dotazovat tak, že byste do místních novin dali inzerát. Avšak tato metoda by byla dobrým příkladem systematické chyby náboru , jelikož výběr, který byste získali, by byl pozměněn ve prospěch osob, které byly vysoce motivovány a rády četly noviny. Správně byste měli dát dotazník každému uživateli (nebo jednomu z 10 uživatelů), který přišel určitého dne na pohotovostní službu. • Kdo byl do studie zahrnut? Mnohé studie ve Spojeném království rutinně vylučují pacienty s dalším onemocněním, ty, kteří nemluví anglicky, užívají nějakou jinou medikaci a negramotné. Tento přístup může být vědecky „čistý", ale jelikož se výsledky klinických studií budou používat k řízení praxe u širších skupin pacientů, není to vše nutně logické. Výsledky farmakokinetických studií s novými léky na 231etých zdravých mužských dobrovolnících zjevně nebudou použitelné u průměrné starší ženy! Tuto otázku nedávno zdůraznili i sami pacienti, formou požadavků o rozšíření kritérií pro zahrnutí do studií o lécích na AIDS. • Kdo byl ze studie vyloučen? Například randomizovaná klinická studie může být omezena na pacienty se střední nebo těžkou formou nemoci jako je srdeční selhání, což je přístup, který může vést k falešným závěrům ohledně léčby lehkého srdečního selhání. To má důležité praktické důsledky, když se výsledky klinické studie provedené na nemocničních pacientech používají v primární péči, kde je spektrum nemocí obecně méně závažné. • Byly osoby studovány v „přirozených" životních podmínkách? Například byly přijaty do nemocnice čistě na pozorování? Obdržely zdlouhavá a podrobná vysvětlení stran možného prospěchu z intervence? Dostaly telefonní číslo na klíčového výzkumného pracovníka? Poskytla společnost sponzorující výzkum nové vybavení, které normálnímu klinikovi nebude dostupné? Tyto skutečnosti by ovšem samy o sobě nezrušily platnost studie, ale mohly by vrhnout stín pochybností na použitelnost jejích výsledků v běžné klinické praxi. Bylo uspořádání studie rozumné? Ačkoli design výzkumné studie je obvykle komplikovaný, pro „kritické posuzování", základního uspořádání klinické studie je možno použít především dvou otázek: O jaké specifické intervenci se uvažovalo a s čím byla porovnávána? Toto je jedna z nejzákladnějších otázek při posuzování jakékoli publikace. Je lákavé přijmout publikovaná tvrzení i s jejich uvedenou hodnotou, ale autoři často nesprávně popisují (obvykle spíše podvědomě než záměrně) to, co skutečně dělali, a nadhodnocují originalitu své práce a její možnou důležitost. Jaký následek byl měřen a jak? Když má někdo nevyléčitelné onemocnění, o němž farmaceutická společnost prohlašuje, že proti němu vyrobila nový účinný lék, pacient se obvzkle zajímá zda mu takový lék prodlouží život (a možná také, zdali by ten život stál za to za jeho konkrétních podmínek a pří vedlejších účincích me-dikace). Příliš ho nezajímá hladina nějakého neviditelného enzymu v krvi, o němž výrobce ujišťuje, že je to spolehlivý ukazatel šance na přežití. Měření symptomatických (například bolest), funkčních (například pohyblivost), psychologických (například úzkost) nebo sociálních (například nepohodlí) účinků intervence je spojeno ještě s větším množstvím problémů. Metodologie, uplatnění a vyhodnocení takových „měkkých" parametrů následků je velmi komplikované. Obecně by se ale měly vždy v publikaci hledat důkazy, že měřený následek byl objektivně prokázán , že někdo již předtím prověřil, že stupnice 700 úzkosti, bolesti atd. , použitá ve studii měří to co prohlašuje že měří, a že změny v tomto parametru následku dostatečně odrážejí změny ve stavu pacienta. Protože to, co je důležité v očích lékaře, nemusí být tak vysoce ceněno pacientem a naopak. Zabránilo se systematické chybě nebo byla snížena na nejmenší míru? Systematická chyba je definována jako cokoli, co chybně ovlivňuje závěry a zkresluje porovnání skupin. Ať již je design randomizovaná kontrolovaná studie, nerandomizovaná srovnávací studie , kohortová studie nebo studie případů a kontrol, cílem by mělo být vytvořit srovnávané skupiny tak, že jsou si navzájem co nejpodobnější kromě zkoumaného konkrétního faktoru . Pokud je to možné, měly by být stejným způsobem vybírány, mít stejné kontakty na řešitele a být stejně často vyhodnocovány za použití stejných parametrů výsledků. Různé designy studie si žádají různé kroky k omezení systematické chyby. Randomizované kontrolované studie (RCT) V RCT se (teoreticky) vyhneme systematické chybě výběrem účastníků z určité populace a jejich náhodným přidělením do různých skupin. Nerandomizované kontrolované klinické studie Příklad takové studie můře být když jedna skupina pacientů ( nemocniční ambulantní pacienti s astmatem) byla intervenována na příklad edukačním letákem, zatímco jiná skupina (třeba pacienti s astmatem navštěvující ordinace praktických lékařů) byla vystavena jiné intervenci (skupinové edukační schůzce). Takový postup vykazuje nejvíce zřejmou systematickou chybu, tj. porovnávání dvou skupin, které vykazují podstatné rozdíly dokonce ještě před zahájením intervence. Obecné pravidlo je, že pokud publikace je nerandomizo-vanou kontrolovanou klinickou studií, je třeba určit, zdali základní rozdíly mezi intervenovanou a kontrolní skupinou jsou tak velké, že by zrušily platnost jakýchkoli rozdílů přisuzovaných účinku intervence. A tak to téměř vždy je . Autoři takového článku někdy sami uvedou důležité vlastnosti každé skupiny (jako průměrný věk, poměr zastoupení pohlaví, ukazatele tíže onemocnění a tak dále) do tabulky, aby bylo možno tyto rozdíly porovnat. Kohortové studie Výběr srovnatelné kontrolní skupiny je jednou z nejobtížnějších částí designu observační studie (kohortové studie nebo studie případů a kontrol). Malému počtu kohortových studií, pokud vůbec nějakým, se například podaří vybrat dvě skupiny osob shodného věku, pohlaví, socioekonomického postavení, provázejícího onemocnění atd. jen s jediným rozdílem v expozici studovanému faktoru . V praxi se většina „kontrolování" v kohortových studiích děje až ve fázi analýzy, kdy se provádějí složité statistické úpravy pro základní rozdíly v klíčových proměnných. Pokud se to neudělá dostatečně, budou statistické testy pravděpodobnosti a intervaly spolehlivosti nebezpečně zavádějící. Tento problém názorně ukazují různé kohortové studie týkající se rizika a přínosu alkoholu, které shodně předvádějí křivku „tvaru J" ve vztahu mezi příjmem alkoholu a úmrtností. Nejlepší výsledek (ve smyslu předčasného úmrtí) je v kohortě tvořené mírnými konzumenty. Zdá se, že u těch, kdo se sami přiznali k abstinenci, je významně pravděpodobnější, že zemřou mladší, než u průměrné osoby, která pije tři až čtyři dávky alkoholického nápoje denně. Ale může se předpokládat, že abstinenti jsou v průměru totožní s mírnými konzumenty vyjma množství alkoholu, které vypijí? Jistě, že ne! Je známo, že populace abstinentů zahrnuje osoby, kterým bylo nařízeno přestat s alkoholem ze zdravotních důvodů (angl. „sick quitters"), osoby, které se ze zdravotních či jiných důvodů zbavily nežádoucích položek ve výživě a ve způsobu života, osoby z určitých náboženských a etnických skupin, které by byly v jiných kohortách nedostatečně zastoupeni (hlavně muslimové a adventisté sedmého dne) a osoby, které „pijí jako duha", ale zapírají to. Přesto závěr, i když se při analýze bere patřičný ohled na možné zavádějící faktory u osob, které se prohlašují za abstinenty, zůstává, že zvýšené riziko předčasné smrti u těchto osob je platné. Studie případů a kontrol Ve studiích případů a kontrol v nichž se retrospektivně analyzují jednotlivci s určitou nemocí a bez ní, aby byly určeny hypoteticképříčiny, proces, který je nejnáchylnější k systematické chybě, není vyhodnocení následků, ale určení „případů" a kdy se jedinec stává případem. Dobrým příkladem řečeného je to, co nastalo před několika lety, kdy byly podávány žaloby na výrobce očkovací látky proti dávivému kašli, která údajně způsobila neurologické postižení u řady dětí. Aby byla zodpovězena otázka, Způsobilo očkování poškození mozku?", byla provedena studie případů a kontrol, ve které byl „případ" definován jako do té doby zdravé dítě, u kterého se projevily záchvaty nebo jiné známky podezřelé z poškození mozku během týdne po očkování. Kontrolou bylo dítě stejného věku a pohlaví ze stejného imunizačního registru, které bylo také očkováno a u kterého se v některé fázi mohly nebo nemusely rozvinout obdobné příznaky. Nový výskyt známek poškození mozku u zjevně normálních dětí je extrémně vzácný, ale dochází k němu a je možné , že souvislost s nedávnou imunizací mohla být náhodná. Dále, zvýšená úzkost veřejnosti v souvislosti s onou záležitostí mohla ovlivnit vzpomínky rodičů a zdravotníků, takže děti, které měly neurologické příznaky již předtím nebo se vyskytly za nějakou dobu po podání tohoto očkování, mohly být chybně klasifikovány jako případy. Soudce v tomto soudním případu rozhodl, že špatná klasifikace tří takových dětí jako „případy" místo kontroly vedla k trojnásobnému nadhodnocení škody, kterou lze připsat očkování proti dávivému kašli. Ačkoli bylo toto rozhodnutí následně napadeno, princip zůstává - že označení za „případ" ve studii případů a kontrol musí být učiněno přesně a objektivně, máme-li se vyhnout systematické chybě. Bylo vyhodnocení „slepé"? I největší snaha dosáhnout vytvoření srovnatelné kontrolní skupiny bude zmařena, pokud lidé vyhodnocující následek (například ti, kdo posuzují, zdali někdo má stále klinicky srdeční selhání, nebo hodnotí, jestli je rtg nález od minulého vyšetření „lepší") vědí, do které skupiny byl posuzovaný pacient přidělen. Kapitola „The clinical examination" v knize Sacketta a kolegů Clinical epidemiology - a basic science for clinical medicine nabízí přesvědčivé důkazy, že při vyšetřování pacientů lékaři zjišťují to, co očekávají a v co doufají, že zjistí. Je vskutku vzácné, aby dva schopní klinikové dosáhli shody v míře větší, než by byla očekávána jako náhodná, u více než dvou případů ze tří pro jakékoli dané hledisko fyzikálního vyšetření nebo interpretaci kteréhokoli diagnostického testu. Úroveň shody mezi dvěma pozorovateli větší než náhodnou lze vyjádřit matematicky jako k (kappa) skóre, kde skóre 1.0 značí dokonalou shodu. 701 Ti, kdo hodnotí výsledky, by měli být „zaslepení" vůči přidělení pacientů do skupin. Pokud by lékař například věděl, že pacient byl randomizován do skupiny s lékem na snížení krevního tlaku a ne do skupiny placeba, bylo by pravděpodobné, že by mohl překontrolovat odečet tlaku, který by byl překvapivě vysoký. Toto je příklad systematické chyby provedení (performance bias). Vynikající příklad kontroly systematické chyby dostatečným „zaslepením" byl uveřejněn v časopisu Lancet před několika lety. Majeed a kolegové provedli RCT, jež ukázala v rozporu se zjištěními několika předchozích studií, že doba potřebná na uzdravení (dny v nemocnici, dny pracovní neschopnosti a čas do znovunabytí plné aktivity) po laparoskopickém odstranění žlučníku (přístupem „chirurgie klíčové dírky") nebyla kratší než u tradiční operace na otevřeném břiše. Nesoulad mezi touto studií a předchozími studiemi mohl být dán puntičkárskou snahou Majeeda a kolegů o snížení systematické chyby. Pacienti byli randomizováni až teprve po úvodu do celkové anestezie. Ani pacienti ani ošetřující personál nevěděli, která operace byla provedena, jelikož všichni pacienti opouštěli operační sál stejně obvázáni (včetně krevních skvrn!). Tyto nálezy vyzývají autory předchozích studií, aby se sami sebe zeptali, zdali šlo spíše o systematickou chybu očekávání než o rychlejší úzdravu, což pobídlo lékaře k časnějšímu propuštění pacientů ze skupiny operovaných laparoskopicky. Byla věnována pozornost předběžným statistickým otázkám? Většina nestatistiků má sklon v článcích v části metody vyhlížet jen tří čísla: • velikost vzorku • délku období sledování • úplnost období sledování. Velikost vzorku Před zahájením klinické studie je třeba stanovit výpočet velikosti vzorku („síly" testu, tedy schopnosti vyvrátit nulovou hypotézu). Vzorek by měl být dost velký, aby měl vysokou pravděpodobnost prokázat žádoucí účinek, pokud existuje, jako statisticky významný, a naopak získat dostatečnou jistotu, že neexistuje žádný prospěch, pokud jej studie nezjistila. K výpočtu velikosti vzorku si musí klinik určit dvě otázky: • jaká míra rozdílu mezi dvěma skupinami bude považována za klinicky významný účinek. To nemusí být to samé jako statisticky významný účinek. Mohli byste podávat nový lék snižující krevní tlak o přibližně 10 mmHg a účinkem by byl statisticky významný pokles vzniku iktu (statisticky významný znamená, že pravděpodobnost náhodného poklesu incidence je menší než 1 z 20). Pokud by však lidé, kteří by měli tento lék užívat, měli jen mírně zvýšený krevní tlak a neměli žádný větší rizikový faktor pro iktus (tj. byli relativně mladí, nebyli diabetici, měli normální hladinu cholesterolu a tak dále), příslušnou úrovní rozdílu by bylo pouze předejití přibližně jednomu iktu z 850 léčených pacientů - tedy klinický rozdíl v riziku, který by mnohým pacientům nestál za užívání léku. • jaká je střední hodnota a směrodatná odchylka (v angl. literatuře zkratka SD, v české literatuře s;) proměnné představující hlavní následek. • Pokud je následkem spíše nějaká událost (jako hysterekto-mie) než veličina (jako krevní tlak), je požadovaným údajem podíl lidí s touto událostí v populaci, a odhad toho, co by mohlo v tomto podílu tvořit klinicky významnou změnu. Jakmile jsou již tato data určena, lze snadno spočítat minimální velikost vzorku použitím standardního vzorce, nomo-gramů nebo tabulek, které je možno získat z publikovaných prací, učebnic, nebo nejčastěji z komerčních statistických softwarů. Takto je možno ještě před zahájením studie vypočítat, jak veliký vzorek bude potřeba, aby byla zajištěna střední, vysoká nebo velmi vysoká pravděpodobnost zjištění skutečného rozdílu mezi skupinami. Pravděpodobnost odhalení skutečného rozdílu je známa jako síla studie a je obvykle stanovena mezi 80 % a 90 %. Proto když čtete práci popisující RCT, měli byste hledat větu, která zní nějak takto (je převzata z práce Majeeda a kolegů o cholecystektomii): „Pro 90% pravděpodobnost zjištění rozdílu u hospitalizace na jednu noc za použití Mannova-Whitneyho U-testu bylo třeba 100 pacientů v každé skupině (za předpokladu S D 0 hodnotě 2 nocí). Z toho plyne síla studie větší než 90 % pro detekci rozdílu 15 minut v délkách operace za předpokladu SD o hodnotě 20 minut." Pokud publikace, kterou čtete, neuvádí výpočet velikosti vzorku a zdá se na jejím základě, že mezi intervenční a kontrolní skupinou není rozdíl, měli byste zjistit (nebo získat přímo od autorů) informace podle výše uvedených dvou odstavců a provést výpočet sami. Studie s příliš nízkou hodnotou síly studie jsou v lékařské literatuře všudypřítomné, obvykle proto, že se autorům nepodařilo získat pro studii tolik subjektů, kolik si představovali. Takové studie typicky vedou k chybě 2. typu beta, což je chybný závěr, že intervence je neúčinná. Naopak vzácnější chyba 1. typu (alfa) je závěr, že rozdíl je významný, když ve skutečnosti je dán chybou výběru. Délka období sledování 1 když je velikost vzorku dostatečná, studie musí pokračovat dostatečně dlouhou dobu, aby se vliv intervence odrazil v proměnné představující následek. Pokud by se autoři zaměřili na vliv nového analgetika na stupeň pooperační bolesti, jejich studii by stačilo 48hodinové období sledování. Na druhé straně, pokud by jim šlo o vliv nutričního doplňku podávaného v předškolním věku na výslednou tělesnou výšku v dospělosti, období sledování by se počítalo na desetiletí. I když intervence ukáže významný rozdíl mezi skupinami po, řekněme, šesti měsících, tento rozdíl nemusí být trvalý . Jak je známo na příklad ze snah o redukci obezity, dramatické výsledky se mohou objevit po dvou či třech týdnech, ale pokud se období sledování prodlouží na rok nebo déle, řada osob nabere většinu své váhy zpět. Úplnost období sledování Bylo opakovaně ukázáno, že u osob, které odstoupily („odpadly") ze studie, je méně pravděpodobné, že užívaly lék tak, jak měly nařízeno, je pravděpodobnější, že nedocházely na průběžné kontroly a je více pravděpodobné, že se u nich projevily vedlejší účinky medikace, než u těch, které neodstoupily. Lidé, kteří nevyplní dotazník, mohou daný problém vnímat jinak (a pravděpodobně slaběji) než ti, kteří jej obratem zašlou zpět. U lidí v programu redukce váhy je pravděpodobnější, že se budou nadále vracet, pokud skutečně hmotnost ztrácejí. Důvody, proč pacienti odstoupí z klinické studie, mohou být následující: • nesprávné zařazení pacienta do studie (tj. během studie se zjistí, že pacient v první řadě neměl být randomizován, protože nesplňoval kritéria pro zařazení do studie). • podezření na nežádoucí reakce na testovaný lék. Nikdy by se neměla brát v úvahu četnost „nežádoucích reakcí" v in- 702 tervenční skupině bez jejího srovnání s četností v placebo skupině. Inertní tabletky jsou často důvodem, že lidé ze studie odstoupí. • ztráta motivace pacienta („Už ty tablety nechci brát"). • vyřazení klinikem z klinických důvodů (například souběžné onemocnění, těhotenství). • ukončení období sledování (například pacient se odstěhu-je). • úmrtí. Samozřejmě, že pacienti, kteří zemřou, nedocházejí dále na ambulantní návštěvy. Takže pokud se s tím nepočítá, mohou být chybně klasifikováni jako ti, kteří „odpadli". To je jeden z důvodů, proč studie s nízkým podílem těch, kteří dokončí období sledování (řekněme menším než 70 %), se obecně považují za neplatné. Pokud se neberou v úvahu osoby které odstoupily z klinické studie, výsledky jsou obvykle vychýleny ve prospěch intervence. Je proto standardní praxí analyzovat výsledky srovnávacích studií na základě záměru léčit (intention to treat). To znamená, že všechny údaje o pacientech původně přidělených do intervenované části studie včetně těch, kteří odstoupili před dokončením studie, těch, kdo neužívali tablety, a dokonce těch, kteří se následně z jakéhokoli důvodu dostali do kontrolní skupiny, by měly být analyzovány spolu s údaji o pacientech, kteří dodrželi celý protokol. Stejně tak ti, kteří odstoupili z placebové části studie, by měli být analyzováni spolu s těmi, kteří poctivě užívali placebo. Naopak analýza účinnosti má vysvětlit účinky intervence samotné, a je proto zaměřena na léčbu, kterou pacient skutečně dostal. Ale i když jsou osoby, na nichž se analýza účinnosti provádí součástí RCT, pro účely této analýzy ve skutečnosti vytvářejí kohortovou studii. Shrnutí Po kritickém posouzení metodologické kvality publikace, by každý měl být schopen říci několika větami, jaký druh studie byl proveden, u kolika osob, odkud osoby pocházely, jaká léčba či jiná intervence jim byla nabídnuta, jak dlouhé bylo období sledování (nebo, pokud šlo o přehledovou studii, jaká byla četnost odpovědí) a co bylo použito jako měřítko následku. V této fázi by se také mělo určit, jaké statistické testy, pokud vůbec nějaké, byly použity k analýze výsledků. Pokud jsou tyto věci jasné, je snadnější porozumět výsledkům studie, hodnotit jejich význam a, je-li to na místě, i je případně odmítnout. Příkladem takového sumarizačního popisu studie je na příklad: • práce popisuje nezaslepený randomizovaný pokus, který se zaměřil na terapii, u 267 ambulantních pacientů ve věku mezi 58 a 93 roky, u nichž byl porovnáván čtyřvrs-tvý kompresívní obvaz se standardními jednovrstvými obvazy v léčbě nekomplikovaných vředů při chronické žilní nedostatečnosti dolních končetin. Období sledování bylo šest měsíců. Procento zhojení vředu bylo měřeno od výchozího stavu jako plocha nákresu rány pořízeného (obvodní) sestrou a následně spočítáno počítačovým snímacím zařízením. Výsledky byly analyzovány za použití Wilcoxonova testu pro párové hodnoty. • práce je dotazníková přehledová studie u 963 praktických lékařů náhodně vybraných v celém Spojeném království, v níž byli dotázáni na rok jejich promoce na lékařské fakultě a na úroveň diastolického tlaku, pří které by začali léčit esenciální hypertenzi. Možnosti odpovědí na strukturovaném dotazníku byly „90-99 mmHg", „100-109 mmHg" a „110 mmHg a více". Výsledky byly analyzovány za použití x2 (chí kvadrát) testu v kontingenční tabulce 3x2, aby bylo vidět, zda práh pro léčbu hypertenze je ve vztahu k tomu, zdali lékař promoval před rokem 1975 nebo po něm. • práce je kazuistika jediného pacienta s podezřením na smrtelnou lékovou reakci na Sleepol, nově distribuované hypnotikum. Pomůckou pro metodologické hodnocení jsou také t.zv. „kontrolní seznamy", které obsahují přehled otázek, na které je potřeba se při hodnocení metodologické kvality publikace zaměřit. 703 41 DIAGNÓZA 41.1 VALIDITA DIAGNOSTICKÝCH TESTŮ Při kritickém posuzování diagnostického testu je třeba najít odpověď na tři následující otázky: 1 -je validní důkaz o přesnosti dg.testu? 2 -rozlišuje test pacienty kteří mají a nemají specifickou poruchu? 3 -je možno aplikovat tento validní a významný test u speci- fického pacienta? Jestliže najdeme publikaci o dg.testu - je možno jí kriticky zhodnotit položením následujících otázek: Validita • bylo provedeno nezávislé, zaslepené srovnání s referenčním (zlatým) standardem? ...absolvovali pacienti oboje vyšetření (tj.diagnostic -ký.test na příklad vyšetření krve a současně i standard - biopsie, pitva) ... zaslepení (na příklad patolog hodnotí bipsii a nezná výsledek dg.testu) • často může být problém se standardem (nemusí být přesný) např. v psychiatrii, ale i u jiných standardů (shoda expertů u bipsii jen v 50%) • výsledek testu je označen jako normální nebo abnormální • 6 definic co je považováno za normální: 6 definic co je považováno za normální 1. Gaussovo rozložení: průměr ± 2 standardní odchylky - to může být považováno za normální rozložení pro všechny testy a výsledky, které mají takové rozložení 2. Percentily: v rozmezí řekněme 5-95% - mají stejný základní defekt jako Gaussovo rozložení 3. Kulturně přijatelné: normální je to, co je preferováno a přijímáno společností = medicínská kritéria stojí v pozadí 4. Podle rizikového faktoru: pokud nepřináší zvýšené riziko onemocnění (ale není jisté, jestli změna rizikového faktoru přinese také změnu rizika jako takového)? 5. Diagnostická: rozmezí výsledků mimo hranice, kde výskyt nemoci je vysoce pravděpodobný - toto kriterium je používáni i v rámci diskuse o EBM!!! 6. Therapeutická: rrozmezí výsledků mimo hranice, kdy léčba přináší více prospěchu než poškození = to je třeba mít na mysli při kritickém posuzování zejména nových léčebných postupů v rámci EBM!!! Dále je třeba posoudit následující okolnosti: • byl dg.test hodnocen na patřičném spektru pacientů (jako v klinické praxi)? • na celém spektru průběhu nemoci (iniciální stádium, pozdní stádium, léčení i neléčení pacienti atd.) • u ostatních nemocí často zaměňovaných? • byl použit referenční standard bez ohledu na výsledky diagnostického testu? (u negativních výsledků je tendence nepoužívat, zvláště je-li invazivní, rizikový) • byl diagnostický test ověřován na další, nezávislé skupině pacientů? Jestliže v publikaci chybí jedna nebo více z těchto podmínek, je to problém validity! Jinak pokračujeme v kritickém hodnocení následující otázky tj. zda test rozlišuje pacienty, kteří mají a nebo nemají specifickou poruchu. Významnost Významnost testu pro rozlišení zda pacient má nebo nemá danou specifickou poruchu je možno posuzovat podle sen-zitivity a specificity testu. Tyto ukazatele představují starší koncepci posuzování a nemají patřičnou přesnost. Novější, modernější a zároveň přesnější a účinnější koncepci představuje ukazatel „likelihood ratio" Pozornost je při použití tohoto ukazatele zaměřena na schopnost testu změnit náš názor, který jsme měli před provedením testu (pre-test probability) a který budeme zastávat po provedení testu (post-test probability). Při vyhodnocení potom platí, že diagnostický test, který vyvolá velkou změnu z pre-test na post-test probability je významný a v klinické praxi bude pravděpodobně užitečný. Příklad: u pacienta s anémií je pravděpodobnost, že má anémii z nedostatku Fe 50% (50:50). Zvažujeme použití diagnostického testu na sérový ferritin. Našli jsme nékolik systemat.přehledů použití tohoto testu ve srovnání s ref.standardem (barvení kostní dřené na Fe). Výsledky tohoto systematického přehledu ukazuje tabulka 1. Sérový ferritin jako diagnostický test pro anémii z deficitu železa Tab. 1 Anémie z deficitu železa Celkem přítomna nepřítomna Sérový ferritin Pozitivní (< 65 mmol/1) 731 a 270 b 1001 Negativní (> 65 mmol/1) 78 c 1500 d 1578 Celkem 809 1770 2579 Výsledek našeho pacienta byl 60mmol/l. Jak můžeme tento výsledek vyhodnotit? - spadá buď do políčka „a" nebo do „b" na tabulce Z toho vyplývá, že 90% pacientů s deficitem Fe (731/809 x 100) má sérový ferritin ve stejném rozmezí jako náš pacient (to představuje ukazatel, který se nazývá senzitivita). Dále 85% pacientů, kteří nemají anémii z deficitu železa (1500/1770 x 100) mají také hodnotu sérového ferritinu negativní (ukazatel, který se nazývá specificita). Současně je zřejmé, že jen 15% pacientů s jinými příčinami anémie (270/1770 x 100) má výsledek ve stejném rozmezí jako náš pacient. Takže výsledek našeho pacienta je 6 x pravděpodobnější (90%/15%) u anémie z deficitu železa než u jiné příčiny anémie (to je ukazatel, který se nazývá likelihood ratio pro pozitivní test (LR+ = senzitivita/1-specificita) Pravděpodobnost deficitu železa 50:50 (stanovená odhadem na začátku vyšetřování) = pre-test odds 1:1. Jestliže tuto násobíme LR+ (1x6=6) pakpost-test odds je 6:1 ve prospěch anémie z deficitu Fe. Myslíme-li spíše v pojmech pravděpodobnosti než „odds" pak post-test odds 6:1 konvertujeme na post-test probability = 6/6+1 = 86% Pre-test odds vycházející z publikované tabulky = 31%/ 69% = 0.45, pak post-test odds = 0.45 x 6 = 2.7 a post-test probability = 2.7/3.7 = 73% a to je stejné jako pozitivní prediktivní hodnota. 704 Použití senzitivity a specificity je trochu jiné než se obvykle myslí: - je-li vysoká senzitivita testu pak negativní výsledek spolehlivě vylučuje dg. ( SnNout) - je-li vysoká specificita testu pak pozitivní výsledek spolehlivě potvrzuje dg. ( SpPin ) Multilevel likelihood ratio I když podle starších kritérií vypadá stanovení sérového fer-ritinu dobře (senzitivita 90% a specificita 85%), novější vyjádření přesnosti pomocí likelihood ratio má větší vypovídací cenu a ukazuje, že starší způsob může být i zavádějící tím, že zohledňuje pouze pozitivní nebo negativní výsledek testu. Výsledky většiny testů však mohou být rozděleny do více úrovní jak je ukázáno na tabulce 2. Pětistupňová Skála výsledků diagnostického testu Tab. 2 Výsledek Cílová Porucha" dg. testu Deficit železa Sérový feritin Přítomna Nepřítomna mmom Počet % Počet % Likelihood ratio Diagnostický důsledek Silně pozitivní <15 474 59 (474/809) 20 1.1 (20/1770) 52 Potvrzuje dg. Mírně pozitivní 15-34 175 22 (175/809) 79 4.5 (79/1770) 4.8 Středně vysoký Neutrální 35-64 82 10 (82/809) 171 10 (171/1770) 1 Neurčitý Mírně neg. 65-94 30 3.7 (30/809) 168 9.5 (168/1770) 0.39 Středně nízký Silně neg. >94 48 5.9 1332 75 (48/809) (1332/1770) 0.08 Vylučuje dg. Celkem 809 100.0 1770 100.0 X X • z tabulky je vidět kolik informací o přesnosti ferritinové-ho testu se ztrácí, pokud se hodnotí • pouze pozitivní nebo negativní výsledek • LR pro vysoce pozitivní výsledek je působivé = 52, takže jeden takový výsledek testu určuje diagnózu. V takovém případě můžeme povařovat diagnózu za jistou (SpPin) u 59%(474/809) pacientů s anémií z deficitu Fe i přes nepůsobivou senzitivitu (59%). • LR 10 a více pokud je aplikováno na pre-test probability 33% a více (33%/67% = pre-test odds • of 0.5) vytváří post-test probability 5/6 = 83% a více • druhá extrémní hodnota(negativní) může vyloučit anémii z nedostatku železa (SnNout) u 75%(1332/1770) pacientů, i přes nepůsobivou specificitu 75% • LR 0.1a menší, pokud je aplikováno na pre-test probability 33% (pre-test odds 0.5) vytváří post-test probability 0.05/1.05 = 5% a menší • dvě střední hodnoty(středně pozitivní a negativní) mohou posunout 50% pravděpodobnost (pre-test odds 1:1) na užitečnou ale ne vždy diagnostickou post-test probability 4.8/5.8 =83%, 0.39/1.39=28% • neurčitá hodnota uprostřed, obsahující asi 10% obou typů pacientů, je neinformativní s LR = 1 Dopad různých LR na pre-test probability ukazuje tabulka 3: Pětistupňová Skála výsledků diagnostického testu a vliv na post-test probability v závislosti na pre-test probability Tab. 3 Post-test probabilhty cílové poruchy pro Likelihood různé hodnoty pre-test probability ratio Pre-test Pre-test Pre-test Pre-test Pre-test Pre-test 5% 10% 20% 30% 50% 70% poSivnílO 34% 53% 71% 81% 91% 96% Středně pozitivní 3 14% 25% 43% 56% 75% 88% Neutrální 1 5% 10% 20% 30% 50% 70% Středně negativní 0.3 1.5 % 3.2 % 7% 11% 23% 41% Silně negativní 0.1 0.5 % 1% 2.5 % 4% 9% 19% Pokud se opět vrátíme zpět k našemu pacientovi s pre--test probability pro deficit Fe 50:50 a s výsledkem sérového ferritinu 60 mmol/1 je překvapením, že pacientovy výsledky spadají do neurčitého LR 1 a pacientův výsledek testu, který se zdál velmi užitečný vzhledem k jeho původnímu hodnocení senzitivity a specificity, ve skutečnosti nevede k diagnóze. V tomto případě je tedy třeba použít jiný test (ref.standard?) aby se problém diagnózy vyřešil. Mnoho současných diagnostických testů uvádí multilevel LR a pokud uvádí pouze senzitivitu a specificitu, lze LR z těchto hodnot vypočítat. Použitelnost Při zvažování jestli je validní a významný diagnostický test použitelný pro našeho pacienta se specifickou pre-test probability je třeba zvážit následující otázky: • je diagnostický test dostupný a přesný v našem prostředí? je-li na trhu, zda je zajištěno aby byl prováděn a interpretován kompetentně a reprodukovatelně • diagnostický test se může chovat jinak u různých skupin pacientů (v časném nebo pozdním stádiu nemoci) a to je další důvod proč je výhodné používat LR, které je méně ovlivněno těmito důvody • některé dg.testy založené na příznacích ztrácejí diagnostickou sílu při změně pacientů z primární do sekundární nebo terciární péče (klesá specificita-falešná pozitivita) Další otázkou je, zda se může udělat klinicky rozumný odhad pre-test probability pro našeho pacienta? Podle čeho odhadujeme: • klinická zkušenost - u předchozích pacientů .. to může být ovlivněno vzpomenutím na posledního pacienta, nejdramatičtější událostí a pod. • regionální statistiky prevalence - kvalita statistik • databáze kliniků - spíše „hudba budoucnosti" ale i tak otázka diagnostických kritérií, jasné definice příznaků atd. • publikace podle které jsme posuzovali validitu a význam diagnostického testu - skladba pacientů v publikaci • studie určující tento problém - nejlepší. Také se můžeme ptát zda ovlivní post-test probability naší péči o pacienta? • zda na základě těchto výsledků překonáme určitý diagnostický práh a můžeme přestat s dalším vyšetřováním! • je-li dg test negativní nebo vytváří LR kolem 0.1 můžeme 705 suspektní diagnózu opustit je-li dg test pozitivní nebo vytváří vysoké LR, diagnóza je stanovena práh diagnostického testu může být překročen oběma směry ( viz obrázek 2), pouze když nás nechá diagnostický test uprostřed těchto prahů, pak vyšetřujeme jinými testy Práh pro vyšetřování a léčení i nevyšetřovat i nevyšetřovat vyšetřovat a léčit na základě výsledků šetření i i i i i neléčit i i i zahájit léčbu i + + 10 20 + + + + 30 40 50 60 + + + H 70 80 90 100 B Prevalence (pre-test probability) cílové poruchy Nemusíme však překročit prahy i při použití více diagnostických testů - a zde se opět uplatňují výhody LR • protože post-test odds prvního dg testu je pre-test odds pro druhý dg test, můžeme násobit průběžný produkt LR vytvořeným z následujícího testu příklad: přijde do ordinace 45 lety muž a jeho pre-test probability stenózy (>75%) jedné nebo více koronárních arterií je okolo 6%, v anamnéze udá netypickou bolest na hrudníku (jsou přítomny pouze dva ze tří příznaků substernálních hradních potíží vyvolaných námahou s úlevou po méně než 10 minutách klidu = vytváří LR okolo 13), jeho zátěžové EKG odhalí 2. 2mm trvalou depresi ST =vytváří LR okolo 11 a jeho post-test probability koronárni sklerózy je jeho pre--test probability (převedená na pre-test odds) násobená LR z anamnézy (13) a zátěžového EKG (11), z toho je post-test odds, převedené opět na post-test probability (vydělením post-test odds +1) t.zn.: (0.06/0.94) x 13 x 11 = 9.13/10.13 = 90% Konečný výsledek je přesný pokud jsou diagnostické testy které kombinujeme „nezávislé" (pravděpodobnost určitého výsledku u druhého testu je stejná pro všechny výsledky prvního testu a to u většiny testů které používáme v sekvenci pro určení jedné diagnózy není pravda) Proto chceme na konci této sekvence post-test probability nad prahem kdy začínáme s léčbou, než se podle ní začneme řídit. To je další příklad kdy LR pomohou z nejasné diagnostické úvahy udělat jednoznačnou. Neměli bychom však zapomínat na informovanost pacienta o všech těchto diagnostických úvahách, které všechny do jisté míry narušují jeho soukromí, mohou být bolestivé nebo nebezpečné a pacient má právo být informovaný a pak může být i spolupracujícím partnerem. Poslední otázkou je zda výsledky (a důsledky) stanovení těchto ukazatelů pomohou pacientovi dosáhnout terapeutic-kéh cíle (pří zvážení terapeutických možností). Využití kritického hodnocení Kritická hodnocení různých klinických problémů, prováděná specialisty v oboru EBM se potom prezentují ve formě standardizovaných jednostránkových shrnutí důkazů - „critically appraised topic" CAT, které se potom mohou stát velmi významnou pomůckou, která popisuje klinický postup a pomáhá lékaři při jeho rozhodování. Qbr 2 Jako příklad je uveden CAT pro ferritin: CAT - ferritin v diagnostice deficitu železa v dospělosti Klinický řádek: sérový ferritin může být velmi užitečný v diagnostice anémie z deficitu železa v dospělosti Klinický scénář: u 751eté učitelky v důchodu byla pří zdravotní prohlídce zjištěna hodnota haemoglobinu 10 s MCV 80, negativní anamnéza i fyzikální vyšetření a žádná medikace, terá by mohla způsobit útlum krvetvorby nebo krvácení. Odhad pravděpodobnosti, že má nedostatek železa byl 1:2 nebo 50%. Klinická otázka (složená ze tří částí): pomůže stanovení sérového ferritinu u starší ženy bez klinických příznaků, s mírnou anémií, určit zda její zásoby železa v kostní dřeni jsou nižší? Vyhledávací termíny: „ferritin" v Best Evidence = 6 citací včetně jedné velké studie a přehledu. Hodnotil: Sackett v CEBM, Oxford, pátek 9.7.1999 Studie: Nezávislá ? Ano Zaslepená? Ano Standard aplikován bez ohledu na výsledky? Ano Patřičné spektrum pacientů? Není možno posoudit Cílová porucha a „zlatý standard" kostní dřeň, barvení na železo Pacienti: pacienti postupně přicházející na ambulance nebo nemocniční oddělení. Vyloučeni pacienti s transfúzí. Diagnostický test: sérový ferritin stanovený RIA Důkaz: Přítomný Nepřítomný Výsledek testu Počet Proporce Počet n Likelihood Proporce .. ratio <15 474 0.59 20 0.01 51.85 15-34 175 0.22 79 0.04 4.85 35-64 82 0.10 171 0.11 1.05 65-94 30 0.04 168 0.09 0.39 >95 48 0.06 1332 0.75 0.08 Komentář: 1. U starších pacientů s asymptomatickou anémií je třeba ještě použít CAT pro anémii u starších pacientů, pro určení výtěžnosti vyšetření horní a dolní čísti zažívacího traktu. 2. Řada laboratoří vydává výsledky vyšetření ferritinu za velmi dlouhou dobu. Expirace: leden 2001 Literatura: =*■ Guyatt G H et al.: Laboratory diagnosis of iron deficiency anemia: an overview, J.Gen.Intern.Med. 1992; 7: 45-53 =*■ Paterson C et al.: Iron deficiency in the elderly: the diagnostic process, Can.Med.Ass.J. 1991; 144:435-440 706 41.2 PRÍKLADY NA VYUŽITÍ HODNOCENÍ DIAGNOSTICKÝCH TESTŮ Deset mužů na lavici obžalovaných Deset mužů čeká soudní přelíčení kvůli vraždě. Pouze tři z nich skutečně spáchali vraždu, ostatních sedm je zcela nevinných. Porota každého vyslechne a shledá šest z nich vinných z vraždy. Dva z odsouzených jsou skutečně vrazi. Čtyři muži jsou nespravedlivě uvězněni. Jeden vrah je volný. Tuto informaci lze vyjádřit jako tzv. čtyřpolní tabulku (tj. kontingenční tabulka 2x2). Pravda Vinen Nevinen Nevinen 1 Všimněte si, že „pravda" (tj. zdali se ti muži skutečně dopustili vraždy) je vyjádřena pod nadpisky nahoře vodorovně seřazenými a výrok poroty (který může nebo nemusí odrážet pravdu) je vyjádřen vedle nadpisků umístěných svisle vlevo. Tato čísla odrážejí řadu vlastností [schopnosti] této konkrétní poroty: • Porota správně rozpozná dva z každých tří skutečných vrahů. • Správně zprostí obžaloby tři z každých sedmi nevinných lidí. • Pokud tato porota shledá nějakou osobu vinnou, je stále šance jen jedna ze tří, že tato je skutečně vrahem. • Pokud tato porota shledá nějakou osobu nevinnou, má ona šanci tři ze čtyř, že je skutečně nevinná. • V pěti případech z každých 10 porota vynáší spravedlivý rozsudek. Těchto pět vlastností tvoří, v pořadí, jak jsou uvedeny, senzitivitu, specificitu, pozitivní prediktivní hodnotu, negativní prediktivní hodnotu a správnost fungování této poroty. Těchto pět vlastností se dá aplikovat na diagnostické (nebo screeningové) testy, když se porovnají se „skutečnou" diagnózou nebo zlatým standardem. Jak už bylo řečeno, je zde ještě šestá, poněkud složitější (ale velice užitečná) vlastnost diagnostického testu - "likelihood ratio". V popsaném případě likelihood ratio pozitivního rozsudku poroty je 1.17 a v případě negativního rozsudku je 0.78. Z těchto hodnot je zřejmé, že v tomto případě práce poroty nebyla příliš kvalitní. Ověření validity diagnostického testu vzhledem ke zlatému standardu: Čistič oken řekl svému lékaři, že v poslední době pociťuje žízeň, a požádal ho o vyšetření na cukrovku, která pronásleduje jeho rodinu. Sestra v ordinaci vyšetřila jeho vzorek moči ponořením specielního detekčního proužku. Proužek zůstal zelený, což zjevně znamenalo, že v jeho moči není žádný cukr (glukóza). To znamenalo, jak řekla sestra, že nemá cukrovku. S obtížemi se pak tomuto čističi oken vysvětluje, že výsledek testu neopravňuje k takovému závěru o nic víc, než že by rozsudek vinen z někoho nutně dělal vraha. Definice diabetů podle Světové zdravotnické organizace je hladina glukózy v krvi nad 7 mmol/1 nalačno nebo nad 11.1 mmol/1 dvě hodiny po orální zátěži 100 g glukózy (glukózo vý toleranční test). Těchto hodnot musí být dosaženo při dvou oddělených vyšetřeních, pokud osoba nemá žádné příznaky, nebo jen jednou, pokud má typické příznaky diabetů (žízeň, polyurii a tak dále). Tato přísná kritéria lze nazvat zlatým standardem pro diagnostiku diabetů. Jinými slovy, pokud jsou splněna kritéria WHO, je možno nazvat pacienta diabetikem. Totéž nelze říci o orientační metodě namáčení diagnostického proužku do příležitostného vzorku moči. Na jedné straně může být doopravdy diabetik, ale má vysoký renální práh; to znamená, že jeho ledviny zadržují glukózu mnohem více než u většiny lidí, a tak by hladina glukózy v jeho krvi musela být mnohem vyšší než u většiny lidí, aby se u něho nějaká glukóza objevila v moči. Na druhé straně může být jinak normální jedinec s nízkým renálním prahem, a tak u něho glukóza uniká do moči, i když jí v jeho krvi není nadbytek. Ve skutečnosti je diabetes často sdružen s negativním testem na glukózu v moči. Avšak použití močového proužku má mnoho výhod oproti glukózovému tolerančnímu testu z plné krve, pokud se použije jako screeningový test, zda vyšetřovaní jedinci nemají diabetes. Test je levný, vyhovující, snadno proveditelný a hodnotitelný, přijatelný pro pacienty a poskytuje okamžitý výsledek typu ano/ne. V reálném životě mohou lidé, jako na příklad čistič oken, odmítnout glukózový toleranční test. I kdyby byl připraven jej podstoupit, jeho praktický lékař by mohl usoudit, že jeho příznaky si nezaslouží náklady na toto poměrně složité vyšetření. Z toho je zřejmé, že i když nemůže močový test s jistotou říci, zda někdo je diabetik, má určité praktické výhody oproti zlatému standardu. A to je také důvod, proč je používán! Abychom objektivně posoudili, jak užitečný je močový test na glukózu pro diagnostiku diabetů, museli bychom vybrat vzorek lidí (řekněme 1000) a u každého z nich provést dva testy: močový test (screeningový) a standardní glukózový toleranční test (zlatý standard). Poté bychom viděli u každé osoby jednotlivě, zdali výsledek screeningoveho testu odpovídá výsledku zlatého standardu. Takový proces je znám jako studie ověřující platnost testu (angl. validation study). Výsledky takové studie můžeme opět vyjádřit ve formě čtyřpolní tabulky: Glukóza v moči pozitívni negativní Glukózový toleranční test pozitivní negativní celkem 6(a) 7 (b) 13 21 (c) 966 (d) 987 celkem 27 973 1000 • Můžeme tedy spočítat důležité vlastnosti močového testu na průkaz diabetů. • Senzitivita = a/(a+c) = 6/27 = 22.2 % • Specificita = d/(b+d) = 966/973 = 99.3 % • Pozitivní prediktivní hodnota = a/(a+b) = 6/13 = 46.2 % • Negativní prediktivní hodnota = d/(c+d) = 966/987 = 97.9 % • Správnost = (a+d)/(a+b+c+d) = 972/1000 = 97.2 % • Likelihood ratio pozitivního testu = senzitivita/ (1 - specificita) = 22.2/0.7 = 32 • Likelihood ratio negativního testu = (1 - senzitivita)/ specificita = 77.8/99.3 = 0.78 Na těchto číslech je vidět, proč u čističe oken nebyla po vyšetření moče jistota, že nemá diabetes. Pozitivní močo- 707 vý glukózový test má jen 22 % senzitivitu, což znamená, že test nezachytí téměř čtyři pětiny skutečných diabetiků. V přítomnosti klasických příznaků a pozitivní rodinné anamnézy je výchozí riziko čističe oken (pretestová neboli apriorní pravděpodobnost), že je nemocný, vysoké, a po jednotlivém negativním močovém testu je sníženo jen asi na čtyři pětiny původní hodnoty (likelihood ratio negativního testu = 0.78). Vzhledem k jeho příznakům je zřejmé, že tento muž potřebuje podstoupit definitivnější test na diabetes. Pokud by však močový glukózový test byl pozitivní, čistič oken by měl dobré důvody ke znepokojení, protože i když test není příliš senzitivní (tj. není dobrý na zachycení lidí s nemocí), je výrazně specifický (to znamená, zeje dobrý pro vyloučení lidí bez nemoci). V praxi se často u testů zaměňuje hledisko senzitivity/ specificity s hlediskem pozitivní/negativní prediktivní hodnoty. Běžně platí, že senzitivita a specificita vypovídají o testu povšechně, zatímco prediktivní hodnota vypovídá o tom, co výsledek určitého testu znamená pro konkrétního pacienta. Proto senzitivitu a specificitu obecně používají spíše epidemiologové a specialisté na veřejné zdraví, jejichž každodenní práce zahrnuje rozhodování ohledně populací. Screeningový mammogram (rentgen prsu) může mít 80% senzitivitu a 90% specificitu pro odhalení karcinomu prsu, což znamená, že test zachytí až 80 % karcinomů a vyloučí 90 % žen bez rakoviny. Ale když přijde pacientka za svým lékařem pro výsledek svého mammogramu, bude chtít odpověď (je-li test pozitivní) „Jaké je riziko, že mám rakovinu?" nebo (je-li výsledek negativní) „Jaká je pravděpodobnost, že mohu zapomenout na možnost rakoviny?". Mnoho pacientek (a příliš mnoho zdravotníků) předpokládá, že negativní prediktivní hodnota testu je 100 %, tj. pokud je test „normální", myslí si, že není žádné riziko přítomnosti nemoci - a v případě pozitivní prediktivní hodnoty je tomu naopak. Deset otázek, které je třeba si položit ohledně publikace, která tvrdí, že ověřuje platnost diagnostického nebo screeningového testu Otázka 1 Může být tento test důležitý pro mou praxi? Je to otázka „tak co?", kterou se Sackett a kolegové ptají na užitečnost testu. I kdyby test byl 100% platný, správný a spolehlivý, pomohl by mi? Zjistil by léčitelné onemocnění? Pokud ano, mohu si jej já (nebo mí pacienti či daňový poplatník) dovolit? Souhlasili by s ním moji pacienti? Změnil by dostatečně pravděpodobnost ostatních možných diagnóz tak, aby to pozměnilo můj léčebný plán? Pokud všechny odpovědi na tyto otázky jsou „ne", jste schopni onu publikaci zamítnout, aniž byste četli dále za abstrakt nebo úvod. Otázka 2 Byl test porovnán se skutečným zlatým standardem? Nejprve se musíte zeptat, zdali test byl vůbec s něčím porovnán! Občas jsou napsány práce (a v minulosti byly i publikovány), v nichž nebylo uděláno nic kromě provedení nového testu u několika tuctů subjektů. Takový výkon může poskytnout řadu možných výsledků testu, ale určitě nepotvrzuje, že „pozitivní" výsledky ukazují na to, že cílová porucha (hledané onemocnění) je přítomna, a že „negativní" výsledky znamenají, že není. Pro mnohé stavy neexistuje takový diagnostický test, který by byl zlatým standardem a který by s určitostí řekl, zda nemoc je nebo není přítomna. Nepřekvapí, že jsou to právě ty stavy, pro které se hledají nové testy nejaktivněji! Proto by autoři takové publikace měli vyvinout kombinaci kritérií, vůči nimž by měl být nový test vyhodnocen, a vysvětlit oprávněnost jejich použití. Jednou specifickou věcí, kterou je třeba zkontrolovat, je, že test, jehož platnost se zde ověřuje (nebo jeho varianta), se nepoužívá k tomu, aby přispěl k charakteristice zlatého standardu. Otázka 3 Zahrnula tato studie, ověřující validitu testu, vhodné spektrum subjektů? Kdybyste ověřovali platnost nového testu na cholesterol u 100 zdravých mediků mužského pohlaví, nebyli byste schopni říci, jak by test fungoval u žen, dětí, starších lidí, u osob s nemocí, které výrazně zvyšují hladinu cholesterolu, nebo dokonce u těch, kteří nikdy nebyli na lékařské fakultě! Ačkoli jen málo lidí by bylo tak prostých , aby si vybrali takhle jednostranný vzorek pro svou studii, jež má ověřovat platnost testu, jedna práce zjistila, že jen 27 % publikovaných studií výslovně charakterizovalo spektrum testovaných subjektů ve smyslu věku, pohlaví, příznaků a/nebo tíže nemoci a specifických vstupních kritérií. Popis palety účastníků i spektra nemocí, které by se měly do studie zahrnout, je nezbytný, pokud by se hodnoty různých vlastností testů měly používat i pro jiné situace. Určitý diagnostický test může být senzitivnější u žen než u mužů nebo u starších osob než u mladších. Z těchto důvodů, jak požadují Sackett a kolegové, osoby, na nichž se ověřuje jakýkoli test, by měly zahrnovat jak osoby s lehkým tak i s těžkým onemocněním, léčené a neléčené a osoby s různými běžně zaměnitelnými diagnózami. Zatímco jsou senzitivita a specificita testu zdánlivě konstantní, ať je prevalence nemoci jakákoli, jsou pozitivní a negativní prediktivní hodnota silně závislé na prevalenci. To je důvod, proč jsou praktičtí lékaři, často oprávněně skeptičtí ohledně užitečnosti testů vyvinutých výlučně na populaci v sekundární péči (fakultní nemocnice a pod.), kde jsou onemocnění obvykle těžší ), a proč dobrý diagnostický test (obecně používaný, má-li pacient příznaky podezřelé z příslušné nemoci) není nutně dobrým screeningovým testem (obecně užívaným u lidí bez příznaků a pocházejících z populace s mnohem nižší prevalencí nemoci). Otázka 4 Předešlo se systematické chybě provedení? To je snadné zkontrolovat. Jednoduše to znamená, „byl každý, kdo byl vyšetřován novým diagnostickým testem, rovněž vyšetřován zlatým standardem a naopak?". Studie, kde se zlatý standard provádí pouze u osob s pozitivním výsledkem testu, jehož platnost se ověřuje, jsou zatíženy systematickou chybou. Existuje navíc ještě řada dalších jemnějších hledisek systematické chyby provedení, která ale přesahují rámec této publikace. Otázka 5 Předešlo se systematické chybě očekávání? K systematické chybě očekávání dojde, když jsou patolog a jiní, kteří interpretují diagnostické vzorky, podvědomě ovlivněni znalostí určitých stránek případu; například vědí o přítomnosti bolesti na hrudi, když hodnotí EKG. V souvislosti s ověřováním platnosti diagnostického testu vzhledem ke zlatému standardu jde o otázku: „Věděli lidé, kteří hodnotí jeden z testů, jaký byl výsledek druhého testu u každé jednotlivé osoby?" Všechna vyhodnocení by měla být správně„zaslepená" - to je, že osoba interpretující test by neměla vědět ani náznak toho, jaký výsledek se u jednotlivého případu očekává. Otázka 6 Bylo ukázáno, že test je reprodukovatelný v rámci vyšetřujícího i mezi vyšetřujícími? Pokud tentýž vyšetřující provádí tentýž test dvakrát u osoby, jejíž vlastnosti se nezměnily, vyjdou u části případů odlišné 708 výsledky. Všechny testy vykazují do určité míry tuto vlastnost, ale test s reprodukovatelností 99 % je jasně v jiné poloze než ten s reprodukovatelností 50 %. Ke špatné reprodukovatelností diagnostického testu může přispívat řada činitelů: technická přesnost vybavení, rozdíly mezi vyšetřujícími (například při srovnávání barvy s referenčním diagramem), aritmetické chyby a tak dále. Bude-li stejný výsledek k interpretaci, dva lidé se shodnou jen u části případů, což se obecně vyjadřuje jako k skóre. Pokud příslušný test dává číselné výsledky (jako je hladina cholesterolu v krvi v mmol/1), shoda mezi vyšetřujícími nebude problémem. Ale pokud test zahrnuje prohlížení skiagramů (jako je příklad mammogramu) nebo dotazování se lidí na to, jak pijí, je důležité potvrdit, že reprodukovatel-nost mezi vyšetřujícími je na přijatelné úrovni. Otázka 7 Jaké jsou vlastnosti testu odvozené ze studie ověřujícíjeho [platnostjvaliditu? Všechny uvedené standardy mohou být dodrženy, ale test může být stále bezcenný, protože sám není validní, tj. jeho senzitivita, specificita a další rozhodující vlastnosti jsou příliš nízké. To je možná případ použití glukózy v moči jako screeningového testu na diabetes. Ostatně pokud má nějaký test četnost falešně negativních výsledků téměř 80 %, pravděpodobně spíše uvede klinika v omyl, než by napomohl diagnostice cílové poruchy. Ohledně validity screeningového testu není nic absolutně určeno, jelikož to, co se považuje za přijatelné, závisí na stavu, o jehož záchyt se jedná. Asi není pochyb o testu na barvoslepost, který má 95% senzitivitu a 80% specificitu, ale na barvoslepost nikdo nikdy nezemřel. Guthrieho screenin-gový test na kongenitální hypotyreózu, prováděný u všech novorozenců v některých zemích brzy po porodu, má více než 99% senzitivitu, ale pozitivní prediktivní hodnotu jen 6 % (jinými slovy, zachytí téměř všechny děti s tímto stavem za cenu vysoké četnosti falešně pozitivních výsledků), ale to je dobře . Je mnohem důležitější zachytit každé jednotlivé dítě s tímto léčitelným stavem, u něhož by se jinak vyvinulo těžké mentální postižení, než ušetřit stovky rodičů poměrně malého stresu z opakování krevních testů u jejich dětí. Otázka 8 Byly stanoveny intervaly spolehlivosti pro senzitivitu, specificitu a další vlastnosti testu? Interval spolehlivosti, který může být spočítán pro skutečně každou sadu číselných výsledků, vyjadřuje možné rozpětí výsledků, uvnitř něhož bude ležet skutečná hodnota. Vratíme-li se k příkladu soudní poroty , pokud by shledali nevinným pouze o jednoho vraha navíc, senzitivita jejich rozsudku by spadla ze 67 % na 33 % a pozitivní prediktivní hodnota rozsudku ze 33 % na 20 %. Senzitivita vzhledem k rozhodnutí u jednotlivého případu je tak výrazně nízká (a zcela nepřijatelná), protože byla ověřována platnost práce poroty jen na 10 případech. Intervaly spolehlivosti pro vlastnosti této poroty jsou tak široké, že by je asi počítačový program odmítl spočítat! Čím větší velikost vzorku, tím užší interval spolehlivosti, a tak je zvláště důležité pátrat po intervalech spolehlivosti, pokud publikace, kterou čtete, pojednává o studii s poměrně malým vzorkem. Otázka 9 Bylo z těchto výsledků odvozeno rozumné „normální rozmezí"? Pokud test poskytuje spojité výsledky - tj. pokud dává spíše číselné hodnoty než výsledky typu ano/ne - někdo bude muset říci, při jaké hodnotě bude výsledek testu považován za abnormální. Mnozí z nás už byli v této situaci s měřením vlastního krevního tlaku. Chceme vědět, jestli jsou naše výsledky „v pohodě" nebo ne, ale lékařův výsledek je „142/92". Jestliže hodnota 140/90 byla stanovena jako hraniční bod pro vysoký krevní tlak, byli bychom umístěni do „abnormální" kategorie, i když riziko potíží plynoucí z našeho krevního tlaku se velmi málo liší od rizika osoby s krevním tlakem 138/88. Docela rozumně mnozí praktičtí lékaři říkají svým pacientům: „Váš krevní tlak není zcela v pořádku, ale nespadá do nebezpečné oblasti. Přijďte za tři měsíce na kontrolu". Nicméně v některé fázi musí lékař rozhodnout, že tento krevní tlak potřebuje medikamentózni léčbu , ale tamten ne. Určení relativně a absolutně nebezpečných oblastí pro spojitou fyziologickou nebo patologickou proměnnou je složitá věda, která by měla brát v úvahu skutečnou pravděpodobnost nepříznivého následku, kterému by měla zamýšlená léčba předcházet. Takový proces je značně objektivnější při použití likelihood ratio. Otázka 10 Byl tento test dán do souvislosti dalších možných diagnostických testů v diagnostické posloupnosti u daného stavu? Všeobecně se léčí vysoký krevní tlak jednoduše na základě samotného měření krevního tlaku (ačkoli se spíše spoléhá na řadu měření, než na jednotlivou hodnotu). Porovnejte to s posloupností, kterou používáme k diagnóze stenózy („sklerózy") věnčitých tepen. Nejprve vybereme pacienty s typickou anamnézou námahové anginy (bolesti na hrudi při námaze). Potom obvykle natočíme klidové EKG, zátěžové EKG a v některých případech provedeme izotopové vyšetření srdce, abychom našli oblasti chudé na kyslík. Většina pacientů přichází ke koronarografii (definitivnímu vyšetření na stenózu věnčitých tepen) poté, co již měli abnormální výsledek těchto předběžných testů. Pokud byste vzali 100 lidí z ulice a přímo je poslali na koronarografii, mohl by test ukázat zcela odlišné pozitivní a negativní prediktivní hodnoty (a dokonce různou senzitivitu a specificitu), než u nemocnější populace, na které se původně ověřovala jeho platnost. To znamená, že různé aspekty validity koronarografie jako diagnostického testu nemají význam, nejsou-li tato čísla vyjádřena ve smyslu toho, jak přispívají k celkovému diagnostickému procesu. Poznámka k likelihood ratio: Předchozí otázka 9 popsala potíže s definicí normálního rozmezí pro spojitou proměnnou. Za takových okolností může mít přednost vyjádřit výsledek testu ne jako „normální" nebo „abnormální", ale v pojmech skutečné pravděpodobnosti, že pacient má cílové onemocnění, pokud výsledek testu dosáhne určité úrovně. Vezměme si za příklad použití měření prostatického specifického antigénu (PSA) pro screening karcinomu prostaty. Většina mužů bude mít v krvi nějaký stanovitelný PSA (řekněme 0.5 ng/ml) a většina z těch, kteří mají pokročilý karcinom prostaty, bude mít hodně vysoké hladiny PSA (často nad 20 ng/ml). Ale hladinu PSA, řekněme, 7.4 ng/ml lze nalézt jak u dokonale normálního muže, tak u někoho s časným karcinomem. Prostě neexistuje jasný hraniční bod mezi normálním a abnormálním. Můžeme však použít výsledky studie ověřující platnost PSA testu vůči zlatému standardu pro diagnostiku karcinomu prostaty (řekněme biopsii), abychom sestavili celou řadu čtyřpolních tabulek. Každá tabulka by používala různou definici abnormálního výsledku PSA, aby byli pacienti roztříděni na „normální" a „abnormální". Podle těchto tabulek bychom mohli vytvořit různé likelihood ratio sdružené s hladinou PSA, která je vyšší, než jsou jednotlivé hraniční body. Kdybychom se potom setkali s výsledkem PSA v „šedé zóně", byli bychom alespoň schopni říci, že „tento test ne- 709 prokázal, že pacient má karcinom prostaty, ale vyplývá z něj x krát vyšší [nebo nižší] riziko této diagnózy". Ve skutečnosti PSA test není příliš dobrý na rozlišení mezi přítomností a nepřítomností karcinomu, ať se používá jakákoli hodnota pro hraniční bod. Jinými slovy, neexistuje žádná hodnota PSA, která by poskytovala zvláště vysoké likelihood ratio pro detekci karcinomu. Ačkoli je likelihood ratio, pokud jde o jeho výpočet, jedním ze složitějších hledisek diagnostického testu, má vysokou praktickou hodnotu a stává se upřednostňovaným způsobem vyjadřování a porovnávání užitečnosti různých testů. Likelihood ratio lze přímo použít k potvrzení nebo vyloučení určité diagnózy. Pokud například vejde nějaká osoba do ordinace a nemá vůbec žádné příznaky, je zřejmé, že má 5% riziko přítomnosti sideropenické anémie, jelikož je známo, že jedna osoba z 20 tuto diagnózu má (řečí diagnostických testů to znamená, že pretestová (apriorní) pravděpodobnost anémie, totožná s její prevalencí, je 0.05). Když se potom provede diagnostický test na anémii, sérovou hladinu ferritinu, výsledek obvykle učiní diagnózu anémie více nebo méně pravděpodobnou. Středně snížená sérová hladina ferritinu (mezi 18 a 45 pg/1) má likelihood ratio 3, takže riziko u pacienta s takovým výsledkem, že má si-deropenickou anémii, se obecně spočítá jako 0.05 x 3 neboli 0.15 (15 %). Tato hodnota je známa jako potestová (apos-teriorní) pravděpodobnost testu na sérový ferritin. (Přísně řečeno, likelihood ratio by se mělo používat spíše pro rizika než pro pravděpodobnosti, ale zde ukázaná jednodušší metoda poskytuje dobré přiblížení, je-li apriorní pravděpodobnost nízká. V tomto příkladě je 5% apriorní pravděpodobnost rovna apriornímu riziku 0.05/0.95 neboli 0.053; pozitivní test s likelihod ratio 3 dává aposteriorní riziko 0.158, což je rovno aposteriorní pravděpodobnosti 14 %). 41.3 SCREENING Screening znamená včasnou diagnostiku presymptomatické-ho období nemoci u zdravých jedinců v populaci (nazýváno jako screening), nebo u pacientů, kteří však přišli k lékaři s jinými problémy (nazýváno jako case finding). Vyšetření, které tyto osoby podstupují by jim mělo zajistit, že budou žít déle anebo lépe, než kdyby toto vyšetření nepodstoupily Takže důkaz, který se hledá v tomto případě není jenom důkaz o validitě diagnostického testu pro určení časné diagnózy, ale je třeba získat přesvědčující důkaz o tom, že se pacientovi v dlouhodobém horizontu bude dařit lépe, pokud bude jeho nemoc včas zjištěna. Tato jistota je nutná především proto, že prováděná vyšetření nejsou, alespoň z krátkodobého pohledu, pro člověka příjemná. Časná diagnóza většinou označí člověka jako že má, nebo alespoň je ve zvýšeném riziku že bude mít nějaké závažné onemocnění (nádor, cerebrovaskulární příhodu, infarkt myokardu a pod.). A toto označení trvá někdy měsíce, roky a někdy i desetiletí, než se taková nemoc manifestuje v symptomatické podobě (a to ještě jen u malé části těch, kteří byli ve screeningu pozitivní). Obecně se dá říci, že „označení" člověka poškozuje. Na příklad v jedné kohortě pracovníků, kteří byli vystřeni a někteří z nich pak označeni jako hypertenzivní bylo zjištěno, že u nich byla větší absence v zaměstnání, snížená psychologická pohoda a progresivní ztráta příjmu ve srovnání s jejich normotenzivními spolupracovníky (tyto poruchy nevyplývaly z jejich případné léčby, protože byly i u neléčených osob) A co může být ještě horší je falešně pozitivní výsledek screeningového testu, který dotyčného jenom poškozuje. Ale do jisté míry i u osob se správně pozitivním výsledkem screeningového testu jsou časy, kdy se tito lidé cítili naprosto zdrávi, nenávratně pryč. Takže časná diagnóza nemusí vždy znamenat žít déle, ale vždy znamená být nemocný déle! Z tohoto pohledu stojí otázky screeningu a vyhodnocení nejlepšího důkazu někde mezi kapitolou o diagnostice (nejlepší důkaz pro časnou diagnózu) a kapitolou o léčení (nejlepší důkaz o efektivitě následné léčby). Proto by každá screeningová metoda a každé klinické vyšeření, které vede k časné diagnóze, by mělo být vyhodnoceno podle následujících kritérií: 1. povede skutečně časná diagnóza k lepšímu přežívání pacienta a k lepší kvalitě života? Poznatky z randomizovaných klinických studií pří dlouhodobém sledování osob s placebem ukázaly, že i osoby, řádně užívající placebo mohou mít lepší výsledky v budoucnu a na druhé straně je známo, že screeningové vyšetření může zachycovat spíše případy s pomalu progredujícím a benignějším průběhem nemoci. Proto prakticky jediným hodnotitelným kritériem je skutečný experiment, kdy osoby pozitivní ve screeningu byly rozděleny do dvou skupin, jedna léčena okamžitě a druhá až po manifestaci klinických příznaků. Tyto studie ukázaly, že na příklad vyšetření prsu a mamografie redukovaly mortalitu na karcinom prsu (ale protože pouze jedna třetina žen s časnou diagnózou měla prodloužené přežití, tak u ostatních dvou třetin se vlastně také jednalo spíše o poškození než o prospěch). Tyto studie ale také ukázaly zbytečnost (a de facto poškození) rtg vyšetření plic u karcinomu plic. V ideálním případě by dlouhodobé sledování mělo být zaměřeno nejen na mortalitu a délku přežívání, ale také na funkcionální změny a známky kvality života. 2. Jsou časně diagnostikovaní pacienti dobře spolupracujícími partnery při léčení? I když je léčba efektivní, pacient, který ji odmítá a nebo zapomene užívat z ní nemá žádný prospěch a zůstávají u něho pouze poškozující následky z označení jeho nemoci (pouze asi polovina pacientů se sama hodnotí jako dobře spolupracující). Existují metody jak vyhodnocovat spolupráci (compliance) pacientů, ale toto vyhodnocení by mělo být provedeno ještě před tím než se začne nějaký screening používat. 3. Je čas a energie lékaře, které vynaložil na potvrzení časné diagnózy a poskytování často celoživotní péče dobře investovanými prostředky? 4. Je frekvence a závažnost cílové nemoci dostatečná natolik, aby vynaložené úsilí a náklady byly opodstatněné? Obě posledně uvedené otázky si pokládá jednak ošetřující lékař a také celá společnost. Jedná se o to, zda vynaložené prostředky na screening, následné potvrzení diagnózy a nakonec na léčbu by nepřinesly větší užitek, kdyby byly použity jinak. Metodologicky je třeba při uvažování o screeningu zachovávat následující pravidla a postupy: Základním předpokladem pro úspěšný a efektivní screening je: - aby zajistil včasný záchyt onemocnění ještě před manifestací klinických příznaků - aby byla k dispozici efektivní léčba v časném stádiu onemocnění - aby při použití této léčby byla zajištěna příznivější prognóza onemocnění 710 Screening je definován jako vyšetření zatím asympto-matických osob a sám o sobě nediagnostikuje nemoc. Proto je nutné následné dovyšetření pomocí dalších a přesnějších laboratorních nebo klinických testů. Pro zavedení screeningověho vyšetření jsou potřebné následující předpoklady: • vhodné onemocnění • vhodný test • vyhodnocení screeningověho programu z hlediska jeho proveditelnosti a jeho očekávané efektivity Onemocnění vhodná pro screening jsou: • onemocnění závažná - u kterých časná terapie zlepšuje prognózu - snížení mortality a morbidity • onemocnění častá, kde screening může dosáhnout vysoké výtěžnosti Důležitým ukazatelem je prevalence preklinických stádií onemocnění, která ovlivňuje ekonomickou efektivitu screeningověho vyšetření. Je-li vyšší prevalence těchto stádií, pak můžeme očekávat i větší zastoupení nemocných ve výsledku screeningověho vyšetření. Prevalenci je možné zvýšit zaměřením screeningu na rizikovou populaci. Screeningový test by mě být: • levný • nenáročný na provedení • představující minimální zátěž pro pacienta • jeho výsledky by měly být validní, spolehlivé a opakovatelné. Vyhodnocení screeningověho testu by mělo být provedeno před jeho použitím a to z hlediska jeho: • proveditelnosti • účinnosti. Proveditelnost screeningověho programu zahrnuje tyto aspekty: • akceptace vyšetřovanou populací (PAP ve srovnání s rek-toskopií) • ekonomická efektivita (screeningové testy, následná diagnostika, sledování, terapie) • následná diagnostika a terapie positivních osob • výtěžnost výpočtu objevených případů (PV+, PV-) Efektivita screeningověho programu je hodnocena podle: • snížení mortality • snížení morbidity Faktory ovlivňující efektivitu screeningu: • použití dobrovolníků • lead time • lengh time Dobrovolníci mohou mít lepší zdravotní stav oproti běžné populaci a častěji dodržují doporučení lékaře Mohou ale mít někdy horší zdravotní stavv důsledku positivní rodinné anamnézy, osobní anamnézy a jejich životního stylu. Proto je těžké odhadnout směr zkreslení výsledků screeningu a ještě těžší je jejich kvantifikace. Lead time je časové období mezi diagnózou provedenou pomocí screeningu a manifestací klinických příznaků. Pro eliminaci působení bias v důsledku tohoto jevu je možno provádět odpočet tohoto období (pokud je známo) pří hodnocení na příklad přežívání a nebo hodnotit věkově specifickou úmrtnost. Length time (bias) znamená větší zastoupení osob s delší preklinickou fází onemocnění a tím i s lepší prognózou. Eliminace jeho působení je možná prostřenictvím opakovaných screeningových vyšetření. Přínos screeningověho programu není vždy samozřejmostí a je nutno zvážit rizika a náklady oproti přínosu (ještě před širokým zavedením do praxe). 711 42 LECENI 42.1 INFORMACE O TERAPEUTICKÝCH MOŽNOSTECH Jestliže najdeme užitečné důkazy o terapeutických možnostech, musíme se rozhodnout, kde začít proces kritického hodnocení. Můžeme začít s hodnocením validity, protože jestliže informace není validní, pak nikoho nezajímá jestli je efekt účinku velký. Můžeme ale také začít s hodnocením klinického významu, protože jestliže důkaz není dostatečně klinicky významný, pak nikoho nezajímá ani jeho validita. V podstatě můžeme začít s jakoukoliv otázkou, ale měli bychom pokračovat pouze dostaneme-li příznivou odpověď. 42.1.1 VALIDITA Abychom posoudili zda jsou výsledky validní, musíme se ptát jestli byla provedena a utajena (tj.že posuzovatelé zdravotního stavu i osoby ve studii nevěděli ve které skupině jsou) randomizace! Není-li k dispozici žádná randomizovaná studie o daném problému, musíme zjišťovat: • zda byl výsledek léčby tak velký a zřejmý, že nepřipouští falešnou pozitivitu (vzácné!) a bylo by neetické randomizovat • zda výsledek léčby byl negativní nebo nebezpečný, tuto situaci můžeme také akceptovat, protože falešně negativní výsledek u nerandomizovaných studií je méně častý než falešně pozitivní (protože léčba je obvykle vysazena u pacientů s nejhorší prognózou a ti ostatní když správně užívají mají lepší prognózu, i když užívají neúčinný lék nebo placebo). V takových situacích je také možno zvážit možnost N=l klinického pokusu tj. podání léku i placeba jednomu pacientovi v náhodném pořadí v krátkém odstupu (1-2 týdny). Dále musíme zjišťovat zda bylo sledování úplné a dostatečně dlouhé? Pokud byly velké ztráty ze sledování na příklad pro to, že pacient má nežádoucí reakce a opustí studii , dojde při vyhodnocení studie k nadhodnocení účinnosti. Musíme se také ptát, jaké jsou přijatelné ztráty ze sledování? Obvykle pokud se ztráty pohybují do 20%, tak se považují za akceptovatelné. Při vyhodnocení však můžeme se ztracenými pacienty počítat a všechny ztracené pacienty hodnotit jako t.zv.„worst case"(tj .kompletně obrácený výsledek než většina co zůstala) a pokud při vyhodnocení je podpořen původní závěr, tak ani ztráty ze sledování neovlivňují výsledek studie). Také zjišťujeme jaká byla délka sledování a zda byla přiměřená povaze problému. Současně je třeba sledovat zda byli všichni pacienti analyzováni ve skupinách podle randomizace? Protože všichni co neužívali zkoušenou léčbu nebo dostali jinou léčbu by měli být analyzováni v původní skupině podle principu „ intention to treat analysis " (podle původního léčebného záměru). Další otázkou je zda byli pacienti i lékaři zaslepeni pokud jde o léčbu? (také aby pacienti s placebem nedostali jinou léčbu). Pokud jde o chirurgické intervence, kde samozřejmě zaslepení operujícího (ošetřujícího) lékaře není možné, může se na vyhodnocení podílet jiný zaslepený klinik, který hodnotí nálezy. V rámci validity je také třeba sledovat, zda byly skupiny stejně léčeny kromě experimentální léčby (tj. případně jinými léky na jiné nemoci) ? A zda byly skupiny stejné na počátku studie? Zejména pokud jde o prognostické znaky - jestliže ne pak zda byla provedena úprava (přizpůsobení-adjustment). 42.1.2 VÝZNAMNOST Posoudit významnost znamená najít klinické vyjádření účinku a pak porovnat s výsledky jiné léčby. Nejprve posuzujeme jaký byl rozsah účinku léčby? Základní údaje o příkladu, který je použit pro vysvětlení jsou obsaženy na tabulce 4: Klinické ukazatele efektivity léčby Tab. 4 CER EER RRR ARR NNT Studie Lancet, 1998 50% 39% 22% 11% 9 Hypotetická situace 0.00050% 0.00039% 22%!!! 0.00011% 909090 „Event rate" = progrese neschopnosti u roztroušené sklerózy za 33 měsíců RRR = (CER-EER)/CER = = (50%-39%)/50% = 22% = (0.00050%-0.00039%)/0.00050% = 22%!!! ARR = (CER-EER) = 50%-39% =11% = 0.00050%-0.00039% = 0.00011% NNT = 1/ARR = 1/11% = 9 = 1/0.00011% = 909090 Ukazatele, používané pří hodnocení léčebného účinku jsou: • „control event rate" CER - frekvence sledovaného následku (v%) v kontrolní skupině • „experimental event rate" EER - frekvence sledovaného následku (v%) v léčené skupině Rozdíl mezi CER a EER může být statisticky významný, ale důležité je i vyjádření klinického dopadu - což bylo až donedávna vyjadřováno pomocí RRR -„relative risk reduction" RRR = (CER-EER)/CER Podobně můžeme účinek vyjádřit obráceně jako: • „relative benefit increase" RBI = (CER-EER)/CER • „relative risk increase" RRI stejným výpočtem - pokud zvyšuje pravděpodobnost špatné události • nevýhodou RRR je, že nezohledňuje CER (tedy bazálni riziko) a proto nerozlišuje velké účinky léčby od malých • „absolute risk reduction" ARR = CER - EER respektuje baseline risk a je smysluplnější • jestliže léčba má dobrý efekt. Pak stejným výpočtem stanovíme „absolute benefit increse" ABI a má-li špatný efekt „absolute risk increase" ARI Absolutní redukce rizika ARR je sice dobrá, ale její hodnoty se někdy hůře pamatují (zejména jsou-li menší než 1.0), na druhé straně její inverzní hodnota je celé číslo a vyjadřuje 712 kolik pacientů potřebujeme léčit zkoušenou léčbou abychom zabránili jednomu špatnému následku - „number needed to treat" NNT = 1/ARR Příklad: naší cilovou poruchou je diastolická hypertenze, intervencí jsou antihypertenzivní léky a chceme předejít úmrtí, cerebrovaskulární příhodě nebo infarktu myokardu. Je-li TK 115-129 mmHg, pak je CER 13%, EER 1.4%, délka sledování 1.5 roku a NNT 3 Je-li TK 90 -109 mmHg, pak je CER 5.5%, EER 4.7%, délka sledování 5.5 roku a NNT 128. Podobně nežádoucí účinky léčby se mohou popsat analogickým způsobem jako: - „number needed to harm" NNH = 1/ARI Abychom rozuměli NNT musíme zvážit další 2 aspekty: - čas sledování - chceme-li porovnat NNT pro různé doby sledování musíme udělat úpravu -adjustment alespoň pro jednu z nich NNThypothetical = NNTobserved x (observed time/ hypothetical time) Na příklad u hypertenze podle výše uvedeného příkladu: NNT1.5 = 128 x (5.5/1.5) = 470 to znamená, že potřebujeme léšit 470 lehkých hypertenzí ale jen 3 těžké po dobu 1.5 roku abychom zabránili 1 vážnému následku. - přesnost odhadu účinku léčby - NNT odhadují skutečný účinek a je třeba specifikovat limity, kde leží skutečný účinek = 95% CI NNT a NNH sami o sobě nezachycují pacientovu individuální pravděpodobnost prospěchu nebo poškození. 42.1.3 POUŽITELNOST Když se zjistilo, že nalezený důkaz je jak validní takvý-znamný, je třeba posoudit, zda je také použitelný pro našeho pacienta. Při tom je třeba spojit důkaz s klinickou zkušeností a odbornou schopností. 1. nejprve se musíme zeptat je-li náš pacient tak odlišný od pacientů ve studii, že nemůžeme výsledky aplikovat? Odlišnost vyhodnotíme tak, že: • posoudíme, zda náš pacient splňuje kritéria pro zařazení do studie, ze které pochází důkaz (u kritérií, která nesplňuje musíme posoudit jejich užitečnost) • většina rozdílů kvantitativních! • věk, riziko vzniku následku, odpověď na léčbu • posoudíme, zda sociodemografické a patobiologické rysy našeho pacienta jsou odlišné (obvykle ne!) 2. dále se ptáme zda je léčba proveditelná v našich podmínkách? • zda je léčba ekonomicky přijatelná pro pacienta nebo zdravotnický systém 3. sledujeme jaký je potenciální prospěch léčby a rizika pro našeho pacienta? • pokud nebude léčen jaký je jeho individuální CER neboli „patient's expected event rate" PEER k tomuto odhadu použijeme RRR (pro účinnost léčby) a RRI (pro nežádoucí reakce) a určíme odpovídající NNT a NNH u našeho specifického pacienta (rychlejší je použít NNT a NNH ze studie). Delší postup via PEER - 4 možné postupy • CER pro našeho pacienta určíme podle celkového CER ze studie (pokud náš pacient představuje průměrného pacienta ze studie) • pokud je ve studii podskupina pacientů podobná našemu pacientovi určíme CER pro našeho pacienta podle této podskupiny (nebo můžeme rovnou použít ARR podskupiny a vytvořit NNT pro našeho pacienta) • jestliže studie obsahuje „clinical prediction guide" (ověřeno v jiné nezávislé studii), použijeme PEER z této studie • vyhledáme jinou studii popisující podobné pacienty - všechny 4 metody nakonec určí PEER pro našeho pacienta tj. co se stane když dostane kontrolní nebo srovnávací intervenci - PEER potom konvertujeme na NNT nebo NNH pro pacienty jako je náš, pomocí odpovídajícího RRR a RRI NNT = 1 / (PEER x RRR) K tomuto výpočtu existuje nomogram, publikovaný v práci Sacketta a spolupracovníků Sackett). Kratší postup s NNT - je jednodušší a rychlejší a proto se nejčastěji používá u lůžka pacienta (jeho délka je odhadována na 7minut) - specifikujeme odhadem riziko vzniku události u našeho pacienta vzhledem k průměrnému pacientovi v kontrolní skupině a vyjádříme desetinnou frakcí „f Výpočet odhadu pro našeho pacienta je pak NNT / f( , který je ukázán na následujícím příkladu: jestliže myslíme, že náš pacient (pokud by nebyl vůbec léčen) má dvojnásobné riziko vzniku následku než pacient v kontrolní skupině, pak f = 2 4. dále sledujeme jaké jsou pacientovy hodnoty a očekávání pokud se týká následku, kterému chceme zabránit, i léčby kterou mu nabízíme? • zjišťujeme pacientovi preference - i pomocí škály Škála pacientových preferencí Obr. 3 I------------------------------1------------------------------1------------------------------1------------------------------1------------------------------1------------------------------1------------------------------1------------------------------1------------------------------1-------------------------------1 0 0,5 1,0 Na obrázku 3 na jednom konci „0" znamená smrt a na druhém konci „1.0" znamená plné zdraví. Pak se ptáme pacienta, aby označil na škále hodnotu pro cílovou poruchu, které chceme léčbou zabránit (v uvedeném příkladě označil pacient progresi roztroušené sklerózy hodnotou 0.05, tedy téměř tak špatnou jako kdyby zemřel). Současně se ho ptáme, aby označil na škále hodnotu pro nežádoucí reakce při léčbě (opět v uvedeném příkladě označil pacient reakce jako velmi mírné hodnotou 0.95). Porovnáním těchto dvou posouzení (0.95/0.05 = 19) dostaneme hodnotu, která ukazuje kolikrát (v daném příkladě 19 krát) je cílová porucha (progrese roztroušené sklerózy) horší než nežádoucí reakce při léčbě. Pravděpodobnost pomoci a poškození LHH (likelihood of help or harm)- spojujeme pacientovy hodnoty s pravděpodobností jejich objevení. Příklad výpočtu LHH (s použitím údajů na tabulce 5): Riziko a prospěch léčení Tab. 5 Následek CER EER RRR ARR NNT Progrese neschopnosti 50% nebo 1/2 39% nebo 1/2.5 22% 11% 1/11 % = 9 Následek CER EER RRR ARR NNT Chřipkové onemocnění nebo lokální reakce 37% nebo 1/2.7 64% nebo 1/1.6 73% 27% 1/27% = 4 713 LHH = (1/NNT) : (1/NNH) = (1/9) : (1/4) = 0.11 : 0.25 Tedy 2 : 1 v neprospěch interferonu. Našemu pacientovi pak bude řečeno: „ jestliže máte podobné potíže jako pacienti ve studii pak je pravděpodobné, že léčba interferonem vás spise dvakrát poškodí než vám prospěje". Jestliže ale vezmeme v úvahu, že náš pacient má trojnásobné riziko progrese nemoci (f=3), vyjádřené desetinnou frakcí, a také jeho hodnocení, že progrese jeho nemoci byla 19 x horší než nežádoucí účinky léčby (severity factor „s"), a riziko vyniku nežádoucích účinků bude stejné jako u pacientů ve studii (f = 1) pak nový a přesnější výpočet LHH je následující: LHH = ((1/NNT) x ft x s) : ((1/NNH) x fh) = a : b = ((1/9) x 3 x 19) : ((1/4) x 1) = 6.3 : 0.25 = 25 : 1 Takže v konečné fázi, s přihlédnutím k pacientovým preferencím a jeho individuálnímu riziku vychází u něho léčba interferonem 25krát prospěšnější než poškozující !!! Nyní je možno se podívat na CAT s příslušnou tématikou, který je uveden na konci této kapitoly. 42.1.4 COMPLIANCE Pacient akceptoval příznivé LHH a začal být léčen ale vše co jsme my i pacient investovali do diagnózy, kritického zhodnocení a individualizace přínosu a rizika léčby může být k ničemu, jestliže pacient nebude dodržovat režim léčby, diety, cvičení apod. • compliance je jedním z hlavních problémů a je v průměru asi 50% se značnou variabilitou u různých pacientů • příčiny non-compliance obvykle nejsou ty co myslíme ... věk, pohlaví, inteligence, vzdělání (ty obvykle nejsou významné) ale dlouhá čekací doba, vysoká cena, dlouhé trvání a komplexnost léčby (tyto faktory obvykle vedou ke ztrátě compliance). Musíme prověřit compliance vždy, když léčba nemá očekávaný účinek (především než zvýšíme dávku nebo přidáme další lék). Musíme pacienta pravidelně sledovat, ptát se zda užívá, případně používat některé objektivní metody průkazu compliance (stanovení hladiny léku nebo metabolitů v tělesných tekutinách). Cílem je pomoci pacientovi zlepšit compliance • krátkodobě .. .přesné instrukce, písemné informace • dlouhodobě .. .komplex kombinace větší pozornosti a dohledu. 42.2 „DŮKAZY" A OBCHODNÍ ZÁJMY FARMACEUTICKÝCH FIREM Nejúčinnější způsob, jak u kliniků dosahovat změn v pre-skripčních zvyklostech , je cestou zástupců farmaceutických firem (ve Spojeném království se jim říká „drug reps" a v Severní Americe „detailers"), kteří cestují pořád dokola s aktovkou plnou „důkazů" na podporu svého zboží. Hnutí medicíny založené na důkazu se v posledních letech od farmaceutického průmyslu hodně naučilo tomu, jak měnit chování lékařů, a nyní používá tytéž promyšlené techniky přesvědčování jednotlivých zdravotnických pracovníků, známé pod anglickým názvem „academie detailing". Než svolíte ke schůzce s farmaceutickým reprezentantem, připomeňte si některá základní pravidla metodologie použí- vané ve výzkumu. Otázkám prospěchu z léčby by se v ideálním případě měly věnovat randomizované kontrolované studie. Ale předběžné otázky ohledně farmakokinetiky (tj. jak se lék chová během své cesty do místa účinku), a zvláště ty, které se týkají biologické dostupnosti, vyžadují přímý pokus s dávkováním léku na zdravých (a, je-li to etické a proveditelné, i na nemocných) dobrovolnících. Běžné (a naštěstí bezvýznamné) nežádoucí lékové reakce mohou být zachyceny, a jejich incidence kvantifikována, v RCT provedených za účelem prokázání účinnosti léku. Ale vzácné (a obvykle vážnější) nežádoucí lékové reakce vyžadují jak farmakovigilanční studie (prospektivní shromažďování údajů o pacientech dostávajících nově registrovaný lék), tak studie případů a kontrol pro stanovení souvislosti s podávaným lekem. V ideálním případě by ke stanovení příčinného vztahu měly být provedeny individuální expoziční testy (kde pacient, který již měl reakci, o níž se myslí, že byla způsobena daným lékem, dostane tento lék znovu za pečlivě kontrolovaných podmínek). Zástupci farmaceutických firem mají dnes již většinou solidní odbornou úroveň ( prodej léků se stal více propracovanou vědou), ale pořád se u nich často zjistí základní neznalost epidemiologických principů a designu klinických studií, zejména když se jim to hodí pro propagaci jejich produktu. Například často předkládají výsledky nekontrolovaných studií s vyjádřením rozdílů před a po měření určitého parametru . Dr. Andrew Herxheimer, který po mnoho let redigoval Drug and Therapeutics Bulletin, udělal přehled „odkazů" citovaných v reklamách na farmaceutické výrobky v předních lékařských časopisech Spojeného království. Zjistil, že velký podíl takových odkazů cituje „údaje z pořadačů" a ještě více jich odkazuje na publikace, které byly farmaceutickým průmyslem přímo napsány, redigovány i publikovány. Někdy (nicméně není to tak vždy) se ukáže, že důkazy z takových zdrojů mají nižší vědeckou kvalitu než ty, které se objevují v nezávislých recenzovaných časopisech. Je zřejmé, že pokud někdo pracuje pro farmaceutickou společnost a učiní větší vědecký objev, pravděpodobně poskytne své nálezy takovým časopisům, jako jsou Lancet nebo New England Journal of Medicine, ještě před jejich publikováním na firemní půdě. Jinými slovy, není třeba „vyhazovat" pojednání o lékových studiích kvůli tomu, kde byla publikována, ale je nutné se hodně zblízka podívat na metody a na statistickou analýzu takových studií. 42.2.1 JAK SE ROZHODOVAT OHLEDNĚ LÉČBY Sackett a kolegové ve své knize Clinical epidemiology - a basic science for clinical medicine tvrdí, že lékař, předtím než naordinuje pacientovi nějaký lék, by měl: • stanovit u tohoto pacienta hlavní smysl léčby (vyléčení, prevence návratu nemoci, omezení funkčního handicapu, prevence pozdních komplikací, psychická úleva, zmírnění nemoci, symptomatická úleva atd.), • vybrat nejvhodnější léčbu s využitím všech dostupných důkazů (to zahrnuje i odpověď na otázku, zdali vůbec pacient potřebuje nějaký lék užívat), • specifikovat léčebný cíl (jak poznat, kdy léčbu ukončit, změnit její intenzitu nebo přejít na nějakou jinou léčbu?). Například při léčbě vysokého krevního tlaku může lékař stanovit, že: • hlavním smyslem léčby je předcházet poškození cílových orgánů, jako jsou mozek, oči, srdce, ledviny atd. (a tak předcházet smrti), 714 • volba specifické léčby spočívá ve výběru mezi různými druhy antihypertenzních léků vybraných na základě ran-domizovaných, placebem kontrolovaných a srovnávacích studií, a rovněž tak mezi nefarmakologickými léčebnými možnostmi, jako je omezení soli, • léčebným cílem může být diastolický krevní tlak ve fázi 5 (na pravé paži vsedě) menší než 90 mmHg nebo tak blízký této hodnotě, jak to jen bude tolerovatelné vzhledem k vedlejším účinkům léčby. Pokud se nepostupuje podle těchto tří kroků (jak tomu často bývá například v péči o terminálne nemocné), může nastat v terapii chaos. V rámci své skryté kritiky náhradních cílových ukazatelů Sackett a jeho tým připomínají, že volba specifické léčby by měla být určována důkazy o tom, co skutečné funguje a ne co vypadá, že funguje, nebo by melo fungovat. „Dnešní léčba," varují na straně 188, „pokud je odvozena od biologických skutečností nebo nekontrolovaných klinických zkušeností, může být zítra jako špatný vtip." Náhradní cílové ukazatele Definice náhradního (nebo též zástupného) cílového ukazatele: „je to proménná, která je pomérné snadno měřitelná a která předpovídá vzácný nebo vzdálený výsledek buď toxického podnétu (například škodliviny v prostředí) nebo léčebného zásahu (například léku, chirurgického výkonu, poskytnuté rady), ale která sama o sobe není přímým měřítkem ani poškození ani klinického prospěchu". Rostoucí záliba v náhradních cílových ukazatelích v lékařském výzkumu odráží dvě důležité stránky jejich použití. • Mohou značně snížit velikost vzorku, trvání studie, a tak snížit vynaložené náklady . • Mohou umožnit, aby byla léčba zhodnocena v situacích, kdy použití primárních ukazatelů by bylo příliš invazívní nebo neetické. Při vyhodnocování farmaceutických výrobků běžně používané náhradní cílové ukazatele zahrnují: • farmakokinetická měření (například křivky časového průběhu koncentrací léku nebo jeho aktivního metabolitu v krevním řečišti), • in vitro (tj. laboratorní) parametry jako je střední inhibiční koncentrace (MIC) antimikrobiální látky změřená na bakteriální kultuře na agaru, • makroskopický vzhled tkání (například žaludeční eroze viděné při endoskopii), • změna v hladinách (údajných) „biologických ukazatelů nemoci" (například mikroaibuminurie u diabetické nefro-patie), • radiologický vzhled (například stín na skiagramu hrudníku). Náhradní cílové ukazatele mají řadu nevýhod: - změna hodnoty náhradního cílového ukazatele sama o sobě neodpovídá na základní předběžnou otázku „Jaký je smysl nebo cíl léčby u tohoto pacienta?" a „Jaká je, podle platných a spolehlivých výzkumných studií, nejlepší dostupná léčba tohoto stavu?" - náhradní cílový ukazatel nemusí těsně odrážet léčebný cíl; jinými slovy, nemusí být platný či spolehlivý - použití náhradního cílového ukazatele má stejná omezení jako použití jakéhokoli jiného jednotlivého parametru úspěchu nebo selhání léčby - přehlíží všechny další parametry! Nadměrné spoléhání se na jediný náhradní cílový ukazatel jako na měřítko léčebného úspěchu obvykle odráží úzký klinický rozhled a přehnanou důvěřivost - náhradní cílové ukazatele často vznikají na zvířecích modelech nemoci, jelikož změny hodnoty specifické proměnné lze měřit za kontrolovaných podmínek u dobře definované populace. Avšak vyvozování závěrů podle těchto nálezů u lidských onemocnění je spojeno s rizikem, že nebudou platné protože: • Ve studiích na zvířatech má studovaná populace zcela jednotné biologické vlastnosti a může být geneticky in-brední. • Studovaná tkáň i nemoc se mohou lišit v důležitých rysech (například ve vnímavosti vůči patogenu, v rychlosti buněčného dělení) od obdobného stavu u lidských subjektů. • Zvířata se chovají v kontrolovaném prostředí, což minimalizuje vliv proměnných způsobu života (například stravy, cvičení, stresu) a průvodní medikace. • Podávání vysokých dávek chemických látek experimentálním zvířatům může pozměnit obvyklé metabolické dráhy a tak dát zavádějící výsledky. Živočišné druhy, které jsou nejvhodnější k takovým studiím , se liší od lidi vzhledem k různých chemickým látkám. Ideální vlastnosti náhradního cílového ukazatele jsou ukázány v následujícím přehledu: • Náhradní cílový ukazatel by měl být spolehlivý, reprodu-kovatelný, klinicky dostupný, snadno kvantifikovatelný, cenově dostupný a měl by vykazovat efekt „dávka-úči-nek" (to znamená, čím vyšší hladina náhradního cílového ukazatele, tím větší pravděpodobnost nemoci). • Měl by být skutečným prediktorem (tj. parametrem s predpovední hodnotou) nemoci (nebo rizika vzniku nemoci) a ne pouze vyjadřovat expozici nějaké spoluproměnné. Vztah mezi náhradním cílovým ukazatelem a nemocí by měl mít biologicky možné a přijatelné vysvětlení. • Měl by být senzitivní - to znamená, že „pozitivní" výsledek náhradního cílového ukazatele by měl zachytit všechny pacienty nebo většinu pacientů se zvýšeným rizikem nepříznivého stavu. • Měl by být specifický - to znamená, že „negativní" výsledek by měl vyloučit všechny pacienty nebo většinu pacientů bez zvýšeného rizika nepříznivého stavu. • Měl by existovat přesný hraniční bod mezi normálními a abnormálními hodnotami. • Měl by mít přijatelnou pozitivní prediktivní hodnotu - to je, že „pozitivní" výsledek by měl vždy nebo obvykle znamenat, že takový pacient má zvýšené riziko nepříznivého stavu • Měl by mít přijatelnou negativní prediktivní hodnotu - to je, že „negativní" výsledek by měl vždy nebo obvykle znamenat, že takový pacient nemá zvýšené riziko nepříznivého stavu • Měl by podléhat řízení jakosti. • Změny v hodnotě náhradního cílového ukazatele by měly rychle a správně odrážet odpověď na léčbu - zvláště jeho hladina by se měla normalizovat při remisi nebo vyléčení. Dobrým příkladem parametru, který splňuje většinu z těchto kritérií, ne-li všechna je mikroalbuminurie u diabetické nefropatie. Pokud farmaceutický reprezentant, který se vás pokouší přesvědčit o hodnotě nabízeného léku, není schopen zdůvodnit oprávněnost použitých cílových ukazatelů, měli byste jej vyzvat, aby poskytl ještě nějaký další důkaz. Jedním důležitým příkladem neplatného použití náhradního cílového ukazatele je počet CD4 buněk při sledová- 715 ní progrese v AIDS u HIV pozitivních subjektů. Studie CONCORDE byla RCT porovnávající časné a pozdní zahájení léčby zidovudinem u pacientů, kteří byli HIV pozitivní, ale klinicky asymptomatičtí. Předchozí studie ukázaly, že časné zahájení léčby vede k pomalejšímu poklesu počtu CD4 buněk (proměnná, u které bylo ukázáno, že klesá s progresí AIDS), a předpokládalo se, že vyšší počet CD4 buněk bude odrážet zlepšení šancí na přežití. Avšak studie CONCORDE ukázala, že zatímco počet CD4 buněk klesá pomaleji v léčebné skupině, tříleté přežití bylo v obou skupinách stejné. Tato zkušenost potvrdila varování, vyslovené již dříve autory, kteří měli podezření na neplatnost tohoto cílového ukazatele. Následný výzkum na tomto poli se pokusil určit náhradní cílový ukazatel, který je v korelaci se skutečným léčebným prospěchem, tzn. zpomalením progrese asymptomatické HIV infekce v klinický AIDS a dobou přežití od vzniku AIDS. Nedávný přehled shrnuje celý tento příběh a uzavírá, že kombinace několika parametrů (včetně procentuálního zastoupení CD4 C29 buněk, stupeň únavy, věk a hladinu hemoglobinu) předpovídá progresi mnohem lépe než počet CD4 buněk. Existuje celá řada dalších příkladů o používání nesprávných cílových ukazatelů jako na příklad komorové předčasné stahy k předpovědi smrti na vážnou poruchu srdečního rytmu, hladina antibiotik v krvi k předpovědi klinického vyléčení infekce, plaky na MRI (magnetická resonance) k vyjádření progrese roztroušené sklerózy a měření prosta-tického specifického antigénu (PSA) ke zhodnocení odpovědi na léčbu u karcinomu prostaty. Klinici jsou v rostoucí míře skeptičtí vůči argumentům ve prospěch používaní nových léků nebo starých léků v nových indikacích, které není zdůvodněno přímými důkazy o účinnosti. Předtím, než je možno náhradní cílové ukazatele použít při propagaci farmaceutických výrobků, musí průmysl zdůvodnit užitečnost těchto parametrů ukázáním přijatelného a pevného spojení mezi cílovým ukazatelem a vývojem nebo progresí nemoci. Nebylo by správné předpokládat, že farmaceutický průmysl vyvíjí náhradní cílové ukazatele s úmyslem klamat registrační autority a zdravotnické pracovníky. Důvody pro náhradní cílové ukazatele jsou především etické i ekonomické. Avšak průmysl má silný zájem na přehánění svých argumentů o síle těchto cílových ukazatelů. Jak získat důkazy od farmaceutického reprezentanta Každému lékaři, který se někdy setkal s reprezentantem prodávajícím nesteroidní antiflogistikum, je znám příklad žaludeční eroze. Otázka, kterou je třeba mu položit, není „Jaká je incidence žaludečních erozí u vašeho léku?", ale , Jaká je incidence možného život ohrožujícího krvácení ze žaludku?". Osvědčené principy setkání s farmaceutickým reprezentantem, včetně otázek, kteří by mu měly být položeny, jsou reprodukované z článku v Drug and Therapeutics Bulletin a z dalších zdrojů: 1. Mějte schůzku s reprezentanty vždy předem domluvenu. Vyberte si k návštěvě jen ty, jejichž výrobek vás zajímá, a omezte rozhovor na tento produkt. 2. Ujměte se vedení rozhovoru. Neposlouchejte naučené prodejní fráze, ale přímo se ptejte na žádoucí informace. 3. Požadujte nezávislé publikované důkazy z významných, odborníky recenzovaných časopisů. 4. Nekoukejte se na propagační brožury, které často obsahují nepublikovaný materiál, zavádějící grafy a vybrané citáty. 5. Nevšímejte si „důkazů" v podobě „vyprávění příběhu", jako že nějaký význačný lékař onen výrobek předepisuje. 6. Ptejte se po důkazech ve čtyřech specifických oblastech. • Bezpečnost - tj. pravděpodobnost dlouhodobých nebo vážných vedlejších účinků způsobených lékem (pamatujte, že vzácné, ale závažné nežádoucí reakce mohou být špatně dokumentovány). • Snášenlivost, která se nejlépe zjistí porovnáním sloučených procentuálních podílů pacientů, kteří museli ukončit léčbu, a to mezi daným lékem a jeho nejvýznamnějším konkurentem. • Účinnost, jejímž nejdůležitějším rozměrem je, jak výrobek vychází ve srovnání s lékem oblíbeným u vás v současné době. • Cena, která by měla brát v úvahu nepřímé i přímé náklady. 7. Posuzujte důkazy přísně a věnujte pozornost statistické síle (velikost vzorku) a metodologické kvalitě klinických studií a použití náhradních cílových ukazatelů. Nepřijímejte teoretické argumenty ve prospěch daného léku (například „delší poločas") bez přímého důkazu, že se to přenáší do klinického prospěchu. 8. Nepřijímejte to, že je výrobek nový, jako argument pro to, abyste na něj přešli. Často jsou dobré vědecké argumenty pro pravý opak. 9. Odmítněte vyzkoušet výrobek přijetím startovacího baleni nebo účastí na malé, nekontrolované „výzkumné" studii. 10. Zaznamenejte si obsah rozhovoru a vraťte se k těmto poznámkám tehdy, bude-li reprezentant žádat o další návštěvu. 42.2.2 CAT - ROZTROUŠENÁ SKLERÓZA ...INTERFERON ODDALUJE PROGRESI ONEMOCNĚNÍ Klinický řádek: roztroušená skleróza...interferon beta-lb redukuje progresi sekundární progresivní RS Citace: European study group on interferon betalb in secondary progresive MS. Placebo-controlled multicentre randomized trial of interferon betalb in treatment of secondary progressive multiple sclerosis. Lancet 1998; 352; 1491-7 Klinická otázka (složená ze 3 částí): Oddálí interferon progresi neschopnosti u pacientů se sekundární progresivní RS? Vyhledávací termíny: „interferon" a „roztroušená skleróza" v MEDLINE Studie: Dvojitě zaslepený randomizovaný kontrolovaný pokus s analýzou „intention to treat" Pacienti ve studii - klinicky nebo laboratorně potvrzené případy RS se sekundární progresí (období zhoršení, nezávislých relapsů, trvající nejméně 6 měsíců, následované obdobím návratné-remitující RS), ve věku 18-55 let se základním Kurtzke Expanded Disability skoré (EDSS) 3-6,5 a s nejméně 2 relapsy nebo zvýšením EDSS o 1 bod v předchozích 2 letech. Pacienti byli vyloučeni ze studie, jestliže v nedávné době užívali imunosupresiva nebo imunomodulancia. Steroidy mohly být užívány při relapsů. Kontrolní skupina: (n=358, 358 analyzovaných) standardní léčba a injekce placeba SQ Experimentální skupina: (n=360, 360 analyzovaných) 4mil. IU interferon SQ ob den po 2 týdny a pak 8 mil IU ob den 716 Důkaz: Následek Doba do vzniku CER EER RRR ARR NNT Progrese neschopnosti 33 měsíců 0.498 0.389 22% 0.109 9 95 % CI 7 - 36 % 0.037 - 0.181 6-27 Pacienti na kolečkové židli 33 měsíců 0.246 0.167 32% 0.079 13 95% CI 8 - 56 % 0.020 - 0.138 7-50 Event rate = progrese neschopnosti po 33 měsících Control event rate (placebo) CER Exper. event rate (interferon) EER Relative risk reduction RRR Absolute risk reduction ARR Number needed to treat NNT Komentář 1. Hodnocení EDDS bylo prováděno různými lékaři 2. Lékaři byli školeni v používání EDD S3. Interferon měl vedlejší účinky jako lokální reakce v místě vpichu s NNH 4 4. Více pacientů ve skupině placebo dostávalo steroidy 5. Toto je první studie, která prokázala účinnost léčby interferonem u pacientů se sekundární progresivní roztroušenou sklerózou. Protože některé další studie ještě nejsou ukončeny, je třeba tento CAT aktualizovat každých 6 měsíců. Hodnotil: SE Straus Aktualizovat: v roce 20004 717 43 RIZIKO POŠKOZENI 43.1 ZHODNOCENI RIZIKA POŠKOZENÍ Často se musíme vyjádřit zda intervence nebo agens zevního prostředí může poškodit našeho pacienta, tedy zda jsou v eti-ologickém vztahu k určitému následku. • abychom odpověděli správně na otázku týkající se poškození, musíme zhodnotit důkaz o kauzalitě a to jeho validitu, význam a přímý vztah k našemu pacientovi(pou-žitelnost) • validita důkazu je klíčová pro vyloučení falešně pozitivních nebo falešně negativních závěrů, že agens (lék atd.) je příčinou nežádoucích (poškozujících) reakcí • často ani kliničtí farmakologové nerozhodnou zda nežádoucí reakce je skutečně v důsledku léčby 43.1.1 VALIDITA Odpovídá na otázku zda jsou výsledky studie o poškození/ etiologii validní? • validita je ohrožena různě u různých typů studií • systematické přehledy relevantních studií jsou nejvyšším typem důkazu - proto mají prioritu při pátrání po důkazu • individuální randomizované studie jsou obvykle rozsahem malé , aby mohly s přesností detegovat vzácnou nežádoucí reakci • validitu můžeme tedy nejlépe posoudit pomocí systematických přehledů, které zahrnují většinou dostatečný počet subjektů pro zhodnocení frekvence případných nežádoucích - poškozujících reakcí Při hodnocení nalezené publikace se zaměřujeme na následující otázky: 1. hodnotíme zda byly použity skupiny stejné s výjimkou expozice léčbě nebo jiné příčině? Příkladem může být systematický přehled nebo randomi-zovaná studie kde pacienti s hypertenzí byli rozděleni do skupiny léčené antagonisty Ca nebo jinou léčbou (placebem) Otázka: má pacient, který užívá antagonisty calcia vyšší riziko vzniku karcinomu? Nalezená studie shromáždila osoby ve věku 71 let a starší ze tří regionů USA, které byly nebo nebyly léčeny antagonisty calcia. Tato kohorta byla heterogenní protože řada osob měla také diabetes, kardiovaskulární nemoci a časté hospitalizace. V tomto příkladu není však design randomizované studie pro tyto účely vhodný (důvody velikosti, trvání i etické). Proto první vhodnou alternativou je kohortova studie . V literatuře byla nalezena kohortova studie na toto téma (Lancet 1996; 348: 493-7). Protože však léčba je účelově aplikována pacientům s nemocí (hypertenzí) mohou se v ko-hortové - nerandomizované studii exponovaní pacienti lišit od neexponovaných ve významných determinantách, které pak mohou ovlivňovat vznik následku (působení 3. zavádějícího faktoru). Je-li následek vzácný, nebo má dlouhou dobu latence, i rozsáhlá kohortova studie nemusí být proveditelná - potom je na řadě studie případů a kontrol, která má však ještě větší riziko působení zavádějících faktorů. 2. hodnotíme zda byla expozice (léčba) i následek měřeny stejně v obou skupinách? Dále zjišťujeme, zda bylo vyhodnocení následku zaslepené? To znamená, jestli se nepátralo usilovněji po nádorech ve skupině s antagonisty calcia a obráceně pacienti s následkem si lépe vzpomínají na expozici - proto je lépe když je studie zaslepená! 3. hodnotíme zda bylo sledování dostatečně dlouhé (vzhledem ke vzniku následku) a úplné? - je-li sledování krátkodobé, nemůžeme vyloučit falešnou negativitu v uvedené studii bylo sledování v průměru 3.7 roku a bylo zjištěno 47nádorových onemocnění z 1549 oso-boroků u užívajících antagonisty calcia - obdobně jsou-li velké ztráty ze sledování (>20%), výsledky jsou problematické 4. hodnotíme zda splňují výsledky studie některé dg testy kauzality? • expozice předchází následek - ve studii všichni s nádorem na začátku vyloučeni ze studie • vztah dávka a účinek - ve studii byl pozorován • vysazení a znovupodání léku - nežádoucí reakce se zmenší nebo vymizí a opět se objeví • konzistence vztahu ve více studiích - byly nalezeny studie z nichž některé prokazovaly úmrtí po tomto léčivu • je vztah biologicky plausibilní -interference s apoptózou jako možný mechanismus 43.1.2 VÝZNAMNOST Studie zda užívání antagonistů kalcia způsobuje rakovinu Tab. 6 (Lancet 1996; 348: 493-7) expozice léčbě (antagonisté kalcia) ano (RCT nebo kohortova) nežádoucí následek léřby nádor přítomný nepřítomný a b a + b ne (RCT nebo kohortova) c + d Celkem a + c b + d Jestliže nalezená studie neodpověděla uspokojivě na předchozí otázky, je lépe hledat další. Jestliže ano, pak je třeba prokázat zda je asociace mezi expozicí a následkem dostatečně silná. 1. jaký je rozsah a přesnost asociace mezi expozicí a následkem? různé designy studie vyžadují různé metody posouzení: randomizované a kohortové studie - relativní riziko (RR) studie případů a kontrol - odds ratio (OR) Jak velké by mělo být působivé RR nebo OR? >4 u studií případů a kontrol a u mírných nežádoucích reakcí a klesající se závažností nežádoucího účinku >3 u kohortových studií, protože je zde menší riziko působení bias (ve studii užívání antagonistů calcia jako možné příčiny vzniku nádorů bylo 1.4 - tedy nepříliš působivé). 718 Analýza senzitivity může ukázat jak je RR nebo OR závislé na zavádějících faktorech • vypočítáme neupravované RR a potom upravené vzhledem alespoň k jednomu • zavádějícímu činiteli • pokud zůstane stabilní, pak je spolehlivost asociace větší • pokud je významný pokles pak je asociace podezřelá v analyzované studii naopak RR vzrůstalo z 1.4 na 1.7 po úpravě, to znamená, že zavádějící faktory neovlivňovaly vznik nádorů v souvislosti s léčbou antagonisty calcia Kromě rozsahu je třeba sledovat také přesnost asociace. • Ta je ošetřena pomocí intervalů spolehlivosti (CI) • (ve studii byl okolo RR 1.4 CI 1.27 - 2.34 = dobrý výsledek, protože CI je úzký a nezahrnuje hodnotu 1.0). Sílu asociace (RR nebo OR) můžeme přeložit i do jiného ukazatele, srozumitelného pacientovi i lékaři - NNH .. .počet pacientů, kteří musí být exponováni domnělému kauzálnímu agens, aby vznikl 1 další poškozující následek. Výpočet u kohortové nebo randomizované studie bude následující: AR (atributivní riziko) = a/(a+b) - c/(c+d) Ve studii případů a kontrol je to složitější: 1-(PEER x (1-OR)) / (1 - PEER) x PEER x (1-OR), kde PEER je nežádoucí účinek u neexponováných. NNHs, vypočítané z typických PEER a OR jsou uvedeny na tabulce 7a a 7b. NNH odvozené z typických PEER a OR Tab. 7a 0.05 0.10 0.20 0.8 Pro OR < 1 0.4 0.3 0.9 0.7 0.6 0.5 209 104 69 52 41 34 29 110 54 36 27 21 18 15 61 30 20 14 11 10 8 0.30 PEER 0.40 0.50 0.70 46 22 14 10 8 7 5 40 19 12 9 7 6 4 38 18 11 8 6 5 4 44 20 13 9 6 5 4 0.90 101 46 27 18 12 9 4 PEER = personal expected event rate OR = odds ratio NNH odvozené z typických PEER a OR Tab. 7b Pro OR > 1 2.25 16 1.1 1.25 1.5 1.75 2 0.05 0.10 0.20 0.30 PEER 0.40 0.50 0.70 212 86 44 30 23 18 113 46 24 16 13 10 9 64 27 14 10 8 7 6 50 21 11 8 7 6 5 44 19 10 8 6 5 5 42 18 10 8 6 6 5 51 23 13 10 9 8 7 0.90 121 55 33 25 22 19 18 Jak je vidět z tabulky, pro stejné OR mohou být různé hodnoty NNH, v závislosti na PEER. Proto je velmi důležité správně odhadnout PEER pro našeho pacienta, na němž pak závisí velikost rizika poškození. Na příklad je li OR 0.9 a PEER 0.005 pak NNH bude 2000. Ale je-li PEER ve stejném případě 0.4, pak NNH bude 40. 43.1.3 POUŽITELNOST Musíme se zajímat zda může být tento validní a významný důkaz o možném poškození aplikován na našeho pacienta? 1. je náš pacient tak jiný než pacienti ve studii že výsledek nemůžeme použít? • nejedná se o to zda náš pacient splňuje kritéria pro zařazení jako pacienti ve studii, ale jestli je natolik rozdílný od pacientů ve studii, že výsledky studie na něho nemohou být aplikovány. 2. jaké je riziko vzniku nežádoucího následku u našeho pacienta? • odhad může být proveden podle rizika neexponova-ných v naší studii pomocí desetinné frakce „f" • jestliže náš pacient je v polovičním riziku než pacienti ve studii f = 0.5 (NNH ve studii=116, f=0.5, pak 116/0.5=232) • jestliže náš pacient má dvojnásobné riziko než pacienti ve studii pak f=2 (NNH ve studii=116, f=2,0, pak 116/2=58) 3. jaké jsou pacientovi preference, starosti a očekávání od léčby? • pacient může kvantifikovat své hodnoty pro přínos léčby i poškození v důsledku léčby. A výsledkem je potom opět LHH (likelihood of help or harm - pravděpodobnost prospěchu nebo poškození) 4. jaká alternativní léčba je k dispozici? Zvažujeme také možnosti alternativní léčby, tj. použití jiného léčebného připravku.V daném příkladu je mnoho alternativních způsobů léčby hypertenze. Závěrem této části je třeba zdůraznit, že vždy je třeba zvažovat jestli léčba (i ntervence) pacientovi spíše pomůže než uškodí. Tématika, uvedená v příkladu, je zpracována na následujícím CAT: 43.1.4 cat hypertenze - blokátory calciového kanálu mohou být příčinnou vzniku nádorů Klinický řádek: do doby než se situace vyjasní je lépe léčit pacienta jinými alternativními antihypertenzními léky Jestliže výsledek studie je pravdivý, pak NNH pro vznik jednoho nádoru je 116 při 3.7 letech užívání blokátorů kalciového kanálu Citace: Pahor M. Et al: Calcium-channel blockade and incidence of cancer in aged populations, Lancet 1996; 348: 493-7 Klinická otázka: Jsou pacienti užívající antagonisty kalcia pro hypertenzi ve zvýšeném riziku vzniku nádorového onemocnění? Vyhledávací termíny: „antagonsti kalcia" a „nádory" v MEDLINE Studie: Náhodný vzorek osob (muži i ženy) 65 let a starších (>80% response rate) ve 3 regionech USA byl vyšetřen takto: 90 minut interview, změřen krevní tlak a váha a výška. Osoby 719 s nádory byly vyloučeny ze studie a zbývající osoby byly sledovány v průměru 3.7 let pomocí interview, informací z případné hospitalizace a pomocí nádorového registru na vznik eventuelního nádoru. Důkaz: Exponovaní měli incidenci nádorů v 3.03% Neexponovaní měli incidenci nádorů v 2.17% RR = 3.03/2.17 = 1.4 (P=0.032), po úpravě pro potenciální zavádějící faktory se RR Zvýšilo na 1.7 (P=0.0005) !!! Komentář: 1. Jedinci léčení antagonisty kalcia mají častěji diabetes, kardiovaskulární nemoci a hospitalizace, ale po úpravě vzhledem k těmto možným zavádějícím faktorům RR se naopak ještě zvýšilo, takže výsledek neovlivňovaly. 2. Nebyl zjištěn vztah dávky účinku. 3. Nebyl zjištěn významný rozdíl podle typu léku. 4. Celkem 47 nádorů u léčených a to nádory různých lokalizací a typů. 5. Možný mechanismus vzniku nádoru: interference s apop-totickou destrukcí nádorové buňky. 6. Ostatní studie u těchto léků vyzněly nepřesvědčivě a autorům této studie bylo vyhrožováno smrtí!!! Hodnotil: Sackett 1996, platnost do 2001 720 44 PROGNÓZA 44.1 PROGNÓZA Na prognózu se ptá pacient a zvažuje ji lékař, zda někdy vůbec pacienta léčit (starší muž s chronickou lymfatickou leukémií, který se cítídobře - bude jeho prognóza významně změněna jestliže bude bez léčby do projevení se příznaků?). • tyto otázky mají 3 aspekty: - kvalitativní - co se může stát - kvantitativní - jaká je pravděpodobnost, že se něco stane - časový - za jak dlouho • úkolem je najít nejlepší důkaz pro vyslovení prognózy a zhodnotit validitu, význam a použitelnost 44.1.1 VALIDITA Při posuzování validity je třeba se ptát: • zda byl vybrán definovaný, reprezentativní vzorek pacientů ve stejné (obvykle v první časné fázi klinické manifestace) fázi nemoci? (inception cohort), výjimkou je situace, kdy chceme sledovat prognózu pozdních stádií nemoci • zda bylo sledování pacientů úplné a dostatečně dlouhé? .. .ztráty ze sledování - důvody (změna bydliště atd. ale i úmrtí, zhoršení nemoci!!). Ideálně by měli být pacienti sledováni tak dlouho dokud se buď úplně neuzdraví, nebo se u nich neobjeví jiný sledovaný následek nemoci. Jestliže je sledování jen po krátkou dobu a objeví se jen několik nežádoucích následků, nemůžeme pacienta příliš ujistit o jeho budoucnosti. Jestliže je sledování dostatečně dlouhé, pak můžeme vyslovit věrohodnou prognózu. Ale i tehdy, jestliže bylo sledování dostatečně dlouhé, musíme se zajímat co se stalo s pacienty, kteří ze studie odstoupili, ať už z jakýchkoliv důvodů. Některé ztráty jsou nezbytné a obvykle nejsou ve vtahu k prognóze jako na příklad změna místa vzhledem k zaměstnání nebo bydlení. Ale ostatní „ztráty" (úmrtí, zhoršení nemoci, které znemožňuje sledování, ztáta samostatnosti a přesun k rodině atd.), pokud není dokumentována možnost vzniku sledovaného následku, podstatně sníží validitu studie. • jak veliké jsou ztráty osob ze sledování? Jsou-li ztráty <5% = malý bias, >20%=závažně ohrožuje validitu (scénář worst case a best case =sensitivity analysis - co jestli...?) příklad: prognostická studie, 100 pacientů, 4 úmrtí a 16 ztrát ze sledování - smrtnost 4 z 84 =4.8% - co ztracených 16? někteří nebo všichni mohli také zemřít - .. .scénář „worst case"20 ze 100=20% .. .scénář „best case" 4 ze 100 = 4% Validita studie je spíše problematická, protože „nejhorší varianta" vykazuje veliký rozdíl od dosaženého výsledku. • dále je třeba sledovat zda byla použita objektivní kritéria pro stanovení následku a v zaslepené podobě? extrémy následku = = úmrtí (lehce zjistitelné) ale příčina úmrtí je problém = úplná úzdrava Obě tyto extrémní situace je možno poměrně lehce zjistit. V rozmezí těchto extrémů je široká škála následků (pracovní schopnost, reziduálni bolest atd., kde pokud je slepé hodnocení, tak významně zvyšuje validitu). • také je třeba se zajímat pokud byly podskupiny s různou prognózou, zda byla provedena úprava (strati- fikací apod.) pro významné rizikové faktory a validace v nezávislé skupině („test set") pacientů? Prognostické faktory: • ..demografické- věk, pohlaví, socioekonom. stav • ..specifické pro nemoc - rozsah, hodnota testu určující abnormalitu • ..komorbidita- jiné poruchy Počáteční skupina pacientů, kde se prognostický faktor uplatnil se obvykle nazývá training set (derivation set) Následná skupina je pak obvykle nazývána test set (validation set). Jestliže také potvrdí dosažené výsledky (prediktivní hodnotu prognostického faktoru), pak je možno situaci považovat za prokázanou a přistoupit eventuelně k napsání klinických prognostických doporučení (clinical prediction guide CPG). 44.1.2 VÝZNAMNOST • posuzujeme jaká je pravděpodobnost vzniku následku v čase a to je obvykle vyjádřeno třemi způsoby: ... % přežití v určitém čase (1 rok, 5 let) - survival rates ... medián přežití (délka sledování ve které 50% pacientů zemřelo) ... křivka přežití kde v čase je proporce (%) těch kteří dosud nezemřeli Prognóza na křivkách přežití 100- 50 Obr. 4 čas sledování v měsících 721 Na obrázku 4 jsou naznačeny 4 situace: A = žádný pacient neměl následek na konci studie, tj. buď je prognóza velmi dobrá, nebo byla studie příiš krátká. B,C,D = všechny tyto 3 situace ukazují, že nemoc je vážná a pouze 20% pacientů přežívá 1 rok - v tomto smyslu je možno informovat rodinu pacienta. Ale tvar křivek je různý, takže medián přežití (tj. čas ve kterém 50% osob zemře) je 9 měsíců pro nemoc v případě C, ale jen 3 měsíce pro nemoc v případě B. Tvar čáry přežití je souvisle klesající v případě D. Protože 1 roční přežívání, medián přežití a křivky přežití nás informují o jiných aspektech, je pro úplný obraz nejlépe použít všechny tři způsoby. • jak přesný je odhad prognózy? Jaký je vliv náhodné chyby protože studie jsou prováděny vždy jen na vzorku pacientů. Konvenčně je to vyjádřeno intervalem spolehlivosti. 44.1.3 POUŽITELNOST Při úvaze o použitelnosti výsledků prognostické studie si klademe následující otázky: • byli pacienti ve studii podobní mým pacientům? Zvažujeme zejména demografické a klinické charakteristiky (jak podobní = dostatečně podobní ?!) • otázku je možno položit i obráceně: byli pacienti ve studii tak rozdílní, že nelze výsledky aplikovat? Pokud je odpověď ne, pak můžeme výsledky studie použít. • bude mít tento důkaz klinicky významný dopad na naše závěry co nabídnout nebo říci našim pacientům? Někdy vzniká otázka jestli neléčit vůbec nebo léčit ... není-li odpověď na tuto otázku, pak by měla být poskytnuta alespoň informace pro pacienta a jeho rodinu co mohou očekávat. 722 45 SYSTEMATICKÉ PŘEHLEDY Systematický přehled je shrnutí lékařské literatury, používající jednoznačných metod k systematickému výběru, kritickému zhodnocení a syntéze světové literatury na daný problém. Účelem je minimalizovat bias (nejenom zaměřením na randomizované studie) a náhodnou chybu (shromážděním velkého množství jedinců). Kdy je nějaký přehled systematický? Pokud byste měli napsat pojednání o nějakém problému a šli do knihovny, kde byste listovali rejstříky knih a časopisů a pokud byste připadli na odstavec, který vypadá důležitý, okopírovali byste jej, a pokud byste našli něco, co by nesedělo k vaší teorii, kterou předpokládáte, nechali byste to tam. Toto, více nebo méně, tvoří metodologii tzv. novinářského přehledu - tedy převedeno na problematiku EBM, přehledu primárních studií, které nebyly identifikovány a analyzovány systematicky (tj. standardizované a objektivně). Novináři dostávají zaplaceno spíše podle toho, kolik toho napíší, než kolik toho přečtou nebo jak kriticky to zpracují, což vysvětluje, proč většina z „nových vědeckých objevů", o kterých se dnes čte v novinách, bude pravděpodobně zpochybněna ještě před koncem měsíce. Naproti tomu, systematický přehled je přehled primárních studií, který: • obsahuje údaje o cílech a účelu přehledu, materiálech a metodách, • byl proveden podle jasné a reprodukovatelné metodologie . Nejtrvalejší a nejužitečnější systematické přehledy, zvláště ty provedené Cochrane Collaboration , jsou pravidelně aktualizovány, aby do nich mohly být začleněny nové důkazy. Mnoho, ne-li většina lékařských přehledných článků je stále psáno novinářskou formou. Profesor Paul Knipschild, ve vynikající knize Iaina Chalmerse a Douga Altmana Systematic reviews, popisuje, jak nositel Nobelovy ceny, biochemik Linus Pauling, používal vybrané citáty z lékařské literatury, aby „prokázal" svou teorii, že vitamin C pomáhá déle žít a cítit se lépe. Když Knipschild a jeho kolegové systematicky prohledali literaturu ohledně důkazů pro tuto hypotézu a proti ní, zjistili, že ačkoli jedna nebo dvě studie silně nasvědčovaly tomu, že by vitamin C mohl předcházet vzniku nachlazení, je mnohem více studií, které neukázaly žádný prospěšný účinek. Linus Pauling pravděpodobně nechtěl záměrně klamat své čtenáře, ale jelikož jeho nadšení pro jeho věc převážilo jeho vědeckou objektivitu, nebyl si vědom systematické chyby výběru (selection bias), ovlivňující jeho volbu publikací. Kdybychom se i my snažili o to, co dělal Pauling - tj. pátrali v lékařské literatuře po důkazech na podporu naší zamilované teorie - dělali bychom stejně nestandardní a nevědeckou práci. Vadný sekundární výzkum, jehož příkladem je novinářský přehled, je stejně vědecky nebezpečný jako vadný primární výzkum. Bylo prokázáno, že experti, kteří jsou léta ponořeni v nějakém oboru a vědí, jaká „by měla" být odpověď na nějakou otázku, jsou významně méně schopni vytvořit objektivní přehled literatury z jejich oboru, než ti, kdo v jejich oboru experty nejsou. Kdyby bylo možno se spolehnout na to, že názory expertů se shodují s výsledky nezávislých systematických přehledů, tak by to nemělo žádné důsledky, ale to bohužel není možné . Tyto odsuzované studie jsou stále široce citovány lidmi, kteří by rádi nahradili všechny experty v nějakém oboru (jako jsou kardiologové) experty na vyhledávání a posuzování (lidmi, kteří se specializují na vyhledávání a kritizování publikací v kterémkoli oboru). Ale nikdo z nich v posledních letech posuzována zjištění nezopakoval. Jinými slovy, snad bychom měli důvěřovat současným odborníkům v tom, že mají sklon více zakládat svá doporučení na důkladném vyhodnocování důkazů! Ale obecné pravidlo je, že pokud se chystáte pověřit někoho vyhledáním nejlepších objektivních důkazů o prospěchu antikoagulancií u fibrilace síní, měli byste požádat někoho, kdo je expertem na systematické přehledy, aby pracoval po boku experta na fibrilaci síní. Abychom byli poctiví vůči Linusu Paulingovi, on se skutečně zmínil o řadě studií, jejichž výsledky byly vážnou výzvou jeho teorii, že vitamin C zabraňuje nachlazení, ale popsal všechny takové studie jako „metodologicky vadné". Jak nám připomíná Knipschild, takové byly i mnohé ze studií, které Pauling zahrnul do své analýzy, ale protože jejich výsledky souhlasily s jeho teorií, byl Pauling, možná podvědomě, méně kritický k slabým stránkám jejich designu. Když se provádí systematický přehled, nejen že hledání důležitých článků musí být důkladné a objektivní, ale kritéria používaná k odmítnutí článků jako „vadných" musejí být jasně daná a nezávislá na výsledcích těch studií. Jinými slovy, nevyhazujte studii proto, že všechny ostatní studie v této oblasti ukázaly něco odlišného, vyhoďte ji proto, že cíle, účel nebo metody studie nesplnily vaše kritéria pro její zařazení do analýzy, ať již její výsledky ukazují cokoli. 45.1 VYHODNOCENÍ SYSTEMATICKÝCH PŘEHLEDŮ Otázka, kterou má systematický přehled řešit, musí být formulována velice přesně, jelikož tvůrce přehledu musí učinit rozhodnutí typu ano/ne, zda bude zahrnuta každá potenciálně důležitá publikace nebo zda bude odmítnuta jako „nedůležitá". Na příklad otázka „Zabraňují antikoagulancia iktům u pacientů s fibrilaci síní?" zní pěkně specificky, dokud se nezačne s probíráním seznamu možných studií k zahrnutí do přehledu. Zahrnuje „fibrilace síní" jak revmatickou tak nerevmatickou formu (o nichž se ví, že jsou spojeny s odlišnými riziky iktu) a zahrnuje paroxysmální fibrilaci síní? Zahrnuje „iktus" jak ischemický iktus, tak i hemorrhagic -ký iktus? A když se hovoří o iktu, měli bychom zvážit vedlejší účinky antikoagulancií vzhledem k možnému prospěchu z nich? Měla by být skutečná antikoagulancia jako heparin a warfarin porovnána s placebem nebo s jinými léky, které omezují krevní srážlivost, jako je aspirin a příbuzné výrobky? Nakonec, měl by přehled zahrnout studie na pacientech, kteří již předtím měli iktus nebo tranzitorní ischemickou ataku, nebo by měl být omezen na studie na pacientech bez těchto hlavních rizikových faktorů dalšího iktu? Ona „jednoduchá" otázka položená dříve se stává nezod-pověditelnou a my ji musíme zdokonalit následovně: „Vyhodnotit účinnost a bezpečnost léčby antikoagulancií warfarinového typu v sekundární prevenci (tj. po předcházejícím iktu nebo tranzitorní ischemické atace) u pacientů s nerevmatickou fibrilaci síní: porovnání s placebem." 723 Byla důkladně prohledána vhodná databáze a byly prozkoumány jiné potenciálně důležité zdroje? Jednou z výhod systematického přehledu je, na rozdíl od vyprávěcího nebo novinářského přehledu, že se od autora žádá, aby řekl, odkud informace pocházejí a jak byly zpracovány. Hledání důležitých článků v databázi Medline je velice komplikovaná věda a dokonce i nejlepší hledání v Medline vynechá důležité publikace, pro něž musí tvůrce přehledu vstoupit do některých dalších databází. Při hledání studií pro zahrnutí do přehledu je důležitým vědeckým závazným pravidlem úzkostlivě se vyvarovat jazykovému imperialismu. Například vyjádřením „Eine Placebo-kontrolierte Doppel-blindstudie" a „une étude ran-domisée a double insu face au placebo" musí být dána stejná váha jako „a double blind, randomised controlled trial"! Dále, zvláště tam, kde se uvažuje o statistické syntéze výsledků (meta-analýze), může být vhodné napsat autorům primárních studií a požádat je o nezpracované údaje o jednotlivých pacientech, které nikdy nebyly zahrnuty do publikovaného přehledu. I když bylo toto vše uděláno, hledání materiálu pro systematicky přehled sotva začalo. Jak ukázali Paul Knipschild a jeho kolegové, když hledali studie o vitaminu C a o prevenci nachlazení, jejich elektronické databáze jim poskytly pouze 22 z celkového konečného počtu 61 studií. Dalších 39 studií odhalilo ruční prohledávání databáze Index Medicus (14 studií nenalezených předtím), hledání odkazů ve studiích nalezených v Medline (dalších 15 studií), dále odkazy odkazů (devět dalších studií) a odkazy odkazů odkazů (jedna studie navíc nerozpoznanná žádným z předchozích hledání). Nakonec ale Knipschild a jeho tým zjistili, že jen jedna ze studií nerozpoznaných v Medline vyhověla přísným kritériím metodologické kvality a přispěla nakonec k jejich systematickému přehledu o vitaminu C v prevenci nachlazení. Prozkoumání tzv. „šedé literatury" může mít větší relativní důležitost, bereme-li v úvahu studie mimo hlavní lékařský obory, jako je fyzioterapie nebo alternativní medicína. Byla zhodnocena metodologická kvalita a podle toho studie seřazeny? Metodologické nedostatky, které činí výsledky studií neplatnými, jsou často obecné (tj. jsou nezávislé na předmětu studie), ale mohu také být zvláštní metodologické vlastnosti, které v určité oblasti rozlišují mezi dobrou, střední a nízkou kvalitou. Proto je jedním z úkolů tvůrce systematického přehledu sestavit seznam kritérií včetně obecných i zvláštních stránek kvality, podle nichž by měla být každá studie posuzována. Teoreticky by bylo možné spočítat složené číselné skóre, jež by odráželo „celkovou metodologickou kvalitu". Avšak ve skutečnosti by měla být spéše opatrnost pří vyvíjení takových skóre, jelikož neexistuje zlatý standard pro „skutečnou" metodologickou kvalitu studie a taková složená skóre by v praxi pravděpodobně nebyla ani platná ani spolehlivá. Různé skupiny Cochrane Collaboration tvořící přehledy, vyvíjejí obecné i tematicky specifické metody pro přiřazování skóre kvality výzkumným studiím. Běžně méně než polovina publikovaných meta-analýz obsahuje reprodukovateľná kritéria pro vyhodnocení kvality studií, které byly zařazeny nebo vyloučeny. Jak citlivé (senzitivní) jsou výsledky studií vůči způsobu zpracování přehledu? Pokud nerozumíte tomu, co tato otázka znamená, vyhledejte si ironicky myšlenou publikaci Carla Counsella a kolegů ve vánočním čísle BMJ z roku 1994, která „prokazovala" zcela fiktivní vztah mezi výsledkem házení kostek a výsledkem akutního iktu. Autoři popisuji řadu umělých experimentů s kutálením kostek, v nichž červené, bílé a zelené kostky představovaly různé druhy léčby akutního iktu. Celkově „studie" neukázaly žádný významný prospěch z těchto tří terapií. Avšak napodobení řady dokonale možných situací v procesu meta-analýzy - jako je publikační systematická chyba daná vyloučením několika „negativních" studií, analýza podskupin, která vyřadila údaje o léčbě červenými kostkami (jelikož se pří zpětném pohledu na výsledky, jevily červené kostky jako škodlivé), a jiná, hlavně arbitrárni, vyloučení na základě „metodologické kvality" - vedlo ke zjevně vysoce významnému prospěchu z „léčby kostkami" u akutního iktu. Ovšem, že nemůžete kutálením kostek vyléčit nikoho s iktem, ale pokud by se tyto simulované výsledky týkaly skutečných medicínských sporných otázek (jako které skupiny postmenopauzálních žen by měly užívat hormonální substituční léčbu nebo zdali by se měly plody v poloze koncem pánevním rutinně posílat na císařský řez), jak byste takové jemné systematické chyby vypátrali? Odpověď je, že se musíte propracovat různými „co kdyby". Co kdyby autoři systematického přehledu bývali změnili kritéria pro zařazení studií ke zpracování? Co kdyby vyloučili nepublikované studie? Co kdyby přiřadili studiím „váhu na základě kvality" odlišně? Co kdyby studie o nižší metodologické kvalitě byly zařazeny (nebo vyloučeny)? Co kdyby byli všichni pacienti, kteří nebyli do studie počítáni, považováni za zemřelé (nebo vyléčené)? Zkoumání těchto co kdyby je známo jako analýza sen-zi ti vity. Pokud zjistíte, že takové různé manipulace s údaji vedou k malým nebo žádným rozdílům v celkových výsledcích přehledu, můžete předpokládat, že závěry přehledu jsou poměrně robustní (odolné vůči změnám parametrů). Pokud však klíčové nálezy zmizí, když se změní kterékoli „co kdyby", závěry by měly být vyjádřeny mnohem obezřetněji a vy byste měli váhat, než byste v jejich světle změnili vaši praxi. Byl význam číselných výsledků hodnocen prostým rozumem a s patřičným zřetelem k širším hlediskům problému? Často je snadné nechat se „navnadiť' diagramy a grafy v systematickém přehledu. Ale jakýkoli číselný výsledek, jakkoli přesný, správný, „významný" a nebo jinak nezpochybnitelný, musí být umístěn do souvislosti s jednoduchou a často obyčejnou otázkou, kterou přehled zpracovával. Klinik musí rozhodnout, jak (pokud vůbec) tento číselný výsledek, ať je významný nebo ne, by měl ovlivnit péči o jednotlivého pacienta. Zvláště důležitou vlastností, kterou je třeba uvážit, když podnikáme nebo posuzujeme systematický přehled, je externí platnost zahrnutých studií. Studie může mít vysokou metodologickou kvalitu a mít přesné a působivé číselné výsledky, ale může být například vedena na účastnících ve věku pod 60 let, a proto nemusí být platná pro lidi nad 75. Zahrnutí nevhodných a neplatných studií do systematického přehledu zaručeně povede k nesmyslům a sníží důvěryhodnost sekundárního výzkumu. 45.2 META-ANALÝZA PRO NESTATISTIKA Meta-analýza, je definovaná jako statistická syntéza číselných výsledků několika studií, z nichž všechny pracovaly na stejné otázce. Pro nestatistika je dobrá meta-analýza 724 často snadněji pochopitelná než řada publikací primárního výzkumu, z něhož byla odvozena. Statistické techniky, které stojí za meta-analýzou, jsou tytéž jako pro kteroukoli jinou analýzu údajů - jde jen o to, že některá čísla jsou větší. Je užitečné, že jedna mezinárodní poradní skupina přišla se standardním formátem pro meta-analýzy (ustanovení QUOROM, podobné formátu CONSORT pro randomizova-né kontrolované studie. Prvním úkolem tvůrce meta-analýzy, po absolvování předběžných kroků pro systematický přehled, je rozhodnout, který ze všech různých parametrů výsledků vybraných autory primárních studií je (nebo jsou) nejlepší k použití pro celkovou syntézu. Například ve studiích o určitém režimu chemoterapie na karcinom prsu budou někteří autoři publikovat kumulativní mortalitu (tj. celkový počet lidí, kteří zemřeli k určitému datu) za tři a 12 měsíců, zatímco jiné studie budou uvádět šestiměsíční, 12měsíční a pětiletou kumulativní mortalitu. Zpracovatel meta-analýzy se může rozhodnout, že se soustředí na 12měsíční mortalitu, protože tento výsledek lze snadno vytáhnout ze všech těch studií. Avšak může usoudit, že tříměsíční mortalita je klinicky důležitým cílovým ukazatelem, a tak bude muset napsat autorům ostatních studií a požádat je o nezpracované údaje, z nichž by tato čísla vypočítal. Vedle rychlého zpracování čísel patří k popisu práce tvůrce meta-analýzy uvést do tabulky důležité informace o kritériích pro zařazení studie k analýze, velikost vzorku, výchozí charakteristiky pacientů, četnost vyřazení („odpadnutí") ze studie a výsledky primárních a sekundárních cílových ukazatelů ze všech zahrnutých studií. Bude-li tento úkol řádně proveden, je možno porovnat metody i výsledky dvou studií, jejichž autoři svůj výzkum sepsali různými způsoby. Ačkoli jsou takové tabulky často opticky odrazující, chrání před tím, aby se složitě porovnávala tabulka výsledků jednoho autora s kruhovým grafem či histogramem jiného autora. V současné době je sklon k předkládání výsledků meta--analýz ve standardní formě. Je to částečně proto, že tvůrci meta-analýz často k jejich výpočtům používají počítačové programové vybavení a tyto programy obsahují standardní grafický balíček. Toto obrazové znázornění (v hovorové angličtině známé jako „forest plot" nebo „blobbogram") bylo provedeno Srovnání efektivity koronárního bypassu (CABG) s perkutánní koronárni angioplastikou (PTCA) v léčbě angíny pectoris Obr. 5 STUDIE CABRI RITA EAST GAB TOLOUSE MASS LAUSANNE EROCI META-ANALYZA CELKEM OR (95% CI) -O- o- -o -o- o- -fr u sloučených poměrů rizik z osmi RCT, kde každá porovnávala koronárni bypass (CABG) s perkutánní koronárni angioplastikou (PTCA) v léčbě těžké anginy pectoris. Primárním (hlavním) výsledkem v této meta-analýze byla smrt nebo srdeční příhoda během jednoho roku. Těchto osm studií, zastoupených svým akronymem (například CABRI), je uvedeno pod sebou po levé straně na obrázku 5.Vodorovná úsečka odpovídající každé studii ukazuje relativní riziko smrti nebo srdeční příhody během jednoho roku u pacientů randomizovaných pro PTCA ve srovnání s pacienty randomizovanými pro CABG. „Skvrnka" (angl. „blob") uprostřed každé úsečky je bodovým odhadem rozdílu mezi skupinami (nejlepším jednotlivým odhadem prospěchu v podobě zachráněných životů nabídnutím CABG oproti nabídce PTCA) a délka úsečky představuje 95% interval spolehlivosti tohoto odhadu. Svislá černá přímka jdoucí středem diagramu je známa jako „čára nulového účinku" a v tomto případě je sdružena s relativním rizikem (RR) 1.0. Jinými slovy, pokud vodorovná úsečka kterékoli studie nepřekročí čáru nulového účinku, je 95% šance, že mezi skupinami je „skutečný" rozdíl. Pokud interval spolehlivosti výsledku (ona vodorovná úsečka) překročí čáru nulového účinku (tj. tu svislou čáru), může to buď znamenat, že není významný rozdíl mezi těmi léčbami, a/nebo, že velikost vzorku byla příliš malá na to, aby se spolehlivě vědělo, kde leží skutečný výsledek. Jednotlivé studie dávají bodové odhady relativního rizika PTCA ve srovnání s CABG mezi 0.5 a 5.0 a intervaly spolehlivosti některých studií jsou tak široké, že se ani nevejdou do grafu. A teď přichází to nejlepší na meta-analýzách. Podívejte se na malý kosočtverec pod všemi vodorovnými čárami. Představuje sloučené údaje ze všech osmi studií (celkové relativní riziko PTCA:CABG = 1.08) s novým, mnohem užším intervalem spolehlivosti tohoto relativního rizika (0.79 - 1.50). Jelikož se kosočtverec silně překrývá s čárou nulového účinku, můžeme říci, že pravděpodobně máme málo na výběr mezi těmi dvěma léčbami ve smyslu primárního cílového ukazatele (smrti nebo srdeční příhody v prvním roce). V tomto příkladě každá z osmi studií jednotlivě také naznačila nevýznamný rozdíl v účinku, ale u žádné z nich nebyla velikost vzorku dost velká na to, abychom se mohli spolehnout na její negativní výsledek. Avšak všimněte si, že tento úhledný kosočtvereček neznamená, že byste tedy mohli nabízet každému pacientovi s anginou raději PTCA než CABG. Má mnohem omezenější význam - že průměrný pacient ve studiích předložených v této meta-analýze má stejnou pravděpodobnost dosáhnout primárního cílového ukazatele (smrti nebo srdeční příhody během roku), ať je randomizován pro kteroukoli z obou možností léčby. Volba léčby by ovšem měla také vzít v úvahu, jak se pacient cítí na podstoupení větší srdeční operace (CABG) oproti relativně menší proceduře (PTCA). V mnoha meta-analýzách „nevýznamné" studie (tj. ty, které samy o sobě neukázaly významný rozdíl mezi léčebnou a kontrolní skupinou) přispívají ke sloučenému výsledku, který je statisticky významný. Nejslavnějším příkladem řečeného, což Cochrane Collaboration přijala za své logo, je meta-analýza sedmi studií o účinku podávání steroidů matkám, u kterých se očekával předčasný porod. Jen dvě z těch sedmi studií ukázaly statisticky významný prospěch (ve smyslu přežití dítěte), ale zlepšení v přesnosti (tj. zúžení intervalů spolehlivosti) u kumulativních výsledků, patrné ve zmenšení šířky kosočtverce ve srovnání s jednotlivými úsečkami, předvedlo sílu důkazů ve prospěch této intervence. Tato meta-analýza ukázala, že u dětí matek léčených steroi- 725 dy byla o 30-50 % menší pravděpodobnost úmrtí, než u dětí kontrolních matek. Existují propracovanější techniky meta-analýzy údajů jednotlivých pacientů, které poskytuje správnější a přesnější model pro výpočet bodového odhadu účinku. Také je vhodné si vyhledat vynikající přehlednou sérii o meta-analýzách publikovanou před několika lety v BMJ, spolu se zvláštním dodatkem k této sérii o různých programových balíčcích nyní dostupných pro meta-analýzu, který byl uveřejněn pouze na Internetu. 45.2.1 VYSVĚTLENÍ HETEROGENITY V každodenní řeči „homogenní" znamená „stejnorodý, jednotného složení" a „heterogenní" znamená „různorodý, mnoho různých součástí". V řeči meta-analýzy homogenita znamená, že výsledky každé jednotlivé studie jsou slučitelné s výsledky kterékoli z těch dalších. Homogenitu lze odhadnout na první pohled je-li dolní mez intervalu spolehlivosti každé studie nižší než horní mez intervalu spolehlivosti všech ostatních (tj. všechny vodorovné úsečky se do nějaké míry překrývají). Statisticky řečeno jsou tyto studie homogenní. Naproti tomu některé studie, jejichž dolní mez intervalu spolehlivosti je vyšší než horní mez intervalu spolehlivosti alespoň jedné další studie (tj. některé úsečky se vůbec nepřekrývají). Takové studie lze nazvat heterogenními. Definitivní test však zahrnuje trochu promyšlenější statistický manévr, než pozvednout pravítko nad „blobbo-gramem". Ten nejběžněji užívaný je variantou chí kvadrát (X2) testu, jelikož otázka, které se týká, je:, Je mezi výsledky studií větší variabilita než náhodná?" Statistika x2 má v průměru hodnotu rovnou počtu stupňů volnosti (v tomto případě počet studií v meta-analýze minus jedna), a tak by x2 o hodnotě 7.0 pro sadu osmi studií neposkytl žádný důkaz statistické heterogenity. (Ve skutečnosti by ani neprokázal, že studie jsou homogenní, hlavně proto, že x2 test má malou sílu, aby odhalil malé, ale důležité úrovně heterogenity.) Hodnota x2 nám mnohem více než počet studií v meta--analýze říká, že studie, které přispěly k analýze, jsou v nějakém důležitém ohledu odlišné od jiných. Například mohou být známy rozdíly v metodologii (například autoři mohli použít různé dotazníky k vyhodnocení příznaků deprese) nebo mohou být známy klinické rozdíly mezi účastníky studie (například jedním centrem mohla být f akutní nemocnice, kam se odesílají nejvíce nemocní pacienti). Avšak mohou existovat neznámé nebo nezaznamenané rozdíly mezi studiemi, o kterých může zpracovatel meta-analýzy jenom hloubat, dokud nevytáhne další podrobnosti z autorů studií. Předvedení statistické heterogenity je matematický výkon a je to práce statistika, ale vysvětlení této heterogenity (tj. pátrání po klinické heterogenite a její objasnění) je interpretační výkon a vyžaduje představivost, zdravý rozum a závisí na klinických nebo výzkumných zkušenostech. Obrázek 6 ukazuje výsledky 10 studií o strategiích na snížení cholesterolu. Výsledky jsou vyjádřeny jako procentuální pokles rizika onemocnění srdce spojený se snížením sérové hladiny cholesterolu o každých 0.6 mmol/1. Vodorovné úsečky představují 95% intervaly spolehlivosti každého výsledku a je jasné, že i kdyby nebyl znám výsledek x2 = 127, že ty studie jsou vysoce heterogenní. Prosté „zprůměrování" výsledků studií z obrázku by bylo velice zavádějící. Tvůrce meta-analýzy se musí vrátit ke svým primárním zdrojům a zeptat se: „V jakém ohledu se studie A lišila od studie B a co mají studie C, D a H spo- lečného, co způsobuje, že jejich výsledky jsou nahloučeny u jednoho konce diagramu?" V tomto případě korekce na věk subjektů studie snížila x2 ze 127 na 45. Jinými slovy, většinu „neslučitelnosti" ve výsledcích lze vysvětlit skutečností, že když se pustíte do nějaké strategie (například dietní intervence), která úspěšně sníží vaši hladinu cholesterolu, bude podstatně pravděpodobnější předejít srdeční příhodě, pokud je vám 45, než když je vám 85. Studie o strategii snížení cholesterolu Obr. 6 British Regional Heart BUPA Gothenburg MRFIT screenees Renfrew-Paisley Whitehall Honolulu Central Sweden Israeli Pooling project -O—i KH -OH — 0 —1--------1--------1--------1— 10 20 30 40 —1 50 % snížení rizika To je hlavním základem stížností profesora Hanse Eysencka, který sestavil důkladnou a zajímavou kritiku meta-analýzy. Ve světě velkorysých a pedantů je Eysenck oním přílišným puntičkářem, a to zpochybňuje jeho smysl pro kvalitativní výzkum a zvláště pro kombinaci výsledků studií, které byly provedeny na různých populacích, na různých místech, v různé době a z různých důvodů. Eysenckovy výhrady k meta-analýze se zrodily v souvislosti s jednou meta-analýzou, která ukázala (nesprávně), že je významný prospěch plynoucí z podávání intravenózního magnézia obětem srdeční příhody. Následné megastudii zahrnující 58 000 pacientů (ISIS-4) se nepodařilo nalézt jakýkoli prospěch a zavádějící závěry tvůrce meta-analýzy byly následně vysvětleny publikační systematickou chybou, metodologickými slabostmi oněch menších studií a klinickou heterogenitou. Ačkoli Eysenckova netečnost k matematice vyvolává rozpaky („Jestliže nějaká farmakoterapie má účinek tak nepochopitelný a nejasný, že potřebuje meta-analýzu, aby byl stanoven, nebyl bych moc šťastný, kdybych ji musel u sebe použít"), určitě je možno pochopit podstatu jeho argumentu. Eysenckovy pochybnosti o meta-analýze by se měly stát povinnou četbou pro ty, kdo by chtěli sestavovat systematické přehledy. 726 46 ZAVER 46.1 PRÍNOS EBM A APLIKACE V JEDNOTLIVÝCH LÉKAŘSKÝCH OBORECH Filozofie EBM - medicíny založené na důkazu, přinesla zásadní obrat do myslení lékařů ve všech medicínských oborech. Pomáhá nejen nalézt nejlepší důkazy pro diagnostické, terapeutické, prognostické a preventivní rozhodování lékaře, ale pokud je lékař najde a umí je správně aplikovat, pak jeho výkonná praxe není založena jen na empirii, ale na posledních výsledcích vědeckého výzkumu v dané oblasti medicíny. Principy EBM se v současné době začínají používat ve všech lékařských oborech, takže je běžné, že se hovoří o „Evidence Based Pediatrics, Evidence Based Neurology, Evidence Based Cardiology....". Vzhledem ke skutečnosti, že základní principy EBM jsou stejné a pouze jejich aplikace je rozdílná podle daného lékařského oboru, je přirozené, že se tyto principy aplikují i v oblasti veřejného zdravotnictví. Tam, kde je u klinického lékaře předmětem zájmu a jeho rozhodnutí pacient jako jednotlivec, je v případě veřejně-zdravotnických rozhodnutí předmětem zájmu populace. Obdobně v případě intervene -ních opatření je u klinického lékaře hlavním nástrojem léčba pacienta jako jednotlivce, zatímco pracovníci veřejného zdravotnictví aplikují v populaci intervenční programy nebo intervenční zdravotní politiku. Získávání podkladů ve smyslu nejlepšího důkazu pro výše uvedená rozhodnutí je však stejné a proto by měly principy EBM patřit mezi základní znalosti nejen u klinických lékařů všech medicínských oborů, ale také u všech pracovníků veřejného zdravotnictví, kteří mají rozhodovací pravomoc. 46.2 EVIDENCE-BASED PUBLIC HEALTH (EBPH) - VEŘEJNÉ ZDRAVOTNICTVÍ ZALOŽENÉ NA DŮKAZU Vzhledem k tomu, že problematice veřejného zdravotnictví založeného na důkazu bude věnována samostatná publikace, jsou v následující kapitole uvedeny pouze některé vybrané schématické aspekty, které souvisí s tímto tématem. Co je důkaz? Soubor informací, které jsou k dispozici a které určují, zda návrh, nebo to čemu věříme, je skutečně pravdivé a validní. Co je rozhodnutí? Konečný výběr nebo posouzení. Co je EBPH? Podle definice Brownsona to je: "vznik a vývoj, implementace a evaluace efektivního programu nebo zdravotní politiky v oblasti veřejného zdraví, prostřednictvím aplikace principů vědeckého zdůvodnění, včetně systematického využívání všech dostupných údajů a informačních systémů a programů modelového plánování." (Brownson et al., J Public Health Management Practice 1999,5:86-97) Co je metoda založená na důkazu? Strategie, která veřejně zdravotnická, nebo klinická doporučení jednoznačně opírá o vědecký důkaz, prokazující efektivitu takového postupu. Klíčové charakteristiky EBPH Intervenční přístupy by měly být vypracovány na základě nejlepších dostupných vědeckých informací. 1. Řešené problémy jsou většinou multidisciplinární 2. Je třeba zohlednit jak teoretické přístupy tak i metody systematického plánování 3. Součástí postupu je i evaluace 4. Výsledky jsou diseminovány všem, kteří je potřebují Proč programy I politika selhávají? • Výběr neefektivního intervenčního přístupu • Výběr potenciálně efektivního přístupu, ale špatná nebo nekompletní implementace • Neadekvátní evaluace, která limituje zevšeobecnění výsledku Rozdíly mezi EBM a EBPH: Charakteristika EBM EBPH Kvalita důkazu experimentální quasi- Čas od intervence k následku studie krátký interval experimentální studie dlouhý interval Kvalifikace pracovníků formální certifikát vyžadován méně formální certifikát ne vždy vyžadován Rozhodování jednotlivec skupina Evaluace důkazu: Méně jistá kritéria Více jistá kritéria Jedno z mála pozorování Mnoho pozorování Kazuistika Epidemiologická studie Nepublikováno ani neposouzeno odborníkem (peer-review) Publikováno v časopisu s peer-review Dříve nepublikováno Reprodukce nálezů z ostatních studií Provedeno na nehumánních subjektech Provedeno na lidech Výsledky nebyly ve vztahu k hypotéze Výsledky byly ve vztahu k testované hypotéze Limitace nezmíněný Limitace zmíněny Nesrovnáváno s předchozími výsledky Diskutován vztah k předchozím studiím Kdy je důkaz nedostatečný: • kulturní a geografický bias - převážně fenomény západního světa - v některých oblastech světa je důkaz luxusem 727 Které nástroje jsou užitečné při získávání důkazu: • systematické přehledy (návody - guidelines) • meta-analýza • ekonomické hodnocení • hodnocení rizika (risk assessment) Překážky pro uplatnění EBPH: • chyběni kvalifikovaného vedení projektu pro uplatnění zásad EBPH • nedostatečná vize kam by měla implementace projektu dospět v dlouhodobém horizontu • externí tlaky (včetně politických), které svedou projekt mimo oblast EBPH • neadekvátní kvalifikace v základních disciplinách veřejného zdravotnictví • nedostatek času při shromažďování informací, analýze údajů a procházení literatury pro hledání důkazu. • chyběni řádných informací o efektivitě projektu (programu) nebo politiky a to všeobecně nebo ve specifických populacích Algoritmus správného postupu: 1. Definice problému nebo řešené otázky 2. Kvantifikace problému (nástroje: RR, OR ...) 3. Vyhledání literatury a uspořádání informací (nástroje: systematické přehledy, hodnocení rizika, ekonomické analýzy) 4. Vytvoření programu a preference možností 5. Vytvoření akčního plánu a implementace intervence 6. Evaluace programu nebo politiky (podle výsledků evaluace někdy zpět k bodu 4) 7. Diseminace výsledků nebo přerušení programu Současný stav: EBPH se rychle rozvíjí, obdobně jako klinické medicínské disciplíny. Vždy je třeba si položit tázku, kdy je „důkaz" dostatečný k tomu, aby byla spuštěna intervenční akce. Na rozdíl od řady klinických oborů zůstává veřejné zdravotnictví stále spíše na okraji zájmu rozhodujících zdravotnických orgánů. Rozhodování ve veřejném zdravotnictví na základě důkazů Abychom porozuměli problémům životního prostředí, musíme používat kvalitní informace. Strategie, pomocí které chceme dosáhnout určitého cíle, musí být proveditelné a založené na důkazu. Cíle, kterých chceme dosáhnout pomocí určité intervence, by měly významně ovlivňovat úroveň veřejného zdraví. V průběhu intervence bychom měli identifikovat faktory, pomocí kterých můžeme měřit průběžné výsledky, které nás informují, zda intervence směřuje k vytčenému cíli. 46.2.1 PROGRAM PODPORY ZDRAVÍ A ZDRAVOTNÍ POLITIKA Program podpory zdraví je definován jako strukturovaná intervence, jejímž záměrem je zlepšení zdraví populace, nebo populačních skupin ve vysokém riziku. Zdravotní politika představuje soubor zákonných norem, které řídí chování jednotlivců i celé populace. Cílem by mělo být vytvořit jasné stanovisko k danému problému veřejného zdraví nebo politiky, což není vždy jasně specifikováno. Příkladem může být prospěch z mamo-grafického screeningu nebo zvolení efektivních metod pro zvýšení fyzické activity. Obecný vztah tohoto problému k EBM je vyjádřen jednou ze základních otázek a to: „formulovat zodpověditelné otázky". Vyjádření otázky • Můžeme se ptát: - jak formuloval problem ten, kdo ho identifikoval? - mohl by být problem formulován ve vztahu k osobě, místu a času? - zda je shoda mezi zúčastněnými partnery na správné formulaci problému? • Otázka by měla: - obsahovat hypotézu, která má být testována - vést k analýze základních příčin - vést k participaci více oborů/institucí - být jasná a srozumitelná - vést k odpovědím, neovlivněným bias Druhy problémů: 1. epidemiologické - „jaký je vztah x ke zdravotnímu problému y"? (úroveň 1) 2. intervenční - „jaký je nejlepší postup jak snížit rizikový factor x"? (úroveň 2) 3. evaluační - „je program y efektivní"? (úroveň 2) Součásti vyjádření otázky: • základ ... epidemiologická část příklad: na základě epidemiologických údajů jen 30% zen ve věku 40 let a starších má pravidelnou fyzickou aktivitu. Tento stav je stejný v posledních 5 letech a je nejnižší mezi ženami z nižších příjmových skupin • programové otázky (klíčová část!) - intervence příklad: jak je možno získat podporu pro program zvýšení fyzické activity? Je v literatuře příklad efektivního programu zvýšení fyzické aktivity u žen s nízkým příjmem? - evaluace příklad: je určitá intervence efektivní (na přáklad kampaň v masmediích) pro zvýšení proporce fyzické aktivity? Jaká je situace v masmédiích pokud se týka uvažované kampaně? - řízení programu příklad: jaké systémové problémy je možno očekávat, které vedou k překročení rozpočtu? - politika příklad: je zde nějaký problem, ketrý by vyžadoval změnu politiky? Jak účinná byla zdravotní politika, kterou jsme uplatňovali v minulosti při řešení této otázky? Všechny tyto programové otázky by měly být zodpověditelné, odpověď založená na důkazu, politicky neovlivněné a odpovědi by měly zlepšit implementaci programu nebo politiky. • uvažované řešení příklad: zvýšené financování primární péče pro poradenskou činnost, kampaň v masmédiích, programy ve středních školách • potenciální výsledek (výsledky) příklad: ovlivnění proporce mortality na srdeční onemocněn především u žen s nízkým příjmem, ovlivnění proporce fyzické activity, ovlivnění poradenství pro fyzickou aktivitu v primární péči. Klíčovými problémy ve fázi definice problému jsou vyvarovat se unáhleného a předčasného rozhodnutí, podporovat tvůrčí myšlení a pokud to lze kvantifikovat vyjádření otázky. 728 46.2.2 PLAN PRO VYTVOŘENI PROGRAMU NEBO ZDRAVOTNÍ POLITIKY Zahrnuje tyto základní aspekty: • vize • zhodnocení životního prostředí • strategické otázky a cíle • výsledky a jejich měření • evaluace Kritéria pro dobrý akční plán: 1. jasné cíle 2. definovaná a respektovaná úloha a odpovědnost jednotlivých účastníků 3. jasné mechanismy odpovědnosti 4. obsažnost ve smyslu užití mnohocetných intervenčních postupů (komunikace, chování, politika, regulace, životní prostředí) Kauzální schéma: i Primární preventivní intervence Asymptomatičtí Jedinci -----^ Modifikace rizikových faktorů včetně chování Prevence cílového stavu Strategie použitelné pro akci: Schéma organizace intervence v různých rovinách: • individuální (individuální znalost problému, postoje) • interpersonální (rodina, přátelé, významné osoby) • komunitní (sociální síť, média) • organizační (agentury, pracoviště) • vládní (zákony, regulace) V tomto smyslu je intervence rozdílná na různých úrovních: Individuální interpersonální komunitní Cíle znalost postupy programy Postoje sociální podpora postupy Chování sociální sítě politika Přístupy výchova vytvoření nových sociální změny školení sociálních vazeb pomoc médií poradenství poradci laici rozvoj i odborníci komunity organizační vládní cíle programy regulace postupy nařízení politika politika legislativa přístupy organizační změny politické akce vytváření sítě lobování organizační rozvoj obhajoba politiky Strategie pro akci: • vytvoření specifických cílů - ...musí být jasný vědecký důkaz podporující stanovené cíle - ...dosažený výsledek musí být významný a srozumitelný široké veřejnosti - .. .cíle musí být orientovány na prevenci - ...cíle musí podporovat akci a stanovit přechodné kroky (střednědobé indikátory) - založené na znalosti: „zvýšit procento žen, které jsou si vědomy významu pravidelné fyzické aktivity ze 30% na 40% v určitém časovém období" - založené na postoji/snaze o změnu: „zvýšit procento žen, které hodlají být pravidelně fyzicky aktivní z 12% na 22% v určitém časovém období" - ...jazyk použitý pro formulaci cílů musí být přesný, ne všeobecný - ...cíle musí být měřitelné s širokým spektrem ukazatelů (zdravotní důsledky, rizikové faktory chování, indikátory zdravotnických služeb, zhodnocení kapacity komunity) - ...stanoven časový harmonogram - ...cíle jsou to čeho bylo dosaženo nikoliv nástroje jak toho bylo dosaženo! • vytvoření pracovního plánu a časového harmonogramu - ...seznam aktivit, seskupený do kategorií - ... stanovení priorit - ...určení délky trvání jednotlivých aktivit s určením přesného začátku a konce • zhodnocení potřebných zdrojů - ...finanční prostředky, které jsou k dispozici - ...personál - .. .přístroje a jiné vybavení - .. .potřebná infrastruktura pro zamýšlenou intervenci - ...cestovné • identifikace a školení pracovníků - ...v kterých oblastech potřebují racovníci školení - ...kdo bude školit - .. .mají pracovníci určité znalosti nebo zkušenosti, které by se daly použít pro projekt - .. .školení příslušníků komunity, pokud je to třeba - ...uskutečnění pilotní studie, která pomůže objasnit následující otázky: - lépe propracovat hypotézu - otestovat získávání údajů a jejich analýzu - odhalí politicky citlivé problémy - odhadne náklady na pracovníky, materiál, vybavení a pod. - odhadne kulturní akceptovatelnost intervence pro určité podskupiny populace 46.2.3 EVALUACE vytvoření evaluačního plánu • ...evaluace je proces, který systematicky a objektivně hodnotí patřičnost a efektivitu projektu a jeho dopad ve smyslu stanovených cílů • ...evaluace je jedna z hlavních náplní výzkumu v rámci veřejného zdravotnictví • ... hlavní problémy evaluace: proč je evaluace důležitá? • práce institucí veřejného zdravotnictví by měla být accountable • na základě evaluace je mořno vybrat variantní řešení, pokud jsou prostředky omezené (pomůže zhodnotit náklady a prospěch) 729 • je to zdroj informací pro další zlepšování programů • je stále častěji požadována sponzory • vede k vyslovení dalších výzkumných problémů, které mohou být řešeny v dalších studiích evaluační schéma • angažování účastníků projektu • popsání programu • zaměření evaluačního designu • definování důkazu • zhodnocení výsledků • zajištění ponaučení z evaluace Klíčové body evaluace: • Posouzení údajů před intervencí a po intervenci. • Srovnávané skupiny. • Kompletní záznamyz provedení programu. • Spolehlivé a validní měření jevů. • Použití správných analytických postupů. Speciální problémy při evaluaci „community-based" programů: • Různé stupně expozice dané intervenci. • Problémy s kontrolou expozice dané intervenci. • Program je prováděn v různých lokalitách. • Rozdíly v různých úrovních komunity (dopad na velikost vzorku). Měření jevů a problémy evaluace Součásti „dobré" evaluace jsou ...adekvátní velikost vzorku, vysoká validita a spolehlivost. Velikost vzorku: • počet komunit zahrnutých do programu • počet jednotlivců na 1 komunitu • zvýšení počtu komunit ve vztahu k počtu jednotlivců na 1 komunitu Validita je opravdu měřeno to co bylo v záměru programu? Příklad: kouření u těhotných zen tak jak je samy uvádějí ve srovnání s měřením kotininu. • Interní validita ... je ve vztahu ke kauzalitě, zda jsou výsledky opravdu přisouditelné programu?). • Externí validita....je ve vztahu ke generalizaci (zevšeobecnění) výsledků. Spolehlivost: je měření prováděno konzistentně, tj. stále stejným způsobem? Typy evaluačního přístupu: 1. zaměření na následek a dopad programu = „zda je program dobrý" 2. zaměření na proces provádění programu = „zda je program dobře prováděn" Typy evaluace Program - obsah proces - metody - časové schéma - materiál Chování - získání znalostí dopad - změna přístupu - změna habitu - rozvoj dovedností Zdraví - mortalita následek - morbidita - neschopnost - kvalita života Organizační problémy evaluace: • pracovníci provádějící program mohou být postiženi evaluací, proto je třeba evaluaci provádět objektivně. Pokud jsou pracovníci provádějící program zahrnuti do procesu evaluace, může to naopak snížit její objektivitu. • dva mezní přístupy od velmi podrobné evaluace až prakticky k žádné evaluaci • pravidlo 10% rezervy při designu a implementaci programu • nezávislá evaluace je lepší • používat jak kvalitativní tak i kvantitativní metody evalu- 46.3 DODATEK- KONTROLNÍ SEZNAMY PRO HLEDÁNÍ, POSUZOVÁNÍ A ZAČLEŇOVÁNÍ DŮKAZŮ DO PRAXE Není-li uvedeno jinak, mohou být tyto kontrolní seznamy aplikovány na randomizované kontrolované studie, jiné kontrolované klinické studie, kohortové studie, studie případů a kontrol a kterékoli jiné důkazy z výzkumu. Je moje praxe založena na důkazech? Kontrolní seznam, citlivý k souvislostem, pro jednotlivé nečekané klinické situace. 1. Rozpoznal jsem klinické, psychologické, sociální a jiné problémy, určil jejich priority a vzal jsem při tom v úvahu pacientův náhled? 2. Provedl jsem dostatečné a úplné vyšetření, abych stanovil pravděpodobnost přítomnosti přidružených diagnóz? 3. Zvážil jsem prídatné problémy a rizikové faktory, které by mohly vyžadovat pozornost? 4. Pátral jsem, kde to bylo nutné, po důkazech (ze systematických přehledů, oficiálních doporučení, klinických studií a jiných zdrojů) týkajících se daných problémů? 5. Zhodnotil jsem a vzal jsem v úvahu úplnost, kvalitu a sílu důkazů? 6. Aplikoval jsem platné a důležité důkazy na tento konkrétní soubor problémů způsobem, který je jak vědecky oprávněný, tak intuitivně rozumný? 7. Předložil jsem pacientovi pro a proti různých možností způsobem, kterému může rozumět, a začlenil jsem pacientovo blaho do výsledných doporučení? 730 8. Domluvil jsem se na kontrolním vyšetření, na opětovném pozvání k vyšetření, na předání pacienta kolegovi nebo na jiné další péči, jak je to nutné? Kontrolní seznam pro vyhledávání v Medline nebo v knihovně Cochrane 1. Abyste vyhledali článek, o kterém víte, že existuje, hledejte podle slova v textu (v názvu, v abstraktu nebo v obou) nebo použijte přípony oblastí pro hledání podle autora, názvu, instituce, časopisu a roku vydání. 2. Aby vaše hledání bylo maximálně senzitivní, hledejte jak podle MeSH termínů (rozvinutých), tak podle slova v textu (v názvu nebo abstraktu), a kombinujte obojí použitím boolovského operátoru „or". 3. Pro cílené (specifické) hledání jasně vymezeného předmětu proveďte dvě nebo více senzitivních hledání, jak je tomu v bodě 2, a zkombinujte je použitím boolovského operátoru „and". 4. Abyste našli články, které mají pravděpodobně vysokou metodologickou kvalitu, vložte kvalitativní řetězec založený na důkazech pro terapeutické intervence, etiolo-gii, diagnostické procedury nebo epidemiologii a/nebo použijte maximálně senzitivní vyhledávací strategie pro randomizované studie, systematické přehledy a meta--analýzy 5. Zdokonalujte vaše hledání tak, jak postupujete dále. Například vyřaďte nedůležitý materiál použitím boolovského operátoru „not". 6. Použijte podkategorie jen tehdy, je-li to proveditelný způsob, jak úžeji vymezit vaše hledání, jelikož tvůrci rejstříku jsou chybující a chybná zařazení pojmů jsou běžná. 7. Když omezujete větší sadu článků, raději sami prolistujte okolo 50 abstraktů, než byste očekávali, že vám program vybere půl tuctu těch nejlepších. Kontrolní seznam na určení, o čem je publikace 1. Proč byla studie provedena (jaké klinické otázky řešila)? 2. Jaký typ studie byl zvolen? • Primární výzkum (experiment, randomizovaný kontrolovaný pokus, jiná kontrolovaná klinická studie, kohortová studie, studie případů a kontrol, průřezová studie, longitudinální průřezová studie, kazuistika nebo série kazuistik)? • Sekundární výzkum (prostý přehled, systematický přehled, meta-analýza, rozhodovací analýza, vývoj oficiálního doporučení, ekonomická analýza)? 3. Bylo uspořádání studie vhodné vzhledem k oblasti výzkumu (terapie, diagnostika, screening, prognóza, etiologie)? 4. Byla studie etická? Kontrolní seznam pro oddělení metod publikace 1. Byla studie původní? 2. O kom je studie? • Jak byly subjekty povolány do studie? • Kdo byl do studie zařazen a kdo z ní byl vyloučen? • Byly subjekty studovány v „reálných životních" podmínkách? 3. Bylo uspořádání studie rozumné? • O jaké intervenci nebo jiném manévru se uvažovalo? • Jaké výsledky byly zjištěny a jak? 4. Byla studie dostatečně kontrolovaná? • V případě „randomizované studie", byla randomizace skutečně náhodná? • V případě kohortové studie, studie případů a kontrol nebo jiné nerandomizované srovnávací studie, byly kontroly vhodné? • Byly skupiny srovnatelné ve všech důležitých hlediscích vyjma studované proměnné? • Bylo vyhodnocení výsledku (nebo, v případě studie případů a kontrol, zařazení mezi případy) „zaslepené"? 5. Byla studie dostatečně velká, trvala dostatečně dlouho a bylo období sledování kompletní, aby výsledky mohly být věrohodné? Kontrolní seznam pro statistické stránky publikace 1. Zvolili autoři vše ohledně studie správně? • Stanovili, zdali jsou jejich skupiny srovnatelné, a pokud to bylo nutné, provedli korekci na výchozí roždí-ly? • Jaký druh údajů měli a použili vhodné statistické těs-ty? • Pokud jsou statistické testy v publikaci nejasné, proč si je autoři vybrali? • Byly údaje analyzovány podle původního protokolu studie? 2. Párové údaje, strany testů a odlehlé hodnoty • Byly u párových údajů provedeny párové testy? • Byl proveden oboustranný test, kdykoli bylo možné, že účinek intervence by mohl být negativní? • Byly analyzovány odlehlé hodnoty zdravým rozumem i vhodnou statistickou korekcí? 3. Korelace, regrese a etiologie • Byla korelace odlišena od regrese a byl korelační koeficient („hodnota r") spočítán a správně interpretován? • Byly vysloveny předpoklady o povaze a směru příčinné souvislosti? 4. Pravděpodobnost a spolehlivost • Byly „hodnoty /?" spočítány a vhodně interpretovány? • Byly spočítány intervaly spolehlivosti a odpovídají jim závěry autorů? 5. Vyjádřili autoři své výsledky ve smyslu pravděpodobného poškození nebo prospěšnosti, které může očekávat jednotlivý pacient, jakou jsou: • snížení relativního rizika? • snížení absolutního rizika (ARR)? • počet osob, které je třeba léčit (NNT)? • poměr šancí (OR)? Kontrolní seznamy pro materiál poskytnutý farmaceutickým reprezentantem 1. Zahrnuje tento materiál předmět, který mě zajímá, a je pro mou praxi klinicky důležitý? 2. Byl tento materiál publikován v nezávislých recenzovaných časopisech? Byl z této prezentace vynechán nějaký významný důkaz nebo byl odstraněn z publikace? 3. Zahrnuje materiál důkazy vysoké úrovně, jako jsou systematické přehledy, meta-analýzy nebo dvojitě slepé randomizované kontrolované studie, a bylo kontrolní intervencí podávání nejbližšího konkurenta studovaného léku v optimálních dávkách? 4. Zabývaly se studie nebo přehledy jasně cílenou, důležitou a zodpověditelnou klinickou otázkou, která odráží problém důležitý pro pacienty? Přinášejí důkazy o bezpečnosti, snášenlivosti, účinnosti a ceně? 5. Definovala každá studie nebo meta-analýza léčený stav, zahrnuté pacienty, srovnávané intervence a zkoumané výsledky? 6. Podává materiál přímé důkazy, že lék pomůže mým pacientům žít delším, zdravějším a produktivnějším životem bez příznaků nemoci? 731 7. Pokud byl použit náhradní parametr výsledku, jaké jsou důkazy, že je spolehlivým, reprodukovatelným, senzitivním, specifickým a pravdivým prediktorem (parametrem s predpovední hodnotou) nemoci a odráží rychle odpověď na léčbu? 8. Ukazují výsledky studie, zdali (a jak) se liší účinnost obou druhů léčby a zdali byl nějaký rozdíl v typu nebo četnosti nežádoucích reakcí? Jsou výsledky vyjádřeny ve smyslu počtu osob, které je třeba léčit, a jsou významné klinicky i statisticky? 9. Pokud reprezentant dodal velké množství materiálu, které tří publikace poskytují nejsilnější důkazy pro tvrzení firmy? Kontrolní seznam pro publikaci, která uvádí, že ověřovala platnost diagnostického nebo screeningového testu 1. Je tento test potenciálně důležitý pro mou praxi? 2. Byl test porovnán se skutečným zlatým standardem? 3. Zahrnula studie ověřující platnost testu vhodné spektrum subjektů? 4. Zabránilo se systematické chybě provedení? 5. Zabránilo se zaujatosti pozorovatele (tj. hodnotitele výsledků)? 6. Prokázal test reprodukovatelnost v rámci pozorovatele i mezi pozorovateli? 7. Jaké jsou vlastnosti testu odvozené od studie ověřující jeho platnost? 8. Byly dány intervaly spolehlivosti pro senzitivitu, specifičnost a další vlastnosti testu? 9. Bylo z výsledků odvozeno rozumné „normální rozmezí"? 10. Byl test umístěn do souvislosti s jinými možnými testy ve sledu diagnostických kroků pro daný stav? Kontrolní seznam pro systematické přehledy a meta-analýzy 1. Zabýval se přehled důležitou klinickou otázkou? 2. Bylo podniknuto důkladné hledání v odpovídající databázi a byly prozkoumány jiné potenciálně důležité zdroje? 3. Byla vyhodnocena metodologická kvalita a podle ní zváženy studie? 4. Jak senzitivní jsou výsledky vůči způsobu zpracování přehledu? 5. Byly číselné výsledky interpretovány zdravým rozumem a s patřičným ohledem k širším hlediskům problému? Kontrolní seznam pro sestavu klinických oficiálních doporučení 1. Zahrnovala příprava a publikace těchto oficiálních doporučení významný střet zájmů? 2. Zabývají je oficiální doporučení vhodným předmětem a uvádějí jasně cíl ideální léčby ve smyslu zdravotního a/nebo ekonomického výsledku (výsledných nákladů)? 3. Byla skupina pro vývoj oficiálního doporučení vedena předním expertem v oboru (v ideálním případě by to tak nemělo být) a byl zapojen specialista na metodologii používanou v sekundárním výzkumu (např. tvůrce meta--analýz, zdravotnický ekonom)? 4. Byly podrobně prozkoumány všechny důležité údaje a zdá se, že závěry oficiálních doporučení se těchto údajů drží? 5. Postihují rozmanitost v lékařské praxi a další sporné oblasti (např. optimální péči ve vztahu ke skutečnému nebo domnělému nedostatku ve financování)? 6. Jsou ta oficiální doporučení platná a spolehlivá? 7. Jsou klinicky důležitá, vyčerpávající a pružná? 8. Berou v úvahu to, co je pro pacienty přijatelné, finančně dostupné a prakticky možné? 9. Zahrnují doporučení ohledně svého vlastního šíření, začleňování do praxe a periodických revizí? Kontrolní seznam pro ekonomickou analýzu 1. Je ta analýza založena na studii, která zodpovídá jasně formulovanou klinickou otázku o ekonomicky důležitém námětu? 2. Z hlediska koho se uvažovalo o nákladech a prospěchu? 3. Bylo ukázáno, že srovnávané intervence jsou klinicky účinné? 4. Jsou ony intervence rozumné a proveditelné v podmínkách, kde mají být používány? 5. Která metoda ekonomické analýzy byla použita a bylo to vhodné? • Pokud intervence vytvořily stejné výsledky - potom: analýza minimalizace nákladů. • Pokud je důležitý výsledek jednorozměrný - potom: analýza nákladové efektivity. • Pokud je důležitý výsledek vícerozměrný - potom: analýza užitečnosti vynaložených nákladů. • Pokud je třeba, aby rovnice náklady-prospěch u jednoho stavu byla porovnána s rovnicemi náklady-prospěch u odlišných zdravotních stavů - potom: analýza návratnosti nákladů. • Pokud by analýza návratnosti nákladů byla jinak vhodná, ale preferenční hodnoty pro různé zdravotní stavy jsou předmětem sporu nebo je pravděpodobné, že se změní - potom: analýza nákladů a následků. 6. Jak byly zjišťovány náklady a prospěch? 7. Byl porovnáván spíše přírůstek prospěchu než absolutní prospěch? 8. Byla dána přednost zdravotnímu stavu „tady a teď" před zdravotním stavem ve vzdálené budoucnosti? 9. Byla provedena analýza senzitivity? 10. Byla nadměrně užívána „souhrnná" sloučená skóre? Kontrolní seznam pro publikaci pojednávající o kvalitativním výzkumu 1. Popsal článek důležitý klinický problém zkoumaný prostřednictvím jasně formulované otázky? 2. Byl kvalitativní přístup vhodný? 3. Jak bylo vybráno (a) uspořádání a (b) subjekty? 4. Jaký byl výzkumníkův pohled na věc a byl vzat v úvahu? 5. Jaké metody výzkumník použil pro sběr údajů a jsou popsány dostatečně podrobně? 6. Jaké byly použity metody k analýze údajů a jaké parametry kontroly kvality? 7. Jsou výsledky věrohodné a pokud ano, jsou klinicky důležité? 8. Jaké závěry byly vyvozeny a jsou oprávněné vzhledem k výsledkům? 9. Jsou zjištění studie přenositelná do jiných klinických uspořádání? Kontrolní seznam pro zdravotní organizace pracující směrem ke kultuře zakládání si na důkazech. Pro klinická a investiční rozhodnutí 1. Vedení. Jak často byly informace o účinnosti nebo o medicíně založené na důkazech probírány na schůzích příslušné komise v posledních 12 měsících? Vyhradila si komise čas na zjišťování vývoje klinické a nákladové efektivnosti? 2. Investice. Jaké zdroje organizace využívá na vyhledávání a využívání informací o klinické efektivnosti? Je nějaký plánovaný přístup podporující medicínu založenou na důkazech a je také řádně finančně a personálně zajištěn? 732 3. Využití dostupných zdrojů. Co organizace podnikla v odpověď na oficiální směrnice vyžadující organizační podporu praxe založené na důkazech? Co se v organizaci změnilo jakožto výsledek? 4. Začleňování důkazů do praxe. Kdo je zodpovědný za přijímání zpravodajů o efektivní zdravotní péči (angl. Effective Health Care bulletins), za jednání podle nich a za průběžné sledování jejich využívání v praxi? Co se až dosud podniklo podle jednotlivých čísel těchto zpravodajů? 5. Klinická oficiální doporučení. Kdo je zodpovědný za přijímání oficiálních doporučení, za jednání podle nich a za průběžné sledování jejich využívání v praxi? Zajišťují podniknutá opatření, že řídící pracovníci i klinikové hrají svou roli při vývoji odborných doporučení a jejich uvádění do praxe? 6. Výcvik. Dostává personál (klinický i neklinický) nějaký výcvik uvnitř organizace v posuzování a používání důkazů o efektivnosti s cílem ovlivňovat klinickou praxi? 7. Smluvní vztahy. Jak často tvoří informace o klinické a nákladové efektivnosti důležitou součást smluvních vyjednávání a dohod? Kolik smluv obsahuje pojmy ukazující, jak se mají používat informace o efektivnosti? 8. Zainteresovanost. Jaká existuje zainteresovanost - jednotlivců i celé organizace - pro povzbuzení k provádění medicíny založené na důkazech? Jaké brzdy existují k odrazování od nevhodné praxe a neoprávněné rozmanitosti v klinickém rozhodování? 9. Informační systémy. Jsou plně využívány možnosti informačních systémů k soustavnému sledování klinické efektivnosti? Probíhá obchodní jednání ohledně nového informačního systému, aby se vyhovělo potřebě sledovat klinickou efektivnost, a je otázka tohoto sledování vzata v úvahu při rozhodování o nákupu informační technologie? 10. Klinický audit. Je v rámci celé organizace prováděn klinický audit schopný řešit otázky klinické efektivnosti a navodit v praxi vhodné změny? Literatura: =*■ Janout V. : Klinická epidemiologie - nedílná součást klinických rozhodovacích procesu, GRADA Publishing, 1998 =*■ Greenhalgh T.: Jak pracovat s vědeckou publikací. Základy medicíny založené na důkazu, GRADA Publishing, 2003 => 3. Sackett D.L., Haynes R.B., Guyatt GH., Tugwell R: Clinical epidemiology a basic science for clinical medicine, Little,Brown and Company, 1991 => 4. Brownson R.C., Baker E.A., Leet T.L., Gillespie K.N.: Evidence - Based Public Health, Oxford university press, 200388,7 733 POZNÁMKY Prof. MUDr. Kamil Provazník, CSc. Doc. MUDr. Lumír Komárek, CSc. MANUÁL PREVENCE V LÉKAŘSKÉ PRAXI Souborné vydání Obálku navrhl Jiří Sušanka Vydala Univerzita Karlova - 3. lékařská fakulta ve spolupráci se Státním zdravotním ústavem Praha a MSMT v rámci Národního programu podpory zdraví jako svůj náklad v nakladatelství Fortuna, JUDr. František Talián, Ostrovní 30, 110 00 Praha 1 Sazba Fortuna-Type, s. r. o., Ostrovní 30, 110 00 Praha 1 Vytiskla Šerifa, s. r. o., Jinonická 80, 150 00 Praha 5 Počet stran 736 První vydání Neprodejné SZM3 ISBN 80-7168-942-4