SEMINÁRNÍ PRÁCE – SROVNÁNÍ PŮVODNÍ STUDIE A JEJÍ MEDIÁLNÍ PREZENTACE Statistická analýza dat - PSY717 Petr Adámek 430728 kombinované studium PSY-GEN 2. ročník Vyučující: Mgr. Stanislav Ježek, Ph.D, Mgr. Jan Širůček, Ph.D., Mgr. Pavol Hašan, Ph.D, Mgr. et Mgr. Jan Šerek, Ph.D Datum odevzdání: 1. 5. 2015 Fakulta sociálních studií MU, 2014-2015, jarní semestr Úvod Pro srovnání jsem zvolil článek „Přemíra pohybu škodí stejně jako sedavý život“ (2015) ze serveru lidovky.cz, který se odkazuje na studii „Dose of Jogging and Long-Term Mortality : The Copenhagen City Heart Study“ (Schnohr, Keefe, Marott, Lange & Jensen, 2015). Tento výběr jsem udělal ze dvou důvodů. Chtěl jsem se zaměřit na článek ze seriózního, ale populárního a čteného periodika, což lidovky.cz splňují, ale zároveň jsem zjistil, že tyto popularizující články (i na jiných serverech) originální zdroje necitují. Studii jsem tak dokázal nalézt pouze proto, že je v článku zmíněno jméno autora a že mám přístup do elektronických databází přes Masarykovu univerzitu. Tento fakt limitoval můj výběr, často se články na studie odkazují, ale je zhola nemožné původní zdroj nalézt[SJ1] . Pro běžného čtenáře je nemožné se k původnímu zdroji dobrat. Lidovky.cz navíc v záhlaví článku uvádí, že čerpají z jiných novin (konkrétně italský deník La Repubblica), jde tedy o jakousi „sekundární citaci[SJ2] “. Původní studie Schnohr et al. (2015) analyzují vztah mezi joggingem (tedy „běháním pro zdraví“) a úmrtností. Vychází z dřívějších studií, které naznačují spojitost mezi sportováním a delší dobou dožití, ale které neřeší to, jaká je ideální porce fyzických aktivit pro prodloužení života. To se stalo i jejich výzkumnou otázkou. Autoři chtěli zjistit, jaký je vztah mezi joggingem a úmrtností v dlouhodobém horizontu při porovnání těch, kteří aktivně sportují a těch, kteří žijí sedavým způsobem života. Speciálně se zaměřili na vliv tempa, objemu a frekvence joggingu. Schnohr et al. použili náhodný vzorek očištěný o ty, kteří měli srdeční problémy, mrtvici a rakovinu. Zkoumali tak 1098 zdravých osob (mužů i žen) věnujících se běhání a 3950 osob, které byly také zdravé, ale nesportovaly. Míra fyzické aktivity byla měřena dotazníkem a výsledky byly seřazeny do čtyř kategorií, od nízké nebo žádné fyzické aktivity až po vysokou, na úrovni aktivních registrovaných sportovců. Běhající byli rozděleni podle tempa, objemu a frekvence běhání. Všichni byli sledováni od prvních vyšetření v roce 2001 (resp. 2003) až do dubna 2013. Dále byla sledována míra kouření, míra pití alkoholu a různé další fyzické parametry (například systolický a diastolický tlak). Tyto údaje byly přepočteny do „míry hazardu“ (hazard ratio[SJ3] ). Vstupní data Schnohr et al. prezentují ve dvou přehledných tabulkách. Data byla zpracována statistickou metodou „analýza přežívání“ (survival analysis), konkrétně Coxovou metodou spadající pod „modely proporcionálního nebezpečí“ (proportional hazards models). Analýza přežívání se zaměřuje na vztah určité události a času, než událost nastane. V tomto případě jde o dobu před úmrtím osob. Výsledky jsou prezentovány „stromografem“ (forest plot či také blobbogram). Schnohr et al. v diskuzi tvrdí, že nalezli vztah mezi běháním a úmrtností ve tvaru U (U-shaped association), která se dá vykládat tak, že ti, kteří nevykonávají fyzickou aktivitu mají vyšší úmrtnost než ti, kteří běhají málo nebo středně, ale poté úmrtnost opět stoupá. Úmrtnost těch, kteří běhají hodně je tak shodná s úmrtností těch, kteří žijí sedavým způsobem života.[1] Autoři předpokládají, že je to způsobenou vysokou zátěží organismu při nadměrném běhání. Autoři uvádí, že studie je limitována tím, že informace o tom, kolik toho zkoumaní lidé naběhají byly zjišťovány pouze jednou, při prvních vyšetřeních. Ovšem zároveň se odkazují na jinou studii, která říká, že běhání je poměrně stabilní prvek v životě lidí. Dále uvádí, že kvůli charakteru studie (observační, nikoli výběrový vzorek) nemohou potvrdit kauzalitu jevu. Novinový článek V případě novinového článku zarazí především výše zmíněná absence odkazu na původní studii. Už tento fakt znamená vysokou možnost manipulace čtenářem. Úvodní věta „Je to vítězství lenochů.“ pak v podstatě lže, míra úmrtnosti „lenochů“ je nejvyšší, příliš aktivní sportovci je nakonec akorát doženou. Pro prodloužení článku je bez uvedení zdroje přepsán celý odstavec „Nejslavnějším příkladem ...“. Samotná čísla [SJ4] ohledně počtu sledovaných osob a počtu úmrtí jsou správně[SJ5] . Správně je i uvedena optimální míra fyzické aktivity, jde opět o překlady výsledků původní studie. Tím je ovšem veškerá prezentace ukončena. Nejsou zmíněny nedostatky původní studie (diskuze), není zmíněn způsob výpočtu [SJ6] (konstrukce proměnných), není uveden způsob výběru sledovaných osob. V textu není použito žádné grafické zobrazení výsledků, jedná se o holý text. Závěr Přestože je článek psaný neseriózním způsobem, v podstatě korektně prezentuje závěry studie. Používá ale novinářskou zkratku, která zamlčuje podstatné okolnosti, které k výsledkům vedly. A navíc neexistuje reálná šance, jak předkládaná tvrzení ověřit. Literatura: Schnohr, P., O’Keefe, J. H., Marott, J. L., Lange, P., & Jensen, G. B. (2015). Original Investigation: Dose of Jogging and Long-Term Mortality. The Copenhagen City Heart Study. Journal Of The American College Of Cardiology, 65411-419. doi:10.1016/j.jacc.2014.11.023 Lidovky.cz, ČTK (2015). Přemíra pohybu škodí stejně jako sedavý život, zjistili dánští vědci. Lidovky.cz. 5.4.2015. Dostupné z http://relax.lidovky.cz/premira-pohybu-skodi-stejne-jako-sedavy-zivot-zjistili-dansti-vedci-1im-/zd ravi.aspx?c=A150404_203249_ln-zdravi_ele ________________________________ [1]pro zajímavost – v tomto ohledu je ideální běhat třikrát týdně, přibližně rychlostí 11,26 km za hodinu a uběhnout týdně 9,65 km ________________________________ [SJ1]Pro běžného čtenáře, ale často i novináře je to také velký problém. [SJ2]Bohužel častá praxe – žurnalistická verze tiché pošty. [SJ3]Ne tak docela. Hazard ratio je určitým způsobem vyjádřený poměr mezi rizikem úmrtí v různých skupinách, zde tedy mezi různými kategoriemi běžců a neběžci. Právě tato statistika nese informaci o efektu běhání a měla by být čtenáři v nějaké podobě komunikována. [SJ4]Po PSY717 už byste je měl nazývat přesněji – zde třeba „statistiky“. [SJ5]V jakém smyslu správně? Já bych nepovažoval za „správně“ žádné sdělení statistiky, které ani nenaznačí, jak velkou chybou by statistika mohla být zatížena. Jak znám Coxovu regresi, je velmi náročná na velikost vzorku a ty „hazard ratios“ mají obvykle dost široké intervaly spolehlivosti (..jsou v tom forest plotu…). Vím, že tohle není nijak jednoduchá metoda na porozumění a vy jste se s tím popasoval celkem dobře. Pořád je ale lepší napsat, že míra nejistoty nebyla uvedena (když bych třeba sám nevěděl, jak to udělat). [SJ6]Tohle by se do lidovek vpravovalo obtížně.