Zamyšlení nad komunikováním statistiky v médiích: "Vědci našli recept na dobré manželství: malý věkový rozdíl" Statistická analýza dat (PSY117) Jiří Motýl 363642, FSS B-PS PS1 Garant předmětu: Mgr. Stanislav Ježek, Ph.D. Datum odevzdání: 1. 5. 2010 Fakulta sociálních studií MU, 2009/10 Pro svou práci jsem si vybral článek „Vědci našli recept na dobré manželství: malý věkový rozdíl“ od Jana Rybáře, který vyšel 16. července 2009 na zpravodajském serveru iDnes.cz. Tento popularizační článek srovnám s původní studií „What’s love got to do with it?“ od kolektivu autorů: Kippen, Chapman a Yu. Původní studie, která vyšla v červenci 2009, zkoumá na vzorku 2482 sezdaných párů z Austrálie faktory, které mohou ovlivnit rozpad jednotlivých manželství. Data pro danou studii byla získána z dotazníkového šetření HILDA (The Household, Income and Labour Dynamics in Australia Survey), které probíhá pravidelně od roku 2001 na území Austrálie. Z tohoto souboru byla vybrána data párů, které splňovaly kritéria pro studii: byly v první vlně sběru dat vzájemně oddány. Následně se vyhodnocoval možný vliv rozličných proměnných na případný vývoj vztahu (rozvod, trvalé odloučení) při sedmé vlně sběru dat HILDA. Autor Jan Rybář se ve svém popularizačním článku dopouští již v úvodu klasických přehnaných vyjádření, která jen velmi slabě odpovídají závěrům studie. Za prvé studie nikde nezmiňuje, že pro klidné manželství nestačí pouze velká láska. Studie jen vyhodnocuje, jak jsou které proměnné pro manželství rizikové – mohou zvyšovat šanci na rozvod. To jsou však drobné detaily, které nás mají přivést k přečtení článku a nechci jim věnovat zbytečnou pozornost. Jan Rybář se ale ve svém příspěvku dopouští dalších několika závažnějších nepřesností. Za tu zřejmě největší by se dalo považovat opomenutí dvou modelů, které studie pro zpracování dat používá. V Modelu 1 je do dat započítána proměnná spokojenost se vztahem a proměnná spokojenost se životem, zatímco v Modelu 2 jsou tyto proměnné ze zpracování dat vypuštěny, protože autoři zmiňují jejich možnou kovariance s ostatními proměnnými. Pro zpracování dat a zjištění procenta nebezpečí rozvodu byl autory původní studie zvolen Coxův regresní model, načež byla ještě pro každou proměnnou spočítána hladina statistické významnosti její nulové hypotézy. Pokud byla hladina nižší než 5%, byly dané hodnoty proměnné brány jakožto signifikantní. V původní studii se ukázalo, že po nezapočítání výše zmíněných „satisfakčních“ proměnných (Model 2), se hladina p-value u některých proměnných zvýšila a již nemohly být v Modelu 2 výsledky brány statisticky stejně průkazně jako u Modelu 1. Jedním z takto v Modelu 2 nejednoznačných výsledků je Janem Rybářem zmiňovaný věkový rozdíl manželů. Výsledky, které uvádí, jsou průkazné pouze u modelu 1. Po nezapočítání satisfakce ze života a vztahu se již ale tak nezpochybnitelné nejeví. Dále by bylo také vhodné uvést hodnoty, z kterých se pravděpodobnost rozpadu vztahu zvyšuje. Jan Rybář pouze uvádí, že pravděpodobnost rozpadu vztahu vzrůstá o 53%, pokud je muž o 2 a více roků mladší než manželka. Původní pravděpodobnost, která tedy narůstá o 53%, ale autor článku neuvádí. Ve studii můžeme dohledat, že tato původní pravděpodobnost je 9,5% na 1463 párů. Pravděpodobnost rozvodu tedy v tomto případě vzrostla na zhruba 14,5%. [B1] Další rozporuplnou informaci přináší Jan Rybář hned v zápětí: „Obdobná statistická hrozba se nad manželi vznáší tehdy, pokud je ženich o devět či více let starší.“ Studie v Modelu 1 uvádí, že v tomto případě se pravděpodobnost rozvodu zvýší o 124%. Rozdíl mezi zvýšením pravděpodobnosti o 53% nebo o 124% se za „obdobný“ dá označit pouze při poměrně velké generalizaci hodnot. V článku píše Jan Rybář též o významu zážitků z dětství, zda jedinec vyrůstal v ucelené rodině, či nikoliv. Daná procenta studie sice uvádí, ale jedná se jen o data z dotazníku HILDA. Coxův regresní model ukazuje ve studii jakožto průkaznou na zvýšení rizika rozvodu pouze proměnnou: „mužovi rodiče rozvedeni, ženini ne“. V odstavci o penězích se pak setkáváme opět s problémem opomenutí obou dvou modelů, kdy původní studie prokazuje signifikantní vliv chudoby jako rizikového faktoru pouze u Modelu 2. Dlouhodobá nezaměstnanost manžela se ale ukazuje jakožto signifikantní u obou dvou modelů, zde tedy Jan Rybář nic nepřesného neuvádí. Několik prohřešků obsahuje v popularizačním článku Jana Rybáře ještě infobox „Na čem také záleží“. Především z informací ve studii vyplývá, že pokud se muž ožení před 25. rokem života, tak pravděpodobnost rozvodu není dvakrát větší (tedy nárůst o 100%), ale je větší o 50%. Dále by pro lepší informovanost čtenářů bylo opět od autora článku prospěšné, pokud by uvedl hodnoty, ze kterých se pravděpodobnost zvyšuje, jak již jsem uváděl u věkového rozdílu manželů. Zbylé statistiky a výsledky výzkumu, jako například vliv kouření či vztahu k rodičovství na riziko rozpadu manželství, jsou v článku již uváděny víceméně přesně, i když i u nich by se jistě dalo nalézt několik návrhů na vylepšení. Celkově se mi ale článek Jan Rybáře zdá až na několik větších nepřesností jako jeden z méně problematicky napsaných. Nutno ale ještě dodat, že autor článku si vybral z dané studie pouze několik proměnných a nepopsal tak zdaleka studii celou. Literatura · Kippen, R., Chapman, B., Yu, P. (2009). What’s love got to do with it? Homogamy and dyadic approaches to understanding marital instability. Staženo 23. 4. 2010 z http://www.datingsitesreviews.com/images/other/Kippen-Rebecca-paper.pdf · Rybář, J. (2009, 16. 7.). Vědci našli recept na dobré manželství: malý věkový rozdíl. iDnes.cz. Staženo 23. 4. 2010 z http://zpravy.idnes.cz/vedci-nasli-recept-na-dobre-manzelstvi-maly-vekovy-rozdil-p3r-/vedatech.asp? c=A090715_214508_vedatech_anv ________________________________ [B1] Ok, stále tam trochu chýba štatistická indukcia - parametre v populácií, konfidenčné intervaly a pod. To boli hlavné veci, na ktoré sa trebalo sústrediť.