Statistika – úvod (1) oVědecky zaměření lékaři – snaha zaznamenávat, hodnotit, vysvětlovat a využít pozorované skutečnosti os proměnlivostí biologických objektů si nevěděli rady o o→ hledání trvalých a obecně platných zákonitostí o Statistika – úvod (2) o→ umožnila až aplikace metod MATEMATICÉ STATISTIKY (v lékařském výzkumu používány zejména po 2.svět.válce) o oNezbytné charakteristiky věd.výzkumu: opřesnost osprávnost ospolehlivost o o Statistika – úvod (3) oTěžiště stat.metod spočívá v oracionálním přístupu k řešení problému oplánování výzkumu osprávné interpretaci a objektivizaci závěrů o ox nejen v aritmetických operacích o o o o o Statistika– úvod (4) oVe starověku – soupis občanů, půdy + všeho, co tvořilo základ síly státu o oSTATISTIKA – prošla vývojem od pouhé registrace k analytickému hodnocení o opoč. 20.stol. → náplň STAT: hodnocení ø veličin + obohaceno o studium jejich variability o Øvypracována řada MATEMAT.MODELU Øzákladem STAT: TEORIE PRAVDĚPODOBNOSTI o → umožňuje z info získat tu složku, kt.je zákonitá + má trvalou platnost o o o Statistika – úvod (5) ověda, jejímž předmětem studia jsou výsledky HROMADNÉHO POZOROVÁNÍ → jejich sběr, analýza + využití pro rozhodování a předpovědi o o→ Hromadné jevy – např.narození, úmrtí, onemocnění, příznaky nemoci aj. o→ Průběh pokusu – mnoho nepatrných vlivů, kt.se vymykají naší kontrole o o důsledek : nepředvídatelné kolísání jednotlivých výsledků o o Statistika– úvod (6) oHromadné jevy, kt.nelze před provedením pokusu n.pozorování zcela přesně předvídat → HROMADNÉ NÁHODNÉ JEVY o oPozn.: NÁHODY nelze vyloučit, ale lze je studovat exaktními metodami o (vědecký x nevědecký výklad) o o→ Studium náhodných jevů pomáhá lépe pronikat k podstatě jevů a zákonitostem přírody o o Statistika – úvod (shrnutí 1) o→ vychází z moderní epidemiologické metody o→ zabývá se sběrem, popisem a analýzou dat o oDATA – zjištěné (naměřené) vlastnosti stat.jednotek o → hodnoty, kt.se vyznačují variabilitou (důsledek působení velkého počtu drobných náhodných vlivů) o oNÁHODA – přirozený jev, kt.lze zkoumat exaktními metodami teorie pravděpodobnosti (neodpovídá-li variabilita dat variabilitě, kt.způsobuje náhoda, pak to lze stat.metodami určit) o Statistika – úvod (shrnutí 2) o→ věda, kt.se zabývá studiem hromadných náhodných jevů oJev (v teorii pravděpodobnosti) – výsledek pokusu nebo pozorování oHromadné jevy – mohou nastat jako výsledky neomezeně opakovatelných pokusů; výsledky pozorování na rozsáhlých souborech vzájemně rovnocenných prvků (např. narození, úmrtí, symptomy nemocí atd.) oHromadné náhodné jevy – nelze předvídat výsledek (před provedením pokusu n.pozorování) Statistická úvaha oAplikace statistických metod se úzce váže na záměry a úvahy vědeckého pracovníka: deduktivní úvaha o induktivní úvaha oDeduktivní úvaha: od obecných zkušeností k jednotlivým (konkrétní) oInduktivní úvaha: od jednotlivých zkušeností k obecným. o o img14.gif Role STAT. v medicíně ovyužití na úrovni: Øpopulační – úroveň a vývoj zdrav.situace; zvažuje zdrav.stav lidí, determinanty zdraví + možnost jejich ovlivnění ØIndividuální – stanovení správné diagnózy (mnoho kvalitat.+kvantitat.údajů) + odhad prognózy léčby Etapy stat.šetření 1. 1.Plán šetření 2.Sběr dat 3.Popis a technické zpracování, tzv. deskriptivní statistika 4.Rozbor, závěry, interpretace, tzv. induktivní statistika Ad 1. Plán (1) Øujasnění problému + volba metody šetření Øpřesně definovat cíl výzkumu (vědec: kriticky prověřit x diletant. dokázat) Øzvolit vhodnou stupnici měření (nominální x pořadová x intervalová) Østanovíme určující znaky (vymezují stat.jednotku věcně, místně, časově), jimiž definujeme stat.jednotku šetření → vymezíme základní soubor ourčíme: Ømetodu výzkumu Øzpůsob výběru Øvelikost výběrového souboru Øskladbu kontrolní skupiny Ad 1. Plán (2) Øformulujeme testovanou hypotézu Øzvolíme typ statistického testu Øuvážíme, zda přínos odpovídá nákladům Øzvážíme vhodnost pilotní studie o Ad 1. Plán (3) o oPlán stat.šetření předurčuje všechny ostatní etapy + použitelnost výsledků v praxi. o o oJ.W.Goethe: o o„Kdo splete první knoflík, ten se pořádně nezapne.“ Ad 2. Sběr dat opodle rozsahu výběru a cíle → volba vhodné metody záznamu Øpracovní protokol Ødotazník – nabídnuté odpovědi n.otevřené otázky Øzáznam přímo do počítače oPozn.: u laboratorních měření – systematické chyby, náhodné chyby o u populačního šetření – přiměřený počet otázek, jednoznačná formulace, řešit neúplnost dat (zdroj možného zkreslení, např. malá návratnost) Ad 3. Popis stat.souboru (DESKRIPTIVNÍ STATISTIKA) Øsmyslem je především uspořádat (roztřídit) získané údaje + vypočítat takové ukazatele, kt.by souhrnně charakterizovaly studovaný soubor vcelku ØVýznam: popis + východisko statistického rozboru směřujícího k poznání pravidelností, souvislostí, závislostí a zákonitostí + umožňuje usuzovat z vlastností zkoumaného výběrového souboru na soubor základní Ad 4. Rozbor a závěry (STATISTICKÁ INDUKCE) ØVychází z teorie pravděpodobnosti ØZabývá se zobecněním zjištěných výsledků ØVyužívá celé řady matematických modelů (např.rozdělení nádhodné proměnné) ØUmožňuje vhodně zvolenými stat.testy ověření testované hypotézy o→ způsob třídění i volba stat.ukazatelů může podstatně ovlivnit možnosti, správnost, přínos obecných závěrů Ø ozaměříme se na 3 nejdůležitější oblasti: Øodhady neznámých parametrů pro celý soubor Øsrovnání dvou parametrů Øhodnocení závislosti dvou veličin Statistické šetření (1) Øvyčerpávající (úplné) → sledujeme všechny prvky stat.souboru Øvýběrové → vybíráme urč.část stat.jednotek → VÝBĚR, kt.podrobujeme vlastnímu stat.šetření o ousuzujeme-li induktivně z vlastností stat. Jednotek výběr.souboru na vlastnosti všech stat.jednotek → hovoříme o statistické indukci o oobjektivizuje induktivní závěry pomocí teorie pravděpodobnosti Statistické šetření (2) oZákladní soubor → souhrn prvků (osob, případů nemoci, pokusů), jejichž vlastnosti chceme poznat oVýběrový soubor → vybraná část ZS, kterou budeme skutečně testovat (měření, dotazníky, testy) o oNÁHODNÝ VÝBĚR – postup, kdy každý prvek ZS má na začátku stejnou pst, že bude vybrán do VS o Náhodný výběr Øpodmínka reprezentativnosti o opodle způsobu provedení: ØProstý náhodný výběr (losování) ØSystematický náhodný výběr (mechanický) ØStratifikovaný (oblastní) náhodný výběr ØPárový výběr (mačování) Ø oPozn.: reprezentativnost může být porušena i při sběru dat, např. Øneúplné chybějící údaje Ønevhodně zvolené otázky Ønejednoznačnost odpovědi atd. n Deskriptivní statistika (popis souboru) ØStat.třídění – rozdělení stat.souboru do skupin (tříd) podle předem určených třídících znaků; metoda třídění umožňuje zkoumat strukturu souboru + určit typ rozdělení sledovaných veličin Øtřídění jednostupňové Øtřídění vícestupňové n cíl: uspořádat + zpřehlednit velký soubor dat ØVýsledky tídění – tabulky + grafy o cíl: znázornit rozložení četnosti sledovaných znaků ØStatistické charakteristiky – zhuštěná info o celém souboru o cíl: charakterizovat sledované znaky pomoci výstižných ukazatelů 1. Třídění kvalitativních veličin o→ nelze měřit číselně x pouze klasifikovat do různých kategorií (pohlaví, věk..) ØKategorie jsou předem dány Øjde o výčet všech hodnot, kt.může veličina nabývat (barva očí – modrá, hnědá, zelená..) Ø 1.Nominální → lze vyjádřit pouze slovně, nelze seřadit 1.alternativní – existují pouze 2 varianty (kuřák x nekuřák, muž x žena) 2.množné – existují > dvě varianty (diagnózy, barva vlasů) 2.Ordinální → lze je seřadit dle kriterií o (ZŠ – SŠ – VŠ; silnýkuřák – slabý kuřák – nekuřák) o Třídění kvantitativních veličin o→ lze vyjádřit pouze číselně o 1.Diskrétní – vyjádřeny celými čísly 2.Spojité – desetinná čísla (výška, hmotnost…) oPozn.: v praxi lze spojité znaky převést na diskrétní o ØKategorie (třídy) vytváříme teprve na základě získaných dat ØDochází k redukci dat ve prospěch přehlednosti o o Vytváření intervalů o1. Rozpětí o od největší naměřené hodnoty odečtu k nejmenší o 6,59 – 3,08 = 3,51 o2. Stanovení počtu intervalů o závisí na mnoha faktorech (velikost souboru, podrobnost…); stanovíme, kolik kategorií chceme mít (5-20) o např. 10 o3. Délka intervalu o rozpětí / počet intervalů o 3,51 / 10 = 0,351 (délka jednoho intervalu) = 0,40 o pravidlo: a) okrouhlé číslo o b) ne víc deset.míst než měřená veličina o4. Hranice intervalu o počátek – od nejmenšího čísla 3,08 → 3,00 o1.int.: 3,00 – 3,39 o2.int.: 3,4 - 3,79 Pozn.: nesmí se překrývat Prezentace dat ØČetnost o kolik z naměřených hodnot spadá do jednotl.intervalů ØKumulativní četnost o součet všech předchozích intervalů ØRelativní četnost o % z celk.počtu měření ØKumulativní relativní četnost o obdoba kumulativní četnosti v % Tabulka: Vitální kapacita plic o Obrázek2.jpg Obrázek1.jpg Kvalitativní veličiny oSloupcový graf (sloupce oddělené mezerou) o o o oVýsečový graf (struktura) o o o oKartogram (regionální srovnání) php-bar-graph-3d-multi.gif O6210063.gif graf57.jpg kpie.gif kart_1_72.gif vsv_3d.jpg Kvantitativní veličiny oSloupcový graf o o oHistogram (pouze obrysy sloupců) o o o oPolygon (středy sloupců se spojí křivkou) Snímek 001.jpg Snímek 005.jpg Snímek 003.jpg Grafy znázorňující frekvenci rozložení veličiny oosa X : naměřené hodnoty sledování veličiny oosa Y : četnost (abs. nebo v %) intervalů o o oTvar rozložení četností: -Symetrické x asymetrické -Jednovrcholové x vícevrcholové -Podoba s teoretickými modely rozložení četností Statistické charakteristiky ØVyjadřujeme jimi ty vlastnosti stat.jednotek a stat.souboru jako celku, kt.považujeme za podstatné ØPoužíváme, chceme-li podat souhrnnou zhuštěnou informaci o stat.souboru + srovnat zjištěné výsledky o oStatistické charakteristiky oa) Ukazatelé polohy ob) Ukazatelé variability o Ukazatelé polohy (střední hodnoty) o→ většina hodnot, jež mohou náhodné veličiny nabývat, se kupí kolem některého pevného bodu – středu rozdělení četností, kt.charakterizuje polohu stat.souboru na číselné ose o oK nejčastěji užívaným ukazatelům polohy patří: ØAritmetický průměr ØMedián ØModus Ukazatelé variability o→ hodnoty náhodné proměnné kolísají v určitém rozmezí kolem středních hodnot (měnlivost, variabilita) o→ tyto ukazatelé kvantifikují míru tohoto kolísání tohoto kolísání (rozptýlení) o oNejběžnější ukazatelé variability: ØRozpětí ØRozptyl ØSměrodatná odchylka ØVariační koeficient o o Volba ukazatele 1. 1.Tvar rozložení (sym. X asym.) 2.Typ sledovaného znaku ØNominální: modus ØOrdinální: modus, medián, percentil ØIntervalové: medián, moudus, percentil, průměr 3. Ukazatele polohy (střední hodnoty) o1. Aritmetický průměr (ne u asym. – náchylný k extrémním hodnotám) o součet sledovaných hodnot vydělený počtem sledovaných jednotek o o2. Medián o hodnota, kt.je právě uprostřed všech pozorování seřazených podle velikosti (sudý počet – průměr 2 prostředních) o o3. Modus o hodnota s největší četností (nejčastější) o Ukazatele variability o1. Rozpětí o Xmax. – Xmin.; pro N≤10 o2. Rozptyl: průměr čtverců odchylek arit.průměru od jednotl.pozorování o3. Směrodatná odchylka: odmocněný roztpyl ØUkazatel variability udávaný ve stejných jednotkách jako sledovaný znak ØO kolik se většina hodnot sledovaného znaku odchyluje od průměru o4. Variační koeficient ØRelativní míra variability ØJaký podíl tvoří směrodat.odchylka z průměru Využití variačního koeficientu 1)Je-li v. k. >50%, pak je soubor natolik nesourodý, že nemá smysl charakterizovat ho aritmetickým průměrem. 2)Slouží ke srovnání variability 2 souborů, jejichž průměry se značně liší. o Př.: VC u mužů a žen o M: m= 4,80 s = 0,66 v. k. = 13,8% o Ž: m = 3,90 s = 0,42 v. k. = 10,8% 3)Slouží ke srovnání variability znaků uváděných v různých jednotkách. o Př.: VC, tělesná výška, hmotnost u mužů o VC: m = 4,80 l s = 0,66 v. k. = 13,8% o Výška: m = 178 cm s = 4 v. k. =2,2% o Hmotnost: m = 82 kg s = 6 v. k. = 7,3% Ukazatele variability pro asym.rozložení četností ØVariabilitu vyjadřujeme pomocí dvou kvantilů – percentilů, decilů, kvartilů ØKvantily dělí soubor uspořádaný dle velkosti na části obsahující stejný podíl z celk.počtu jednotek ØVariabilita – určení intervalu, ve kt.se pohybuje 80% (P10-P90), příp. 50% (P25-P75) oPostup: o1. Určíme hodnotu pozorování, kt.představuje 10.percentil o → DOLNÍ HRANICE INTERVALU o2. Určíme hodnotu pozorování, kt.představuje 90.percentil n → HORNÍ HRANICE INTERVALU n