logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Pozice statistické analýzy ve vědě a klinické praxi Význam statistických výstupů I. Statistika ve vědecké praxi logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Anotace —Statistická analýza biologických dat je jedním z nástrojů, s jejichž pomocí se snažíme zjistit odpovědi na naše otázky týkající se pochopení živé přírody. Jako každý nástroj je i statistickou analýzu nezbytné na jedné straně korektně využívat a na druhou stranu nepřeceňovat její možnosti. —Klíčovým faktem při statistické analýze dat je nahlížení na realitu prostřednictvím vzorku a přijmutí toho, že výsledky naší analýzy jsou jen tak dobré, jak dobrý je náš vzorek. Reprezentativnost a náhodnost vzorku spolu s jeho velikostí jsou důležité faktory ovlivňující věrohodnost našich závěrů. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Výzkum, realita, statistika —Výzkum je naším způsobem porozumění realitě —Ale jak přesné a pravdivé je naše porozumění? Statistika je jedním z nástrojů vnášejících do našich výsledků určitou spolehlivost. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Význam variability —Naše realita je variabilní a statistika je vědou zabývající se variabilitou —Korektní analýza variabilita a její pochopení přináší užitečné informace o naší realitě —V případě deterministického světa by statistická analýza nebyla potřebná logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Data 2,1 2,8 3,2 1,2 5,2 2,9 Variabilita opakovaných měření rozptyl znaku, přirozená variabilita 165 cm 140 cm 182 cm 163 cm Variabilita znaku v populaci chyba = nepřesnost modelu Variabilita modelovaných dat Variabilita časových řad Variabilita ve skladbě biologických společenstev DRUH 1 DRUH 2 DRUH 3 DRUH 4 15 30 40 14 biodiverzita fluktuace, časová proměnlivost chyba y x y čas Biostatistika - různé přístupy k variabilitě logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek …. a ty určují přístup k jejímu hodnocení Maskování a minimalizace vlivu Respektování a odhadování vlivu Přímé využití k predikcím chování systému Pojem VARIABILITA má mnoho významů ……… logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Statistika – význam a definice WWW.WIKIPEDIA.ORG: Statistika je matematickou vědou zabývající se shromážděním, analýzou, interpretací, vysvětlením a prezentací dat. Může být aplikována v širokém spektru vědeckých disciplín od přírodních až po sociální vědy. Statistika je využívána i jako podklad pro rozhodování, kdy nicméně může být záměrně i nevědomky zneužita. Statistika využívá matematické modely reality k zobecnění výsledků experimentů a vzorkování. Statistika funguje korektně pouze pokud jsou splněny předpoklady jejích metod a modelů. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Co může statistika říci o naší realitě? Možnosti Realita Vzorek Data Informace Znalost Pochopení Statistika Statistika je nasazena v procesu získání informací z vzorkovaných dat a je podporou v získání naší znalosti a pochopení problému. Statistika není schopna činit závěry o jevech neobsažených v našem vzorku. Statistika není náhradou naší inteligence !!! logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Cílová populace —Cílová populace – klíčový pojem statistického zpracování ¡Skupina objektů o nichž se chceme něco dozvědět (např. pacienti s danou diagnózou, všichni lidé nad 60 let, měření hemoglobinu v dané laboratoři) ¡Musí být definována ještě před zahájením sběru dat ¡Na cílové populaci probíhá vzorkování dat, které musí cílovou populaci dobře (reprezentativně) charakterizovat Cílová populace Klíčové faktory cílové populace Design experimentu a vzorkovací plán Vzorkování a analýza dat logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Statistika a zobecnění výsledků —Cílem analýzy není pouhý popis a analýza vzorku, ale zobecnění výsledků ze vzorku na jeho cílovou populaci —Pokud vzorek nereprezentuje cílovou populaci, vede zobecnění k chybným závěrům Neznámá cílová populace X, Y, Z Díky zobecnění výsledků známe vlastnosti cílové populace Vzorek Analýza logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vzorkování a jeho význam ve statistice —Statistika hovoří o realitě prostřednictvím vzorku!!! ¡Statistické předpoklady korektního vzorkování Representativnost: struktura vzorku musí maximálně reflektovat realitu Nezávislost: několikanásobné vzorkování téhož objektu nepřináší ze statistického hlediska žádnou novou informaci logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Velikost vzorku a přesnost statistických výstupů Existuje skutečné rozložení a skutečný průměr měřené proměnné Z jednoho měření nezjistíme nic Vzorek: ????? Vzorek určité velikosti poskytuje odhad reálné hodnoty s definovanou spolehlivostí Vzorek: Odhad průměru atd. Vzorkování všech existujících objektů poskytne skutečnou hodnotu dané popisné statistiky, nicméně tento přístup je ve většině případech nereálný. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Malá data Velká data Obrovská data Umění uchopit Umění prodat Umění pochopit Různá role statistiky při různě velkém vzorku logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Data Schopnost: vidět data – komunikovat – interpretovat - prodávat Přístup biostatistiky logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek VÝSLEDKY cílová populace výběr dle optimálního plánu reprezentativní vzorek n jedinců (faktor F) měření znaku variabilita hodnot ve výběrovém souboru ? Účel analýzy: Popisný … analyzovaný znak cílové populace (X) … jiný významný faktor charakterizující cílovou populaci (F) Reprezentativnost Přesnost Spolehlivost ? Experimentální design: nezbytná výbava biologa logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek VÝSLEDKY cílová populace výběr subjektů pro vstup do hodnocení / studie RANDOMIZACE vzájemně srovnatelné vzorky (faktor F) měření znaku X variabilita hodnot X v rameni A ? Účel analýzy: Srovnávací (2 ramena) … analyzovaný znak cílové populace (X) … jiný významný faktor charakterizující cílovou populaci (F) variabilita hodnot X v rameni B rameno A rameno B Srovnatelnost Přesnost Spolehlivost ? Experimentální design: nezbytná výbava biologa logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Praktická a statistická významnost —Samotná statistická významnost nemá žádný reálný význam, je pouze měřítkem náhodnosti hodnoceného jevu —Pro vyhodnocení reálné významnosti je nezbytné znát i reálně významné hodnoty Praktická významnost ANO NE ANO OK, praktická i statistická významnost je ve shodě, jednoznačný závěr Významný výsledek je statistický artefakt velkého vzorku, prakticky nevyužitelné NE Výsledek může být pouhá náhoda, neprůkazný výsledek OK, praktická i statistická významnost je ve shodě, jednoznačný závěr logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Obecné schéma využití statistické analýzy Vzorkování Experimentální design Jak velký vzorek je nezbytný pro statisticky relevantní výsledky? Klíčová stratifikační kritéria cílové populace. Vzorkovací plán zabezpečující náhodnost a reprezentativnost vzorku. Uložení a management dat Uložení dat ve vhodné formě a jejich vyčištění předcházející vlastní analýze je klíčovým krokem statistické analýzy. Vizualizace dat Grafická inspekce dat je nezbytným krokem analýzy vzhledem ke schopnosti lidského mozku primárně akceptovat obrazová data. Poskytne vhled do dat, představu o jejich rozložení, vazbách proměnných apod. Popisná analýza Popisná analýza umožňuje vyhodnotit srovnáním s existující literaturou realističnost naměřených rozsahů dat. Testování hypotéz Testování vazeb mezi různými proměnnými s cílem navzájem vysvětlit jejich variabilitu a tím přispět k pochopení řešeného problému. Modelování Možným vyvrcholením analýzy je využití získaných znalostí a pochopení problému k vytvoření prediktivních modelů. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Prospektivně – modelově - postihuje chování jevů při respektování variability Stochastické modelování: predikce neurčitých jevů logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Osa X Parametr nebo kombinace parametrů Data konkrétních pacientů (subjektů) k přímému hodnocení Stochastické modelování: predikce neurčitých jevů logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Schopnost: vytvářet prakticky využitelné nástroje Stochastické modelování: predikce neurčitých jevů logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Klíčový význam korektního uložení získaných dat Pravidla pro ukládání dat Čištění dat před analýzou II. Příprava dat logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Anotace —Současná statistická analýza se neobejde bez zpracování dat pomocí statistických software. Předpokladem úspěchu je správné uložení dat ve formě „databázové“ tabulky umožňující jejich zpracování v libovolné aplikaci. —Neméně důležité je věnovat pozornost čištění dat předcházející vlastní analýze. Každá chyba, která vznikne nebo není nalezeno ve fázi přípravy dat se promítne do všech dalších kroků a může zapříčinit neplatnost výsledků a nutnost opakování analýzy. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Parametry (znaky) DATA – ukázka uspořádání datového souboru logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek —Správné a přehledné uložení dat je základem jejich pozdější analýzy —Je vhodné rozmyslet si předem jak budou data ukládána —Pro počítačové zpracování dat je nezbytné ukládat data v tabulární formě —Nejvhodnějším způsobem je uložení dat ve formě databázové tabulky ¡Každý sloupec obsahuje pouze jediný typ dat, identifikovaný hlavičkou sloupce ¡Každý řádek obsahuje minimální jednotku dat (např. pacient, jedna návštěva pacienta apod.) ¡Je nepřípustné kombinovat v jednom sloupci číselné a textové hodnoty ¡Komentáře jsou uloženy v samostatných sloupcích ¡U textových dat nezbytné kontrolovat překlepy v názvech kategorií ¡Specifickým typem dat jsou datumy u nichž je nezbytné kontrolovat, zda jsou datumy uloženy v korektním formátu — —Takto uspořádaná data je v tabulkových nebo databázových programech možné převést na libovolnou výstupní tabulku —Pro základní uložení a čištění dat menšího rozsahu je možné využít aplikací MS Office Zásady pro ukládání dat logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Ukládání dat v MS Office —MS Excel :Kontingenční tabulky – rychlá sumarizace rozsáhlých tabulek :Možnost výpočtů a grafových výstupů přímo v aplikaci :Visual Basic – složitější aplikace –Omezení tabulky na 256x65536 buněk (do verze 2003) –Omezená kontrola chyb při zadávání ¡ —MS Access :Plnohodnotná databáze vhodná pro velké množství dat, řádky omezeny v podstatě jen dostupnou pamětí :Kontrola typu dat :Relace tabulek – omezení velikosti souboru :Visual Basic a formuláře – složitější aplikace –Omezení tabulky na 255 sloupců –Výpočty a grafy jsou složitější než v Excelu ¡ excel_hero access_hero logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Možnosti MS Excel — Správa a práce s tabulárními daty — Řazení dat, výběry z dat, přehledy dat — Formátování a přehledné zobrazení dat — Zobrazení dat ve formě grafů — Různé druhy výpočtů pomocí zabudovaných funkcí — Tvorba tiskových sestav — Makra – zautomatizování častých činností — Tvorba aplikací (Visual Basic for Aplications) — logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Import a export dat —Import dat ¡Manuální zadávání ¡ import – podpora importu ze starších verzí Excelu, textových souborů, databází apod. ¡ kopírování přes schránku Windows – vkládání z nejrůznějších aplikací – MS Office, Statistica atd. ¡ využití textových souborů jako kompatibilního formátu pro přenos dat mezi různými aplikacemi — —Export dat ¡Ukládáním souborů ve formátech podporovaných jinými SW, časté jsou textové soubory, dbf soubory nebo starší verze Excelu ¡Přímé kopírování přes schránku Windows — logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Tipy a triky —Výběr buněk ¡CTRL+A – výběr celého listu ¡CTRL + klepnutí myší do buňky – výběr jednotlivých buněk ¡SHIFT + klepnutí myší na jinou buňku – výběr bloku buněk ¡SHIFT + šipky – výběr sousedních buněk ve směru šipky ¡SHIFT+CTRL+END (HOME) – výběr do konce (začátku) oblasti dat v listu ¡SHIFT+CTRL+šipky – výběr souvislého řádku nebo sloupce buněk ¡SHIFT + klepnutí na objekty – výběr více objektů — Kopírování a vkládání ¡CTRL+C – zkopírování označené oblasti buněk ¡CTRL+V – vložení obsahu schránky – oblast buněk, objekt, data z jiné aplikace —Myš a okraje buňky ¡Chycení myší za okraj umožňuje přesun buňky nebo bloku buněk ¡ ¡ ¡ ¡ ¡Při chycení čtverečku v pravém dolním rohu výběru je tažením možno vyplnit více buněk hodnotami původní buňky (ve vzorcích se mění relativní odkazy, je také možné vyplnění hodnotami ze seznamu – např. po sobě jsoucí názvy měsíců. ¡ logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Databázová struktura dat v Excelu Jednotlivé záznamy (taxon, lokalita atd.) Sloupce tabulky = parametry záznamů, hlavička udává obsah sloupce – stejný údaj v celém sloupci logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Automatický zadávací formulář —Slouží k usnadnění zadávání dat do databázových tabulek —Načítá automaticky hlavičky sloupců jako zadávané položky Názvy sloupců Obsah dané buňky - editovatelný Nový záznam Vyhledávání logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Automatické seznamy —Vytváří se z hodnot buněk v daném sloupci a umožňují vložit hodnotu výběrem ze seznamu již zadaných hodnot – usnadnění zadávání — Sloupec z nějž je seznam vytvořen a pro který platí Buňka, do níž se vloží vybraná hodnota logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Automatická kontrola dat —Umožňuje ověřit typ, rozsah nebo povolit pouze určitý seznam hodnot zadávaných do sloupce databázové tabulky Co je povoleno – definiční obory čísel, seznamy, vzorce atd. Rozsahy hodnot, načtení seznamů apod. komunikace s uživatelem logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Seznamy —Skupiny hodnot zachovávající logické pořadí, některé jsou zabudované (např. dny v týdnu, měsíce v roce), další je možné uživatelsky vytvořit, slouží pro účely řazení a automatického vyplňování dat moznosti1 Výběr buněk pro nový seznam Načtení nového seznamu Existující seznamy logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Řazení dat —Řazení dat je nejjednodušším způsobem jejich zpřehlednění, užitečným hlavně u menších/výsledkových tabulek — ¡ Zkontrolujte, zda seřazení nezničí vazby mezi buňkami = kontrola oblasti, kterou řadíte. ¡ Využít první řádek oblasti jako záhlaví Další možnosti – řazení řádků, řazení podle seznamu Podle čeho řadit Směr řazení – vzestupně, sestupně logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Automatický filtr —Pomocí automatického filtru je snadné vybírat úseky dat pro další zpracování na základě hodnot ve sloupcích databázové tabulky, výběr je možný i podle více sloupců (např. určitá skupina pacientů) —Funkce automaticky rozezná hlavičky sloupců v souvislé oblasti buněk —U sloupců použitých pro filtraci jsou rozbalovací seznamy zbarveny modře —Výhodné pro čištění dat (vyhledávání překlepů, kombinace textu a čísel) Výběr hodnot pro filtraci Rozbalení seznamu hodnot nalezených ve sloupci logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Typy grafické vizualizace Rizika desinterpretace grafického zobrazení dat III. Vizualizace dat logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Anotace —Prvním krokem v analýze dat je jejich vizualizace. Různé typy dat nám umožňující získání představy o rozložení dat, zastoupení kategorií i vztazích proměnných navzájem. Prostřednictvím vizualizace získáváme vhled do dat a začínáme vytvářet hypotézy o zákonitostech panujících mezi proměnnými v hodnoceném souboru dat. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 1. Výskyt kategorií (1, 2, 3,) Koláčový (výsečový) graf 2. Vývoj hodnot (v čase) Y vs. X (t) % Y Y Y Sloupcový graf 0 20 40 1 2 3 Řada2 Bodový graf 0 15 30 0 5 10 15 20 25 X Plošný graf 0 15 30 1 2 3 10 20 X Řada2 30% 40% 30% 1 2 3 30% 30% 40% 1 2 3 Sloupcový graf 0 50 100 1 2 3 Řada2 Spojnicový graf 0 15 30 1 2 3 10 20 X Řada Řada Grafická prezentace dat - umění komunikace logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 3. Vztahy mezi proměnnými - korelace 0 15 30 1 2 3 10 20 X2 Řada2 X1 0 15 30 0 5 10 15 20 25 X2 Řada2 X1 0 15 30 1 2 3 10 20 X2 Řada2 X1 0 15 30 1 2 3 10 20 X2 Řada2 X1 Bodový - korelační diagram AGE LN_CRP CD56 CD57 CD80 Bodový - korelační diagram Grafická prezentace dat - umění komunikace logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 4. Kvantitativní hodnoty parametru(ů) - X - v rámci kategorií A, B, C Sloupcový graf Krabicový graf X 0 20 40 A B C Řada2 0 50 100 A B C Řada2 X 0 50 100 A B C Řada2 X 0 2 4 6 8 10 12 14 16 18 20 22 -2 -1 0 1 2 3 4 5 6 7 8 9 10 11 12 0 5 10 15 20 25 30 35 40 -50 0 50 100 150 200 250 300 0 1 2 3 4 5 6 7 8 9 0 50 100 150 5. Histogram Grafická prezentace dat - umění komunikace logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 6. Zviditelnění primárních dat n x1 x2 x3 Grafická prezentace dat - umění komunikace logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 7. Vztahy mezi proměnnými - interakce dvou parametrů, reakční plochy Grafická prezentace dat - umění komunikace logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek 8. Grafické zviditelnění má nekonečně mnoho možností Grafická prezentace dat - umění komunikace logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Nesprávné užití grafů: problém rozsahu číselné osy logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Nesprávné užití grafů: problém standardizace hodnot logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Grafy zaměřené na vícerozměrné soubory dokáží zviditelnit i veliké soubory dat ksichty logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Jak vznikají informace Rozložení dat IV. Teoretické pozadí statistické analýzy logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Anotace —Základním principem statistiky je pravděpodobnost výskytu nějaké události. Prostřednictvím vzorkování se snažíme odhadnout skutečnou pravděpodobnost událostí.Klíčovou otázkou je velikost vzorku, čím větší vzorek, tím větší šance na projevení se skutečné pravděpodobnosti výskytu jevu. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek JAK vznikají informace ? základní pojmy Skutečnost Náhoda (vybere jednu z možností pokusu) Jev podmnožina všech možných výsledků pokusu/děje, o které lze říct, zda nastala nebo ne Pozorovatel Rozliší, co nastalo a) podle možností b) podle toho, jak potřebuje Jevové pole třída všech jevů, které jsme se rozhodli nebo jsme schopni sledovat Skutečnost + Jevové pole = Měřitelný prostor Experimentální jednotka - objekt, na kterém se provádí šetření Populace - soubor experimentálních jednotek Znak - vlastnost sledovaná na objektu Sledovaná veličina - číselná hodnota vyjadřující výsledek náhodného experimentu Znak se stává náhodnou veličinou, pokud se jeho hodnota zjišťuje vylosováním objektu ze základního souboru Výběr - výběrová populace - cílová populace Náhodný výběr Reprezentativnost logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek JAK vznikají informace ? „Empirical approach“ „Classical approach“ Empirický postup možné jevy: čísla 1 – 6 n – počet hodů (opakování) f n n = 10 f n n = 50 f n n = ¥ U složitých stochastických systémů se pravda získá až po odvedení značného množství experimentální práce: musíme dát systému šanci se projevit logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek JAK vznikají informace ? Empirický postup možné jevy: čísla 1 – 6 n – počet hodů (opakování) f n n = 10 f n n = 50 f n n = ¥ Při realizaci náhodného experimentu roste se zvyšujícím se počtem opakování pravdivá znalost systému (výsledky se stávají stabilnější) …. diskutabilní je ale ovšem míra zobecnění konkrétního experimentu logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Empirický zákon velkých čísel Při opětovné nezávislé realizaci téhož náhodného experimentu se podíl výskytů sledovaného jevu mezi všemi dosud provedenými realizacemi zpravidla ustaluje kolem konstanty. Pravděpodobnost je libovolná reálná funkce definovaná na jevovém poli A, která každému jevu A přiřadí nezáporné reálné číslo P(A) z intervalu 0 - 1. .A .B .C .D A P(A) 0 1 Z praktického hlediska je pravděpodobnost idealizovaná relativní četnost P (A) = 1 …………………………… jev jistý P (A) = 0 …………………………… jev nemožný P (A Ç B) = P (A) . P (B/A) …..……závislé jevy P (A Ç B) = P (A) . P (B)…………. nezávislé jevy P (A / B) = P (A Ç B) / P (B) ……….podmíněná pravděpodobnost logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek Pravděpodobnost výskytu jevu – rozložení dat „vše je možné“: pouze jev s pravděpodobností 0 nikdy nenastane existuje pravděpodobnost výskytu jevů (nedeterministické závěry) 0 pravděpodobnost výskytu x 1 počet chlapců v rodině s X dětmi 2 3 4 5 j(x) x výška postavy plocha = pravděpodobnost výskytu pravděpodobnost lze zkoumat retrospektivně i prospektivně