logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Klíčový význam korektního uložení získaných dat Pravidla pro ukládání dat Čištění dat před analýzou I. Příprava dat logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Anotace —Současná statistická analýza se neobejde bez zpracování dat pomocí statistických software. Předpokladem úspěchu je správné uložení dat ve formě „databázové“ tabulky umožňující jejich zpracování v libovolné aplikaci. —Neméně důležité je věnovat pozornost čištění dat předcházející vlastní analýze. Každá chyba, která vznikne nebo není nalezena ve fázi přípravy dat se promítne do všech dalších kroků a může zapříčinit neplatnost výsledků a nutnost opakování analýzy. logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Parametry (znaky) DATA – ukázka uspořádání datového souboru logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová —Správné a přehledné uložení dat je základem jejich pozdější analýzy —Je vhodné rozmyslet si předem jak budou data ukládána —Pro počítačové zpracování dat je nezbytné ukládat data v tabulární formě —Nejvhodnějším způsobem je uložení dat ve formě databázové tabulky ¡Každý sloupec obsahuje pouze jediný typ dat, identifikovaný hlavičkou sloupce ¡Každý řádek obsahuje minimální jednotku dat (např. pacient, jedna návštěva pacienta apod.) ¡Je nepřípustné kombinovat v jednom sloupci číselné a textové hodnoty ¡Komentáře jsou uloženy v samostatných sloupcích ¡U textových dat je nezbytné kontrolovat překlepy v názvech kategorií ¡Specifickým typem dat jsou data, u nichž je nezbytné kontrolovat, zda jsou uloženy v korektním formátu — —Takto uspořádaná data je v tabulkových nebo databázových programech možné převést na libovolnou výstupní tabulku —Pro základní uložení a čištění dat menšího rozsahu je možné využít aplikací MS Office Zásady pro ukládání dat logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Možnosti MS Excel — Správa a práce s tabulárními daty — Řazení dat, výběry z dat, přehledy dat — Formátování a přehledné zobrazení dat — Zobrazení dat ve formě grafů — Různé druhy výpočtů pomocí zabudovaných funkcí — Tvorba tiskových sestav — Makra – zautomatizování častých činností — Tvorba aplikací (Visual Basic for Aplications) — logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Import a export dat —Import dat ¡Manuální zadávání ¡ import – podpora importu ze starších verzí Excelu, textových souborů, databází apod. ¡ kopírování přes schránku Windows – vkládání z nejrůznějších aplikací – MS Office, Statistica atd. ¡ využití textových souborů jako kompatibilního formátu pro přenos dat mezi různými aplikacemi — —Export dat ¡Ukládáním souborů ve formátech podporovaných jinými SW, časté jsou textové soubory, dbf soubory nebo starší verze Excelu ¡Přímé kopírování přes schránku Windows — logo-IBA —Výběr buněk ¡CTRL+HOME – přesunutí na levý horní roh tabulky ¡CTRL+END – přesunutí na pravý dolní roh tabulky ¡CTRL+A – výběr celého listu ¡CTRL + klepnutí myší do buňky – výběr jednotlivých buněk ¡SHIFT + klepnutí myší na jinou buňku – výběr bloku buněk ¡SHIFT + šipky – výběr sousedních buněk ve směru šipky ¡SHIFT+CTRL+END (HOME) – výběr do konce (začátku) oblasti dat v listu ¡SHIFT+CTRL+šipky – výběr souvislého řádku nebo sloupce buněk ¡SHIFT + klepnutí na objekty – výběr více objektů — Kopírování a vkládání ¡CTRL+C – zkopírování označené oblasti buněk ¡CTRL+V – vložení obsahu schránky – oblast buněk, objekt, data z jiné aplikace —Myš a okraje buňky ¡Chycení myší za okraj umožňuje přesun buňky nebo bloku buněk ¡ ¡ ¡Při chycení čtverečku v pravém dolním rohu výběru je tažením možno vyplnit více buněk hodnotami původní buňky (ve vzorcích se mění relativní odkazy, je také možné vyplnění hodnotami ze seznamu – např. po sobě jsoucí názvy měsíců. ¡ Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Tipy a triky logo-IBA Ukotvení příček Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová —Umožňuje ukotvení libovolných řádků a sloupců pro pohodlné vkládání a prohlížení dat v tabulce —Umožňuje číst řádky/sloupce ze začátku tabulky i po přesunutí se dále — —Záložka „Zobrazení“ → „Ukotvit příčky“ — —Nabízené možnosti: oUkotvit příčky – ukotví řádky nad označenou buňkou a sloupce vlevo od označené buňky oUkotvit horní řádek oUkotvit první sloupec o o! Ukotvení zrušíme opětovným odkliknutím možnosti ukotvení příček logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Databázová struktura dat v Excelu Jednotlivé záznamy (taxon, lokalita, pacient atd.) Sloupce tabulky = parametry záznamů, hlavička udává obsah sloupce – stejný údaj v celém sloupci logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Automatický zadávací formulář I. —Slouží k usnadnění zadávání dat do databázových tabulek —Načítá automaticky hlavičky sloupců jako zadávané položky Názvy sloupců Obsah dané buňky - editovatelný Nový záznam Vyhledávání Microsoft Office 2003 a starší logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Automatický zadávací formulář II. —Aplikaci automaticky zadávaného formuláře je nutné aktivovat ¡„Tlačítko Office“ → „Možnosti aplikace Excel“ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Automatický zadávací formulář spustíme pomocí nové ikonky na panelu nástrojů Rychlý přístup; dále stejné Microsoft Office 2007 logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Automatické seznamy —Vytváří se z hodnot buněk v daném sloupci a umožňují vložit hodnotu výběrem ze seznamu již zadaných hodnot – usnadnění zadávání — Sloupec z nějž je seznam vytvořen a pro který platí Buňka, do níž se vloží vybraná hodnota logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Automatická kontrola dat —Umožňuje ověřit typ, rozsah nebo povolit pouze určitý seznam hodnot zadávaných do sloupce databázové tabulky Co je povoleno – definiční obory čísel, seznamy, vzorce atd. Rozsahy hodnot, načtení seznamů apod. komunikace s uživatelem Microsoft Office 2007 logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Seznamy I. —Skupiny hodnot zachovávající logické pořadí, některé jsou zabudované (např. dny v týdnu, měsíce v roce), další je možné uživatelsky vytvořit, slouží pro účely řazení a automatického vyplňování dat moznosti1 Výběr buněk pro nový seznam Načtení nového seznamu Existující seznamy Microsoft Office 2003 a starší logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Seznamy II. ¡„Tlačítko Office“ → „Možnosti aplikace Excel“ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡ ¡Vlastní seznamy dále stejné (viz předchozí slide) — Microsoft Office 2007 logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Řazení dat —Řazení dat je nejjednodušším způsobem jejich zpřehlednění, užitečným hlavně u menších/výsledkových tabulek — ¡ Zkontrolujte, zda seřazení nezničí vazby mezi buňkami = kontrola oblasti, kterou řadíte. ¡ Využít první řádek oblasti jako záhlaví Další možnosti – řazení řádků, řazení podle seznamu Podle čeho řadit Směr řazení – vzestupně, sestupně logo-IBA Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová Automatický filtr —Pomocí automatického filtru je snadné vybírat úseky dat pro další zpracování na základě hodnot ve sloupcích databázové tabulky, výběr je možný i podle více sloupců (např. určitá skupina pacientů) —Funkce automaticky rozezná hlavičky sloupců v souvislé oblasti buněk —U sloupců použitých pro filtraci jsou rozbalovací seznamy zbarveny modře —Výhodné pro čištění dat (vyhledávání překlepů, kombinace textu a čísel) Výběr hodnot pro filtraci Rozbalení seznamu hodnot nalezených ve sloupci logo-IBA Automatické dokončování hodnot buněk Vytvořil Institut biostatistiky a analýz, Masarykova univerzita J. Jarkovský, L. Dušek, M. Cvanová —Vhodné pro textová pole; následně není nutné vypisovat celé slovo či slovní spojení, ale jen zvolit nabízené, již dříve použité slovo či slovní spojení —Automatické dokončování hodnot buněk je nutné nastavit ¡„Tlačítko Office“ → „Možnosti aplikace Excel“ — —