INSTITUT BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita logo_mu-web IBA výuka 2008/2009 logo-IBA-transparent ANALÝZA DAT NA PC I. I. Využití aplikací MS Office pro ukládání a základní sumarizace biologických dat INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Obsah semináře u1. MS Office v analýze ekologických dat- databáze, algoritmování u u 2. Algoritmy pro ekologická data I. Charakteristika společenstev, diverzita u u3. Algoritmy pro ekologická data II. Metriky podobností a vzdáleností u u 4. Algoritmy pro ekologická data III. Valence, nika u u5. Algoritmy pro ekologická data IV. „Species-abundance“ modely, interpretace u u 6. Vícerozměrné metody v ekologii – shluková, ordinační analýza u u7. Užití diferenciálních rovnic v deterministických modelech v biologii a ekologii u MS Office funkcejaksvina INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Ukládání dat uSprávné a přehledné uložení dat je základem jejich pozdější analýzy uJe vhodné rozmyslet si předem jak budou data ukládána uPro počítačové zpracování dat je nezbytné ukládat data v tabulární formě uNejvhodnějším způsobem je uložení dat ve formě databázové tabulky uKaždý sloupec obsahuje pouze jediný typ dat, identifikovaný hlavičkou sloupce (např. rozepsané taxonomické zařazení, abundance, místo a vlastnosti odběru atd.) u u u u u u u u u uTakto uspořádaná data je v tabulkových nebo databázových programech možné převést na libovolnou výstupní tabulku u INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Ukládání dat v MS Office uMS Excel :Kontingenční tabulky – rychlá sumarizace rozsáhlých tabulek :Možnost výpočtů a grafových výstupů přímo v aplikaci :Visual Basic – složitější aplikace –Omezení tabulky na 256´65536 buněk –Omezená kontrola chyb při zadávání u uMS Access :Plnohodnotná databáze vhodná pro velké množství dat, řádky omezeny v podstatě jen dostupnou pamětí :Kontrola typu dat :Relace tabulek – omezení velikosti souboru :Visual Basic a formuláře – složitější aplikace –Omezení tabulky na 255 sloupců –Výpočty a grafy jsou složitější než v Excelu u excel_hero access_hero INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Možnosti MS Excel u Správa a práce s tabulárními daty u Řazení dat, výběry z dat, přehledy dat u Formátování a přehledné zobrazení dat u Zobrazení dat ve formě grafů u Různé druhy výpočtů pomocí zabudovaných funkcí u Tvorba tiskových sestav u Makra – zautomatizování častých činností u Tvorba aplikací (Visual Basic for Aplications) u INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Import a export dat uImport dat uManuální zadávání u import – podpora importu ze starších verzí Excelu, textových souborů, databází apod. u kopírování přes schránku Windows – vkládání z nejrůznějších aplikací – MS Office, Statistica atd. u využití textových souborů jako kompatibilního formátu pro přenos dat mezi různými aplikacemi u uExport dat uUkládáním souborů ve formátech podporovaných jinými SW, časté jsou textové soubory, dbf soubory nebo starší verze Excelu uPřímé kopírování přes schránku Windows u INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Tipy a triky uVýběr buněk uCTRL+A – výběr celého listu uCTRL + klepnutí myší do buňky – výběr jednotlivých buněk uSHIFT + klepnutí myší na jinou buňku – výběr bloku buněk uSHIFT + šipky – výběr sousedních buněk ve směru šipky uSHIFT+CTRL+END (HOME) – výběr do konce (začátku) oblasti dat v listu uSHIFT+CTRL+šipky – výběr souvislého řádku nebo sloupce buněk uSHIFT + klepnutí na objekty – výběr více objektů u Kopírování a vkládání uCTRL+C – zkopírování označené oblasti buněk uCTRL+V – vložení obsahu schránky – oblast buněk, objekt, data z jiné aplikace uMyš a okraje buňky uChycení myší za okraj umožňuje přesun buňky nebo bloku buněk u u u u uPři chycení čtverečku v pravém dolním rohu výběru je tažením možno vyplnit více buněk hodnotami původní buňky (ve vzorcích se mění relativní odkazy, je také možné vyplnění hodnotami ze seznamu – např. po sobě jsoucí názvy měsíců. u INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Databázová struktura dat v Excelu Jednotlivé záznamy (taxon, lokalita atd.) Sloupce tabulky = parametry záznamů, hlavička udává obsah sloupce – stejný údaj v celém sloupci INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Automatický zadávací formulář uSlouží k usnadnění zadávání dat do databázových tabulek uNačítá automaticky hlavičky sloupců jako zadávané položky Názvy sloupců Obsah dané buňky - editovatelný Nový záznam Vyhledávání INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Automatické seznamy uVytváří se z hodnot buněk v daném sloupci a umožňují vložit hodnotu výběrem ze seznamu již zadaných hodnot – usnadnění zadávání u Sloupec z nějž je seznam vytvořen a pro který platí Buňka, do níž se vloží vybraná hodnota INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Automatická kontrola dat uUmožňuje ověřit typ, rozsah nebo povolit pouze určitý seznam hodnot zadávaných do sloupce databázové tabulky Co je povoleno – definiční obory čísel, seznamy, vzorce atd. Rozsahy hodnot, načtení seznamů apod. komunikace s uživatelem INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Seznamy uSkupiny hodnot zachovávající logické pořadí, některé jsou zabudované (např. dny v týdnu, měsíce v roce), další je možné uživatelsky vytvořit, slouží pro účely řazení a automatického vyplňování dat moznosti1 Výběr buněk pro nový seznam Načtení nového seznamu Existující seznamy INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Řazení dat uŘazení dat je nejjednodušším způsobem jejich zpřehlednění, užitečným hlavně u menších/výsledkových tabulek u u Zkontrolujte, zda seřazení nezničí vazby mezi buňkami = kontrola oblasti, kterou řadíte. u Využít první řádek oblasti jako záhlaví Další možnosti – řazení řádků, řazení podle seznamu Podle čeho řadit Směr řazení – vzestupně, sestupně INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Automatický filtr uPomocí automatického filtru je snadné vybírat úseky dat pro další zpracování na základě hodnot ve sloupcích databázové tabulky, výběr je možný i podle více sloupců (např. určitá lokalita v určité sezóně uFunkce automaticky rozezná hlavičky sloupců v souvislé oblasti buněk uU sloupců použitých pro filtraci jsou rozbalovací seznamy zbarveny modře Výběr hodnot pro filtraci Rozbalení seznamu hodnot nalezených ve sloupci INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Automatický filtr – vlastní filtrování uUmožňuje filtrovat data databázové tabulky na základě rozsahů hodnot ve sloupcích hodnota podmínka Seznam podmínek Logické operátory INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Kontingenční tabulka uUmožňuje snadno vytvářet sumarizace dat ve smyslu počty hodnot, průměry, minima, maxima atd.v kombinacích kategorií (např. počet jedinců různých druhů na různých lokalitách) uAutomaticky je vybrána souvislá oblast dat (obdobě jako v případě automatického filtru) Zdroj dat (kromě Excelu i např. externí databáze) Zdroj dat (kromě Excelu i např. externí databáze) Graf nebo tabulka Zdrojová oblast dat Umístění Rozvržení a vlastnosti tabulek INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Kontingenční tabulky - rozvržení uNastavit rozvržení kontingenčních tabulek je možné dvěma způsoby, zde představený postup je obsažen v Excel 97,2000 i XP (speciální dialog), druhou možností je obdobná specifikace přímo v listu Excelu (2000, XP) parametry, které je možné zobrazit (hlavičky sloupců databázové tabulky) tzv. stránka = tabulky podle zde nastaveného kritéria parametry na řádcích parametry sloupců parametry dat a možnosti sumarizace INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Kontingenční tabulky - výsledek uVýsledkem analýzy je tabulka vynášející proti sobě hodnoty řádkových a sloupcových parametrů kontingenční tabulky (např. taxony proti lokalitám, jde o seznamy hodnot obsažených v jednotlivých sloupcích), na průsečíku je zobrazena vybraná sumární charakteristika vybraných dat (průměr, suma, počet atd.) uTabulku v této formě je možné nadále editovat co se týče formátu i obsažených dat Panel nástrojů kontingenční tabulky Seznam polí tabulky Roletky položek tabulky Automatický souhrn INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Kontingenční tabulky - nastavení uFormát kontingenční tabulky je možné editovat obdobným způsobem jako jiné excelovské tabulky uLze editovat které z hlaviček sloupců a řádků budou zobrazeny, měnit jejich hierarchii a způsob řazení uZobrazení a způsob sumarizace dat, detailnost zobrazení různých úrovní dat Výběr zobrazených položek Název a způsob sumarizace položky Kontextová nabídka buněk kontingenční tabulky aktualizace dat skrýt položku možnosti tabulky INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Vzorce v listu Excelu u vpisují se do buněk sešitu uvzorce jsou vždy uvozeny = (lze též + -) u aritmetické operátory + zabudované funkce Excelu u pro „sčítání“ nečíselných položek se používá & u výpočet je založen buď na číselných konstantách nebo odkazech na buňky u =3*log(A1) uvození vzorce konstanta zabudovaný vzorec Excelu odkaz na buňku INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Vzorce – odkaz na buňku stylu A1 uRelativní odkazy u u A1 = buňka 1. řádku sloupci A u A1:B6 = blok buněk – levý horní roh je v 1. řádku, sloupec A,pravý dolní na řádku 6, sloupec B u relativní odkaz se při automatickém vyplnění buněk vzorcem posune u uAbsolutní odkaz – odkaz na buňku je pevně dán, při kopírování nebo automatickém vyplnění se nemění, lze uzamknout jak řádky, tak sloupce samostatně u $A$1 uzamčení sloupce uzamčení řádku INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Vzorce – další možnosti odkazu na buňku u uPojmenované oblasti – oblast buněk může být pojmenována a lze se na ni pomocí tohoto názvu odkazovat. Pojmenovávaná oblast Vložení názvu oblasti 1) 2) Mazání, úpravy atd. názvů oblastí. INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Vzorce – tipy a triky u Závislosti vzorců – panel nástrojů kontrola chyb označení a odznačení předchozích a následných vzorců sledování změn hodnot komentáře Zpřehlednění vzorců Vložit tabulátor CTRL+ALT+TAB Vložit konec řádku ALT+ENTER INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Vzorce – využití seznamu vzorců u Funkce a její stručný popis Kategorie vzorců průvodce funkcí INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Maticové vzorce u výpočty z matic dat u zadávání je ukončeno stiskem CTRL+SHIFT+ENTER {=SUMA(A17:A23*B17:B23)} Vzorec je založen na těchto dvou maticích dat Násobení řádků matic Celkové sečtení INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent MS Access – základní koncepce ukládání dat uData jsou ukládána v databázové formě – Access je plnohodnotný databázový program uData jsou ukládána v tabulkách, kde každý sloupec představuje jeden definovaný typ dat, řádky tabulky se nazývají záznamy uJe vhodné aby tabulky obsahovaly tzv. primární klíče - parametr nebo kombinace parametrů jehož/jejichž hodnoty jsou pro každý záznam jedinečné uTabulky spolu mohou být propojeny, tzv. relace tabulek, jsou vhodné např. pro často se opakující hodnoty (např. vlastnosti jednotlivých taxonů) A B C Jednosměrná relace – Zahrnout všechny záznamy tabulky A a z B pouze ty, které jsou shodné Vzájemná relace - zahrnout pouze záznamy v nichž jsou tabulky A i C shodné. INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Příklad složitější relační struktury v MS Access u INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent MS Access – první kroky u Nový soubor Nová prázdná databáze Uložení nové databáze (soubory v Accesu se ukládají při tvorbě souboru a pak již jen automaticky) INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Správa databáze u Jednotlivé položky umožňují vytváření, editaci, správu a další úkony s částmi accessovské databáze Kontextový panel nástrojů Základní příkazy Tabulky – uložení dat a jejich struktura Dotazy – sumarizace dat a různé pohledy na data Formuláře – tvorba komunikačních rozhraní až aplikací Sestavy – tvorba výstupních, tiskových sestav Makra a moduly – tvorba maker a programu ve VBA (Visual Basic for applications) INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Tvorba nové datové tabulky u