INSTITUT BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita IBA výuka 2008/2009 Analýza dat na PC I. Základy programu STATISTICA INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I.  StatSoft, Inc., http://www.statsoft.com/, http://www.statsoft.cz  Verze pro Mac i PC, dostupná česká lokalizace  Běžně dostupné v rámci MU jsou verze 9.1 pro PC (bližší informace viz https://inet.muni.cz/app/soft/licence)  Ukládání dat bez omezení velikosti tabulky (Excel omezen na 256 sloupců)  Transformace, normalizace a další datové operace, podpora SQL importu  Veškerá základní jednorozměrná i vícerozměrná statistika  Řada typů grafů  Spolupráce s MS Office a dalšími aplikacemi  Makro jazyk (Visual Basic) – tvorba složitějších aplikací  Podrobný help – statistická učebnice INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Instalace programu Statistica 6 I. CD key Umístění instalaceSerial number INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Instalace programu Statistica 6 II. Instalace prezentace Typ instalace INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Popis hlavních komunikačních rozhraní Nástrojové lišty Stavová lišta Hlavní okno aplikace Organizátor výstupů Nástrojové lišty Stavová lišta Výstupy Strom výstupů INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Umístění datových souborů Spreadsheet (datový list) V rámci workbooku (ve stromu výstupů) Data jsou umístěna v tabulce, která je obdobou listu v MS Excel nebo starší verzi Statistiky (5.5 a níže) Workbook (pracovní sešit, organizátor výstupů) je komplexní datová struktura, obsahující datové i výstupní tabulky a grafy v přehledném stromovém zobrazení) INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Spouštění analýz a tvorby grafů  Veškeré analýzy jsou dostupné v menu Analysis a Graphs  Po výběru analýzy/grafu následuje specifikace jeho nastavení a dat  Výstupy mohou být zobrazeny třemi způsoby – samostatně, workbook, report  Základní analýzy a grafy jsou dále dostupné v kontextovém menu proměnných Menu statistiky Menu grafů INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Analýza dat – obecné principy zadávání Detailní nastavení analýzy/grafu Výběr dat pro analýzu/graf Záložky možností nebo nastavení analýzy/grafu Způsob zpracování chybějících hodnot Selekce dat Vážení dat Nastavení INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Výstupní možnosti Samostatná výstupní okna Report (export do rtf souboru) Workbook (organizátor výstupů) INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Menu File Nový soubor Nastavení tisku Vlastnosti souboru (popis, heslo atd.) Otevření souboru Nastavení výstupních možností SW Uložení souboru Import z databází Připojení souborů do výstupů INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Vytvoření nového souboru Umístění souboru Typ souboru Počet proměnných (sloupců) Počet řádků INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Otevření a ukládání souborů  Statistica podporuje načítání a ukládání řady typů souborů • Excel • Textové soubory • Dbf soubory • SPSS • Html • rtf INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Import dat z Excelu Všechny listy do Workbooku Jeden list jako datový list Výběr listu pro import Které řádky a sloupce načíst z listu Excelu Načtení názvů proměnných (první načítaný řádek Ecelu), názvů řádků (první načítaný sloupec Excelu) a formátování buněk INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Import dat z textového souboru Načíst jako datový list Načíst jako report (výstupní textový soubor) Způsob oddělení dat v souboru (mezery, tabulátory, čárky atd.) Načíst názvy proměnných a řádků, zpracovat více oddělovačů jako jeden, odstranění mezer na začátku řádku INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Import z databáze I. Načtení připojení k databázi Vytvoření připojení k databázi Nové připojení I. Typ připojení Jméno připojované databáze INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Import z databáze II výběr připojení k databázi struktura databáze SQL dotaz Grafická tvorba SQL dotazu INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Output manager (součást nastavení SW) Jednotlivá výstupní okna Workbook a jeho nastavení (samostatný, s datovým souborem atd.) Vytvářet zároveň i report – textový soubor s tabulkami a grafy a jeho možnosti (úroveň detailů, typ písma atd.) INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Menu Edit Opakování nebo rušení příkazů Práce se schránkou (kopírovat, vložit, vyjmout, hlavičky proměných, vložit jinak) Otisk obrazovky Standardizace, vyplnění náhodnými čísly, přesun a mazání, výběr dat a hlaviček Hledání a nahrazování dat, pohyb v souboru INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Standardizace a náhodná čísla Vyplnění výběru náhodnými čísly, vyplnění dolů nebo doprava prvním řádkem/sloupcem výběru Převedení řádků nebo sloupců na normální rozložení (normalizace řádků nebo sloupců) INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Menu View  Obsahem menu je jednak zobrazení datového listu tj. způsob zobrazení hlaviček sloupců a řádků, mřížek, textových dat, šířky sloupců, záhlaví a zápatí atd.  Dalšími nastaveními jsou zobrazení stavových a nástrojových lišt a uživatelské nastavení těchto lišt INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Menu Insert Vkládání nových nebo zkopírovaných řádků nebo sloupců Kolik proměnných Za kterou proměnnou Formátování, vzorce atd. nových proměnných Vložení objektů jiných SW INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Menu Window a Help Uzavření všech oken Uspořádání oken Seznam otevřených souborů (data, výstupy) Nápověda Statistica, seznam položek nápovědy, vysvětlivky, statistický poradce Domovská stránka Informace o verzi, licenci atd. Učebnice statistiky Videoprezentace Statistica INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Menu Tools Analysis Bar – správa probíhajících analýz Selekce dat na základě podmínek Přiřazení vah proměnným Označování buněk Záznam a editace maker (Visual basic) Uživatelské nastavení programu Statistica Celkové nastavení programu Statistica INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Analysis bar Oživení vybrané analýzy Výběr ze seznamu běžících analýz Grafické možnosti Output manager Tvorba maker Uzavírání a minimalizace analýz Analysis bar (2 běžící analýzy) INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Výběr dat (selection conditions) Povolit selekci Zobrazit selekci v datovém listu Editovat selekci Přidat/ubrat data vybraná v listu do selekce Povolit selekci Podmínky pro výběr do selekce Podmínky pro odstranění ze selekce Ukládání a otevírání selekcí Nový datový list podle selekce nebo náhodněFormát zobrazené selekce INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Uživatelské nastavení Statistica Příkazy na lišty Nástrojové lišty Klávesové zkratky Nastavení menu Formát menu INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Nastavení programu Statistica I. (Celkové nastavení) Co se stane při startu Použití systému měření, zobrazení různých výstrah Způsob výpočtu percentilů Umístění pracovních souborů Zálohování rozdělané práce (autosave) INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Nastavení programu Statistica II. (Analýzy a grafy) Animace dialogů, minimalizace analýz při zobrazování výstupů, zobrazení výstupních oken Zobrazení regresních rovnic Progress bar (průběh analýzy) Vymezení paměti pro analýzy Varování při běhu maker, varování při velikosti dat Zavírání dialogů grafů INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Nastavení programu Statistica III. (Output manager) Jednotlivá výstupní okna Workbook a jeho nastavení (samostatný, s datovým souborem atd.) Vytvářet zároveň i report – textový soubor s tabulkami a grafy a jeho možnosti (úroveň detailů, typ písma atd.) INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Nastavení programu Statistica IV. (Uživatelské seznamy) Uživatelské seznamy (obdobné jako v Excelu), umožňují uživatelské řazení dat např. podle dní v týdnu nebo podle libovolného uživatelského pořadí Napsání nového uživatelského seznamu (čárky slouží jako oddělovníky položek) Přidání nového uživatelského seznamu INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Nastavení programu Statistica V. (Správa konfigurací) Seznam uložených konfigurací a základní informace o nich) Aktivní konfigurace Výběr, uložení, vytvoření nové, smazání, přejmenování, import a export konfigurací Configuration Manager umožňuje ukládat veškerá nastavení programu Statistica jednotlivých uživatelů, kteří mezi nimy mohou přepínat, je také možné přenést již vytvořené nastavení na jiný počítač. INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Nastavení programu Statistica VI. (Nastavení maker) Nastavení makrojazyka Připojené referenční knihovny Font maker Barevné vyznačení částí kódu maker INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Nastavení programu Statistica VII. (Workbook) Nastavení šířky stromového přehledu výstupů a poměru stran prohlížecího okna Potvrzení mazání objektů Co se stane s objektem při přidání do workbooku INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Nastavení programu Statistica VIII. (Reporty) Zobrazení stromu analýz Uložit standardně jako rtf Varování při tisku datových tabulek jako objektů Tisk datových tabulek jak jsou vidět v reportu nebo úplné tabulky samostatně Nastavení exportu obrázků do HTML Velikost datových tabulek a veliskost grafů v reportu Co se stane s objektem při přidání do reportu Font reportu INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Nastavení programu Statistica IX. (Grafy I) Nastavení standardního formátu pro prvních 10 datových řad pro různé typy grafů Formát regresní přímky/křivky Formát čar v grafu Formát mřížek grafu Formát pozadí grafu INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Nastavení programu Statistica X. (Grafy II) Proporce os 2D a 3D grafu Velikost grafů a jejich okraje Jednotky a poměrné zobrazení fontů Styl dokumentu grafu odvozený z použitého formátu výstupu Načtení defaultního nastavení Defaultní polynom regrese a základ logaritmu pro logaritmické osy Defaultní nadpis a zápatí grafů INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Nastavení programu Statistica XI. (Spreadsheets) Význam kláves Enter a Tab v tabulce Maximální šířka sloupce Automatické přepočty vzorců po změně dat, vkládání pozadí dat a hlaviček, umožnění undo Standardní vzhled datové tabulky Extrapolace dat Zobrazení století, varování při nastaveném výběru nebo váhách dat Co s formátem při řazení Konverze textu na čísla Zobrazení kontextové nápovědy funkcí a varování při určité velikosti souboru INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Nastavení programu Statistica XII. (Import dat) Import z Excelu – do workbooku, spreadshheetu nebo se zeptat Import textu – do spreadshheetu, reportu nebo se zeptat Import HTML – do spreadshheetu, reportu nebo se zeptat Maximální počet řádků při importu z databáze prostřednictvím SQL dotazu (Statistica Query) INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Menu Data Transponování (přehození řádků a sloupců buď celého souboru nebo bloku dat) Spojování souborů dat podle proměnných, řádků nebo textových popisek Řazení dat, výběr nebo náhodný výběr dat z tabulky, validace dat podle zadaných podmínek Vlastnosti proměnné, všech proměnných, editace popisek, formát a zdroj hlaviček řádků Přidání, mazání, přesun a kopírování proměnných a řádků SQL import z databází (Statistica Query) Operace s daty INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Operace s daty Sada datových transformací Přepočet vzorců (vybrané proměnné nebo vše) Operace s datumy Standardizace dat Překódování dat do jejich pořadí Překódování dat do kategorií Výměna chybějících hodnot za průměry všech hodnot proměnné Vytvoření mezery (lag) na začátku sloupce proměnné INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Editace výstupních tabulek Editovatelné názvy analýz ve stromu Veškeré buňky tabulky jsou editovatelné co do obsahu i formátu Analýzy lze ve stromu přetahovat a seskupovat do skupin Kontextové menu analýz umožňuje vyextrahovat analýzy do samostatného okna, použít ji jako datovou tabulku, kopírovat, přidat popisky apod. Nástrojové lišty umožňují obdobné editace jako v datové tabulce INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Vlastnosti a editace datových souborů Editovatelná hlavička řádku Hlavička tabulky Hlavička proměnné (sloupce) Datová buňka, z hlediska formátování lze editovat data statistiky obdobně jako v Excelu) Datový formát Popis nebo vzorce Datový typ Formátování Jméno proměnné Nastavení všech proměnných Textové a číselné hodnoty INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Řazení dat  Řazení dat v Statistica probíhá obdobně jako v databázích, tj. seřazení podle jedné proměnné ovlivní i ostatní sloupce (tj. není nebezpečí ztráty vazby dat – např. Excel)  Řazení lze provádět maximálně podle 7 proměnných Řazená proměnná Směr řazení Řazení podle hlaviček řádků Řazení číselné nebo textové Více položek pro řazení (max. 7) INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Vzorce v programu Statistica  Vzorec je vždy uvozen =, poté následuje zápis vzorce  Na základě vzorce je vždy přepočítán celý sloupec (proměnná)  Funkce lze vybírat ze seznamu, k dispozici je i nápověda tvorby funkcí  Na proměnné je odkazováno pomocí stylu vX (v1 např.), kde v je variable a X číslo sloupce (proměnné) – např. =cos(v2) – výsledná proměnná obsahuje cosiny jednotlivých čísel ve sloupci (proměnné) v2  Přepočet nastává buď automaticky po zadání nebo stiskem klávesy F9 Oblast zápisu vzorce Seznam funkcí Seznam funkcí obsahuje nejrůznější statistické a matematické funkce vybratelné pomocí myši INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Export výstupů I. (report)  Report lze ukládat ve speciálním formátu Statistica (ukládá i strom analýz)  V textovém formátu (nejsou ukládány grafy)  V RTF (rich text formát), pouze tabulky a grafy, ne strom analýz), snadno editovatelné v MS Word a obdobných editorech  Do HTML (vytvoření webové stránky) s grafy ve formátu .png INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Export výstupů II. (Workbook)  Celkový workbook lze ukládat pouze ve formátu Statistica  Jednotlivé tabulky a grafy lze však vyextrahovat do samostatných oken a vyexportovat Tabulky Grafy Statistica 5 a 6 SPSS Excel Textové soubory HTML dbf Statistica BMP JPG PNG GIF Windows Metafile INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Spolupráce s jinými aplikacemi (vkládání objektů)  Na spolupráci s jinými aplikacemi lze pohlížet dvojím způsobem I. První možností je vkládání výstupů Statistica do jiných aplikací  Statistica podporuje spolupráci s MS Office a dalšími programy podporujícími vkládání objektů jiných aplikací  Kromě MS Office je možná např. spolupráce s Adobe Illustratorem při tvorbě grafů II. Druhou možností je komunikace přes makrojazyk Statistiky, příkladem může být napsání excelovského makra, které pro data sešitu spočítá analýza ve Statistice a výsledek vloží do listu Excelu, případně použije pro zobrazení excelovských dat graf Statistiky INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Kopírování a vkládání tabulek do MS Office  V případě, že chceme zachovat i popisky tabulek je nutné vybrat celou tabulku a použít položku menu Copy with Headers  S tabulkami je možno pracovat jako s objekty MS Office (tabulky Wordu, list Excelu tj. normální editace MS Office) nebo jako s vloženými objekty jiné aplikace (Statistica, otevírají a editují se v okně Statistica)  Zkopírovanou tabulku vkládáme do aplikací MS Office prostým vložením, jedinou vyjímkou je Excel XP, kde musí být tabulka vložena jinak ve formátu Biff4  Pokud chceme tabulku vložit jako objekt Statistica použijeme také vložit jinak jako Statistica spreadsheet object INSTITUT BIOSTATISTIKY A ANALÝZVÝUKA Analýza dat na PC I. Kopírování grafů  Graf ve workbooku nebo samostatném okně je zkopírován pomocí kontextové nabídky nebo nabídky menu  Pokud je graf vkládán normálním vkládáním do dokumentů MS Office, je vložen jako objekt Statistica a po poklepu jej lze ve Statistica editovat  Tento objekt lze pomocí funkce oddělit převést na kresbu MS Office (vektorová kresba, nevratná změna)  Další možností je vložit graf pomocí vložit jinak jako bitmapový obrázek  Na vektorovou kresbu je možné převést graf též po vložení do Adobe Illustratoru