INSTITUT BIOSTATISTIKY A ANALÝZ Lékařská a Přírodovědecká fakulta, Masarykova univerzita logo_mu-web IBA výuka 2008/2009 logo-IBA-transparent Analýza dat na PC I. Základy programu STATISTICA INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent uStatSoft, Inc., http://www.statsoft.com/, http://www.statsoft.cz uVerze pro Mac i PC, dostupná česká lokalizace uBěžně dostupné v rámci MU jsou verze 5 a 6 pro PC (bližší informace viz. http://www.ics.muni.cz/services/statistica.html ) u uUkládání dat bez omezení velikosti tabulky (Excel omezen na 256 sloupců) uTransformace, normalizace a další datové operace, podpora SQL importu uVeškerá základní jednorozměrná i vícerozměrná statistika uŘada typů grafů uSpolupráce s MS Office a dalšími aplikacemi uMakro jazyk (Visual Basic) – tvorba složitějších aplikací uPodrobný help – statistická učebnice u smstatisticalogo INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Statistica 5.5 a 6 Statistica 6 Statistica 5.5 Výběr analýzy v speciálním menu Veškeré analýzy a možnosti v jedné aplikaci Správa výstupů INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Statistica 5.5 a 6 – výhody a nevýhody :Vše přehledně v jedné aplikaci :Správa výstupů :Snazší nastavení a jeho přenositelnost – –Zcela změněný typ grafů hlavně co se týče práce se zdrojovými daty –Vyšší HW nároky –Neběží pod Windows 3.11 – u Statistica 6 Statistica 5.5 :Nenáročnost na HW a OS – běží i pod Windows 3.11 :Design aplikace je shodný jako u starších verzí :Snadná editace dat grafů : –Všechny výstupy v samostatných oknech – menší přehlednost –Problémy s formátem grafů při vkládání do Office –Problémy pod Windows XP INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Instalace programu Statistica 6 I. CD key Umístění instalace Serial number INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Instalace programu Statistica 6 II. Instalace prezentace Typ instalace INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Popis hlavních komunikačních rozhraní Nástrojové lišty Stavová lišta Hlavní okno aplikace Organizátor výstupů Nástrojové lišty Stavová lišta Výstupy Strom výstupů INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Umístění datových souborů Spreadsheet (datový list) V rámci workbooku (ve stromu výstupů) Data jsou umístěna v tabulce, která je obdobou listu v MS Excel nebo starší verzi Statistiky (5.5 a níže) Workbook (pracovní sešit, organizátor výstupů) je komplexní datová struktura, obsahující datové i výstupní tabulky a grafy v přehledném stromovém zobrazení) INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Spouštění analýz a tvorby grafů uVeškeré analýzy jsou dostupné v menu Analysis a Graphs uPo výběru analýzy/grafu následuje specifikace jeho nastavení a dat uVýstupy mohou být zobrazeny třemi způsoby – samostatně, workbook, report uZákladní analýzy a grafy jsou dále dostupné v kontextovém menu proměnných Menu statistiky Menu grafů INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Analýza dat – obecné principy zadávání Detailní nastavení analýzy/grafu Výběr dat pro analýzu/graf Záložky možností nebo nastavení analýzy/grafu Způsob zpracování chybějících hodnot Selekce dat Vážení dat Nastavení INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Výstupní možnosti Samostatná výstupní okna Report (export do rtf souboru) Workbook (organizátor výstupů) INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Menu File Nový soubor Nastavení tisku Vlastnosti souboru (popis, heslo atd.) Otevření souboru Nastavení výstupních možností SW Uložení souboru Import z databází Připojení souborů do výstupů INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Vytvoření nového souboru Umístění souboru Typ souboru Počet proměnných (sloupců) Počet řádků INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Otevření a ukládání souborů uStatistica podporuje načítání a ukládání řady typů souborů •Excel •Textové soubory •Dbf soubory •SPSS •Html •rtf INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Import dat z Excelu Všechny listy do Workbooku Jeden list jako datový list Výběr listu pro import Které řádky a sloupce načíst z listu Excelu Načtení názvů proměnných (první načítaný řádek Ecelu), názvů řádků (první načítaný sloupec Excelu) a formátování buněk INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Import dat z textového souboru Načíst jako datový list Načíst jako report (výstupní textový soubor) Způsob oddělení dat v souboru (mezery, tabulátory, čárky atd.) Načíst názvy proměnných a řádků, zpracovat více oddělovačů jako jeden, odstranění mezer na začátku řádku INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Import z databáze I. Načtení připojení k databázi Vytvoření připojení k databázi Nové připojení I. Typ připojení Jméno připojované databáze INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Import z databáze II výběr připojení k databázi struktura databáze SQL dotaz Grafická tvorba SQL dotazu INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Output manager (součást nastavení SW) Jednotlivá výstupní okna Workbook a jeho nastavení (samostatný, s datovým souborem atd.) Vytvářet zároveň i report – textový soubor s tabulkami a grafy a jeho možnosti (úroveň detailů, typ písma atd.) INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Menu Edit Opakování nebo rušení příkazů Práce se schránkou (kopírovat, vložit, vyjmout, hlavičky proměných, vložit jinak) Otisk obrazovky Standardizace, vyplnění náhodnými čísly, přesun a mazání, výběr dat a hlaviček Hledání a nahrazování dat, pohyb v souboru INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Standardizace a náhodná čísla Vyplnění výběru náhodnými čísly, vyplnění dolů nebo doprava prvním řádkem/sloupcem výběru Převedení řádků nebo sloupců na normální rozložení (normalizace řádků nebo sloupců) INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Menu View uObsahem menu je jednak zobrazení datového listu tj. způsob zobrazení hlaviček sloupců a řádků, mřížek, textových dat, šířky sloupců, záhlaví a zápatí atd. uDalšími nastaveními jsou zobrazení stavových a nástrojových lišt a uživatelské nastavení těchto lišt INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Menu Insert Vkládání nových nebo zkopírovaných řádků nebo sloupců Kolik proměnných Za kterou proměnnou Formátování, vzorce atd. nových proměnných Vložení objektů jiných SW INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Menu Format Formátování buněk (formát čísla, zarovnání, font a ohraničení) Šířka sloupců, výška řádků Editace bloku buněk (viz. editace buněk) Formát sešitu Nastavení všeobecného formátu buněk sešitu a speciálních typů buněk INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Formátování sešitu Statistica Co formátovat Preview formátování Nastavení oblasti formátování Formátování INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Menu Window a Help Uzavření všech oken Uspořádání oken Seznam otevřených souborů (data, výstupy) Nápověda Statistica, seznam položek nápovědy, vysvětlivky, statistický poradce Domovská stránka Informace o verzi, licenci atd. Učebnice statistiky Videoprezentace Statistica INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Menu Tools Analysis Bar – správa probíhajících analýz Selekce dat na základě podmínek Přiřazení vah proměnným Označování buněk Záznam a editace maker (Visual basic) Uživatelské nastavení programu Statistica Celkové nastavení programu Statistica INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Analysis bar Oživení vybrané analýzy Výběr ze seznamu běžících analýz Grafické možnosti Output manager Tvorba maker Uzavírání a minimalizace analýz Analysis bar (2 běžící analýzy) INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Výběr dat (selection conditions) Povolit selekci Zobrazit selekci v datovém listu Editovat selekci Přidat/ubrat data vybraná v listu do selekce Povolit selekci Podmínky pro výběr do selekce Podmínky pro odstranění ze selekce Ukládání a otevírání selekcí Nový datový list podle selekce nebo náhodně Formát zobrazené selekce INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Tvorba maker Seznam maker Nahrání makra s kódem analýzy ve Visual Basicu Nahrání makra proběhlé sekvence analýz (není kompletní kód) Makro pro analýzy z Analysis bar Editor maker/Visual Basicu INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Uživatelské nastavení Statistica Příkazy na lišty Nástrojové lišty Klávesové zkratky Nastavení menu Formát menu INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Nastavení programu Statistica I. (Celkové nastavení) Co se stane při startu Použití systému měření, zobrazení různých výstrah Způsob výpočtu percentilů Umístění pracovních souborů Zálohování rozdělané práce (autosave) INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Nastavení programu Statistica II. (Analýzy a grafy) Animace dialogů, minimalizace analýz při zobrazování výstupů, zobrazení výstupních oken Zobrazení regresních rovnic Progress bar (průběh analýzy) Vymezení paměti pro analýzy Varování při běhu maker, varování při velikosti dat Zavírání dialogů grafů INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Nastavení programu Statistica III. (Output manager) Jednotlivá výstupní okna Workbook a jeho nastavení (samostatný, s datovým souborem atd.) Vytvářet zároveň i report – textový soubor s tabulkami a grafy a jeho možnosti (úroveň detailů, typ písma atd.) INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Nastavení programu Statistica IV. (Uživatelské seznamy) Uživatelské seznamy (obdobné jako v Excelu), umožňují uživatelské řazení dat např. podle dní v týdnu nebo podle libovolného uživatelského pořadí Napsání nového uživatelského seznamu (čárky slouží jako oddělovníky položek) Přidání nového uživatelského seznamu INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Nastavení programu Statistica V. (Správa konfigurací) Seznam uložených konfigurací a základní informace o nich) Aktivní konfigurace Výběr, uložení, vytvoření nové, smazání, přejmenování, import a export konfigurací Configuration Manager umožňuje ukládat veškerá nastavení programu Statistica jednotlivých uživatelů, kteří mezi nimy mohou přepínat, je také možné přenést již vytvořené nastavení na jiný počítač. INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Nastavení programu Statistica VI. (Nastavení maker) Nastavení makrojazyka Připojené referenční knihovny Font maker Barevné vyznačení částí kódu maker INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Nastavení programu Statistica VII. (Workbook) Nastavení šířky stromového přehledu výstupů a poměru stran prohlížecího okna Potvrzení mazání objektů Co se stane s objektem při přidání do workbooku INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Nastavení programu Statistica VIII. (Reporty) Zobrazení stromu analýz Uložit standardně jako rtf Varování při tisku datových tabulek jako objektů Tisk datových tabulek jak jsou vidět v reportu nebo úplné tabulky samostatně Nastavení exportu obrázků do HTML Velikost datových tabulek a veliskost grafů v reportu Co se stane s objektem při přidání do reportu Font reportu INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Nastavení programu Statistica IX. (Grafy I) Nastavení standardního formátu pro prvních 10 datových řad pro různé typy grafů Formát regresní přímky/křivky Formát čar v grafu Formát mřížek grafu Formát pozadí grafu INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Nastavení programu Statistica X. (Grafy II) Proporce os 2D a 3D grafu Velikost grafů a jejich okraje Jednotky a poměrné zobrazení fontů Styl dokumentu grafu odvozený z použitého formátu výstupu Načtení defaultního nastavení Defaultní polynom regrese a základ logaritmu pro logaritmické osy Defaultní nadpis a zápatí grafů INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Nastavení programu Statistica XI. (Spreadsheets) Význam kláves Enter a Tab v tabulce Maximální šířka sloupce Automatické přepočty vzorců po změně dat, vkládání pozadí dat a hlaviček, umožnění undo Standardní vzhled datové tabulky Extrapolace dat Zobrazení století, varování při nastaveném výběru nebo váhách dat Co s formátem při řazení Konverze textu na čísla Zobrazení kontextové nápovědy funkcí a varování při určité velikosti souboru INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Nastavení programu Statistica XII. (Import dat) Import z Excelu – do workbooku, spreadshheetu nebo se zeptat Import textu – do spreadshheetu, reportu nebo se zeptat Import HTML – do spreadshheetu, reportu nebo se zeptat Maximální počet řádků při importu z databáze prostřednictvím SQL dotazu (Statistica Query) INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Menu Data Transponování (přehození řádků a sloupců buď celého souboru nebo bloku dat) Spojování souborů dat podle proměnných, řádků nebo textových popisek Řazení dat, výběr nebo náhodný výběr dat z tabulky, validace dat podle zadaných podmínek Vlastnosti proměnné, všech proměnných, editace popisek, formát a zdroj hlaviček řádků Přidání, mazání, přesun a kopírování proměnných a řádků SQL import z databází (Statistica Query) Operace s daty INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Operace s daty Sada datových transformací Přepočet vzorců (vybrané proměnné nebo vše) Operace s datumy Standardizace dat Překódování dat do jejich pořadí Překódování dat do kategorií Výměna chybějících hodnot za průměry všech hodnot proměnné Vytvoření mezery (lag) na začátku sloupce proměnné INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Editace výstupních tabulek Editovatelné názvy analýz ve stromu Veškeré buňky tabulky jsou editovatelné co do obsahu i formátu Analýzy lze ve stromu přetahovat a seskupovat do skupin Kontextové menu analýz umožňuje vyextrahovat analýzy do samostatného okna, použít ji jako datovou tabulku, kopírovat, přidat popisky apod. Nástrojové lišty umožňují obdobné editace jako v datové tabulce INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Vlastnosti a editace datových souborů Editovatelná hlavička řádku Hlavička tabulky Hlavička proměnné (sloupce) Datová buňka, z hlediska formátování lze editovat data statistiky obdobně jako v Excelu) Datový formát Popis nebo vzorce Datový typ Formátování Jméno proměnné Nastavení všech proměnných Textové a číselné hodnoty INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Řazení dat uŘazení dat v Statistica probíhá obdobně jako v databázích, tj. seřazení podle jedné proměnné ovlivní i ostatní sloupce (tj. není nebezpečí ztráty vazby dat – např. Excel) uŘazení lze provádět maximálně podle 7 proměnných Řazená proměnná Směr řazení Řazení podle hlaviček řádků Řazení číselné nebo textové Více položek pro řazení (max. 7) INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Vzorce v programu Statistica uVzorec je vždy uvozen =, poté následuje zápis vzorce uNa základě vzorce je vždy přepočítán celý sloupec (proměnná) uFunkce lze vybírat ze seznamu, k dispozici je i nápověda tvorby funkcí uNa proměnné je odkazováno pomocí stylu vX (v1 např.), kde v je variable a X číslo sloupce (proměnné) – např. =cos(v2) – výsledná proměnná obsahuje cosiny jednotlivých čísel ve sloupci (proměnné) v2 uPřepočet nastává buď automaticky po zadání nebo stiskem klávesy F9 Oblast zápisu vzorce Seznam funkcí Seznam funkcí obsahuje nejrůznější statistické a matematické funkce vybratelné pomocí myši INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Export výstupů I. (report) uReport lze ukládat ve speciálním formátu Statistica (ukládá i strom analýz) uV textovém formátu (nejsou ukládány grafy) uV RTF (rich text formát), pouze tabulky a grafy, ne strom analýz), snadno editovatelné v MS Word a obdobných editorech uDo HTML (vytvoření webové stránky) s grafy ve formátu .png INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Export výstupů II. (Workbook) uCelkový workbook lze ukládat pouze ve formátu Statistica uJednotlivé tabulky a grafy lze však vyextrahovat do samostatných oken a vyexportovat Tabulky Grafy Statistica 5 a 6 SPSS Excel Textové soubory HTML dbf Statistica BMP JPG PNG GIF Windows Metafile INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Spolupráce s jinými aplikacemi (vkládání objektů) uNa spolupráci s jinými aplikacemi lze pohlížet dvojím způsobem u I.První možností je vkládání výstupů Statistica do jiných aplikací uStatistica podporuje spolupráci s MS Office a dalšími programy podporujícími vkládání objektů jiných aplikací uKromě MS Office je možná např. spolupráce s Adobe Illustratorem při tvorbě grafů u II.Druhou možností je komunikace přes makrojazyk Statistiky, příkladem může být napsání excelovského makra, které pro data sešitu spočítá analýza ve Statistice a výsledek vloží do listu Excelu, případně použije pro zobrazení excelovských dat graf Statistiky III. III. INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Kopírování a vkládání tabulek do MS Office uV případě, že chceme zachovat i popisky tabulek je nutné vybrat celou tabulku a použít položku menu Copy with Headers u u u u u u u u uS tabulkami je možno pracovat jako s objekty MS Office (tabulky Wordu, list Excelu tj. normální editace MS Office) nebo jako s vloženými objekty jiné aplikace (Statistica, otevírají a editují se v okně Statistica) uZkopírovanou tabulku vkládáme do aplikací MS Office prostým vložením, jedinou vyjímkou je Excel XP, kde musí být tabulka vložena jinak ve formátu Biff4 uPokud chceme tabulku vložit jako objekt Statistica použijeme také vložit jinak jako Statistica spreadsheet object INSTITUT BIOSTATISTIKY A ANALÝZ VÝUKA Analýza dat na PC I. logo-IBA-transparent Kopírování grafů uGraf ve workbooku nebo samostatném okně je zkopírován pomocí kontextové nabídky nebo nabídky menu u uPokud je graf vkládán normálním vkládáním do dokumentů MS Office, je vložen jako objekt Statistica a po poklepu jej lze ve Statistica editovat uTento objekt lze pomocí funkce oddělit převést na kresbu MS Office (vektorová kresba, nevratná změna) uDalší možností je vložit graf pomocí vložit jinak jako bitmapový obrázek uNa vektorovou kresbu je možné převést graf též po vložení do Adobe Illustratoru u