3. Základní principy vizualizace www.usingmindmaps.com www.estatevaults.com www.cg.tuwien.ac.at exa.com www.nsf.gov Visualization pipeline prefuse.org flowingdata.com Práce s daty • Předzpracování dat a transformace – viz minulá přednáška • Mapování pro vizualizaci Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Práce s daty • Transformace a rendering en.wikipedia.org opengl.org myego.cz Metriky vizualizace • Pro měření přenosu informací sdělovaných pomocí navržené vizualizace – Expressiveness – výraznost, významnost – Effectiveness - efektivita freelanceswitch.comwww.cg.tuwien.ac.at Expressiveness • Mexp = vizualizovaná informace/informace, která má být sdělena 0 ≤ Mexp ≤ 1 • Jestliže Mexp = 1, je expresivita ideální • Jestliže Mexp < 1, zobrazujeme méně informace, než chceme • Jestliže Mexp > 1, prezentujeme více informací, než bychom měli Effectiveness • Vizualizace je efektivní: – Přesná a rychlá interpretace – Přiměřeně rychlé renderování Meff = 1/(1 + interpret + render) 0 ≤ Meff ≤ 1 • Jestliže se hodnota Meff blíží jedničce, je čas pro interpretaci i renderování velmi krátký Příklad Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Grafické symboly • Jednoduše rozpoznatelné grafické symboly Zřejmý význam Složitý význam Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Grafické symboly • Bez vnější – kognitivní identifikace nemá žádná grafická reprezentace význam. Externí identifikace musí být jednoduše čitelná a pochopitelná. • Podobnost mezi daty ↔ vizuální podobnost odpovídajících grafických symbolů • Uspořádání na datech ↔ vizuální uspořádání mezi odpovídajícími grafickými symboly Dimenzionalita 2D grafiky Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Příklad Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Analýza grafiky 1) Podvědomě vnímáme seskupení objektů http://www.infovis-wiki.net/index.php/Preattentive_processing Analýza grafiky 2) Kognitivně tato seskupení charakterizujeme elearningbuzz.wordpress.com Osm vizuálních proměnných • Proměnné pro maximalizaci efektivity dané vizualizace: - Pozice - Tvar - Velikost - Jas - Barva - Orientace - Textura - Pohyb www.infovis-wiki.net Pozice • Nejdůležitější proměnná • Umístění grafických prvků na obrazovku • Best case – každý grafický symbol má unikátní pozici, symboly se nepřekrývají • Worst case – všechny grafické symboly umístěny do jednoho místa Pozice Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Pozice • Lineární scale • Logaritmický scale • Doplňková grafika - osy mathsisinteresting.blogspot.com cstl.syr.edu Tvar (značka) • Body, čáry, oblasti, objemy a jejich kombinace • Symboly, písmena, slova, … • Nepatří sem velikost, orientace, atd. jednotlivých značek – to jsou další vizuální proměnné Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Tvar (značka) Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Velikost Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward • Použitelná pro datové množiny s malou kardinalitou Velikost • Záleží na výběru typu značky • Body, čáry, křivky jsou ve spojení s velikostí vhodné • Nevhodné pro oblasti Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Jas • Škála jasu pro mapování hodnot na obrazovku: • Lineární škála jasu Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Jas Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Barva • Odstín, sytost Barva • http://colorbrewer2.org/ Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Barva • Standardní lineární šedotónní • Duha • „Heated“ • Z modré do azurové • Z modré do žluté Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Orientace Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Textura Interactive Data Visualization - Foundations, Techniques and Applications. Matthew Ward Pohyb • Může být asociován s kteroukoliv jinou vizuální proměnnou • Pozice – směr pohybu • Velikost – větší/menší • Jas – světlejší/tmavší • Orientace – větší/menší úhel Příklad – baseball • Mapování odpalů do prostoru definovaného pomocí x, y Příklad – baseball • Typ odpalu namapován na různé typy glyfů Příklad – baseball • Redukování velikosti grafu pomocí rozložení do více grafů Příklad – baseball • Přidání barvy pro doplnění rychlosti odpalu Vnímání barvy • Rozdíly v barvě lze detekovat již za 200 milisekund – dokonce dříve, než si uvědomíme, že se na vizualizaci soustředíme (tzv. preatentivní koncept) • Barva může být třídimenzionální (např. RGB) – V praxi se využívá pouze 2D kódování barvy • Vysoké procento barvoslepých jedinců • Různé rozsahy vnímaných odstínů u barev (žlutá vs. modrá) Příklad – baseball • Využití 2D barevného pole pro přidání informace o hustotě odpalů v daném místě Krátký pohled do historie • Formalizace oblasti vizualizace pomocí různých modelů www.gerardcaris.com Jacques Bertin (1918 - 2010) Bertin (1967) Semiology of Graphics • První rigorózní pokus o definici grafiky • Vytvoření tzv. značkovacího systému • Grafický slovník: Marks Points, lines, and areas Positional Two planar dimensions Retinal Size, value, texture, color, orientation, and shape Další systémy • Mackinlay (1986) APT • Bergeron a Grinstein (1989) • Wehrend a Lewis (1990) • Robertson (1990) Natural Scene Paradigm • Roth (1991) Visage and SAGE • Casner (1991) BOZ • Beshers a Feiner (1992) AutoVisual • Senay a Ignatius (1994) VISTA • Hibbard (1994) Lattice Model • Golovchinsky (1995) AVE • Card, Mackinlay a Shneiderman (1999) Spatial Substrate • Kamps (1999) EAVE • Wilkinson (1999) Grammar of Graphics • Hoffman (2000) Table Visualizations Shrnutí historie • Grafické modely formalizují grafické objekty používané pro zobrazení informace • Tyto modely charakterizují grafiku pomocí tří komponent: – Značky – Pozice – Perceptuální proměnné Využití – Wordle • Barevné slovní koláže • Autor Jonathan Feinberg • Navrženo primárně pro zábavu, založeno na tzv. tag clouds markmeynell.wordpress.com Wordle – vznik • Počátky v roce 2004, původně jako tag clouds, pojmenováno „dogear“ • Vizuální složka není příliš řešena Wordle – vznik • Ve stejném roce Matt Jones publikoval ručně vytvořený tag cloud, který kladl důraz na typografické rozložení textu a zároveň vizuální přitažlivost • Stal se motivací pro vytvoření programu, který totéž dokáže automaticky Matt Jones – tag cloud Wordle – vznik • Vznik první verze programu – „tag explorer“ – Java applet umožňující klikat na jednotlivá slova Wordle – vznik • Tag explorer našel využití při prezentaci osobních zájmů a znalostí a tag clouds se objevily jako součást mailových podpisů • Časem Tag explorer „zapadl“ Wordle – vznik • Dalším krokem byl design na základě počtu slov v textu, ze kterého je tag cloud vytvářen • Primárním cílem se stala vizuální přitažlivost „Who would say that pleasure is not useful?“ Charles Eames • Důležitý je tedy i výběr fontů a palety barev Wordle Historie • Podobné principy použity již dávno Jak Wordle pracuje • Vykreslení slov s určitou vahou, která určuje jejich velikost • Aplikuje regulární výraz na vstupní text • Odstraní tzv. stop words – slova v použitém jazyce, která se často opakují a nejsou významná v kontextu tohoto typu vizualizace (v angličtině „the“, „it“, „to“) – K tomu je potřeba zjistit, jaký jazyk je použit Určení použitého jazyka • Algoritmus vybere 50 nejčastějších slov ze vstupního textu a porovná je se stop words podporovaných jazyků • Přiřazení vah: – Váha = počet výskytů daného slova Mapování na tvary • Pro každé slovo je určen font, jehož velikost je definována vahou • Každému slovu je určen bounding box, jejich součet určuje celkovou plochu, kterou výsledná vizualizace zabere. Podle této hodnoty je pak určen poměr, ve kterém musí být vizualizace škálována dle výstupních požadavků Rozmístění slov • Náhodnostní hladový algoritmus • Když je slovo umístěno, jeho pozice se již nemění Rozmístění slov • Detekce průsečíků – Využití hierarchických bounding boxů – při protnutí bounding boxů sestupujeme do nižší úrovně hierarchie a testujeme znovu