6 PRE-PROCESSING DAT Před vlastní analýzou dat je nutné zkontrolovat jejich kvalitu, vyřadit respondenty, u kterých došlo k chybě záznamu, a případně převést data do jiného softwaru. V této kapitole bude popsán převod dat z programů od společností SMI a Gazepoint do open-source nástroje OGAMA. Kromě rozdílné funkcionality aplikací je jednou z hlavních výhod OGAMA to, že ji lze využívat bez nutnosti licence či hardwarového klíče. V další části kapitoly bude popsán princip detekce fixací a sakád a doporučeno optimální nastavení pro kartografické experimenty. Závěr kapitoly bude věnován čištění dat a odhalování chyb v datech. 6.1 Převod dat ze SMI do OGAMA Pro převod dat z programu SMI BeGaze do OGAMA byl vytvořen online nástroj SMI2OGAMA.65 Funkcionalita nástroje je velice jednoduchá. Program čte vyexportovaná raw data z programu SMI a převádí je do formátu vhodného pro import do programu OGAMA. Díky změně způsobu exportu raw dat z programu SMI od verze 3.6 nyní existují dvě možnosti, jak export provést. Původní způsob se nazýval Export Raw Data to File a v nových verzích je dostupný v nabídce Export/Legacy. V tomto případě si uživatel zvolí, pro které stimuly chce data vyexportovat, a z polí pro export vybere „Gaze position" a „Stimulus". OGAMA neumí zpracovat binokulární data. Je na uživateli, které oko si zvolí. V případě, že vybere obě dvě, do OGAMA budou naimportovány pouze záznamy pro levé oko. Nastavení je znázorněno na obrázku 86. V dalším kroku exportu je důležité zatrhnout volbu „Single file outpuť. Výsledná data budou mít formu textových dokumentů a budou uložena pro každého respondenta zvlášť. 65 \ww.eyetr;icking.upol.c7/smi20gama 139 Eye-tracking (nejen) v kognitivní kartvgrqfii Obr. 86 Nastavení exportu raw dat pomocí Legacy: Export raw data to filc v programu SMI ReGaze. Je důležité, aby byly zaškrtnuty pouze volby označené červenou barvou. Druhou variantou, dostupnou od SMI BeGaze verze 3.6 a vyšší, je export raw dat pomocí nabídky Metrics Export. Výhodou tohoto postupu je to, že lze filtrovat respondenty, pro které bude export proveden, a zejména pak to, žc lze exportovat raw data i pro tzv. Custom Trials (viz kapitola 6.5). V tomto případě je nutné zvolit v nabídce Metrics Export šablonu Raw Data, dále vyfiltrovat respondenty a stimuly, pro které má být export proveden. Stejně jako v předchozím případě budou do OGAMA importovány záznamy pouze pro jedno oko. Nejdůležitější je nabídka Select Metrics, kde budou vybrána pole ..Recording Time", „Stimulus", ..Participant" a „Point of Regard" pro osu X a Y tak, jak je to znázorněno na obrázku 87. V posledním krokuje opět nutné vybrat, aby byla data uložena pro jednotlivé respondenty zvlášť. To je označeno jako „Individua! participant files". na Dote a* —... 1 ■ Sel 11» aa Metna -BOB tfcIXl DMU - JftrfB— Qftdanutxk-i ľ] Su. ľlGntauMT Obr. 87 Nastavení exportu raw dat pomocí Metrics Export v programu SMI BeGaze. Je důležité, aby byly zaškrtnut).- pouze volby označené červenou barvou. Pre-processing dat Další postup už je velmi podobný pro oba způsoby exportu. Vytvořené textové soubory s daty jednotlivých respondentů je nutné zabalit do ZIP archivu (přímo soubory, ne složku) a tento ZIP nahrát do webové aplikace SMI2OGAMA. Po chvíli dojde ke stažení archivu s daty připravenými pro import do OGAMA. Nevýhodou tohoto importuje fakt, že časy jednotlivých záznamů nejsou unikátní (čas se počítá od zapnutí počítače), proto není možné importovat všechny respondenty najednou (došlo by k promíchání dat mezi respondenty). V programu OGAMA je nutné nejprve založit nový experiment. Zde je důležité specifikovat zejména rozlišení obrazovky, na které byla data nahrávána, a frekvenci záznamu (obr. 88). Další informace týkající se detekce fixací lze změnit i později. Detailněji je toto nastavení popsáno v kapitole 6.3.3. 3 Experiment Settings.. Please specify the settings fot this experiment Screen sire o' e-/ef3:r:er -:■ .: f^nt ň Pixel 1S2^T" VSäe r\ Potel 1200 J Sampling rates Gaze s: Fixation calculation parameter l/aomum distance in pads thai a point may vary from the average fixation port and stJ be considered pari of the fetation. Mnrnurn number of samples that can be considered a rotation. Fixation detection img size. This value sets the size of the buffer that is used to detect fixations 31 Pieasenote: To this amount the rotation detection is delayed compared to the raw path data during replay- V] Merge conseřrinateo(theÍMtJori POG. as a percentage of the screen wdth (Oto 1) The Y^oortanateotthefotaton POG. as a bercercege of the screen he^hj (Oto I) The staring tme of the ftsabon POG n seconds ance the system rrtaijatcn or Cafeabon Thedtsabcnof trwfoation POG n seconds Obr. 89 Parametry exportu pro převod dat z Gazepoint Analysis do OGAMA 66 http://ryrtrark-mg.iipol.cz/gp2ogama/ 142 pre-processing dat V prvním kroku je nutné vyexportovat data z programu Gazepoint Analysis. V dialogovém okně exportuje na výběr velké množství parametrů, nicméně důležité jsou pouze čtyři z nich. Jedná se o název stimulu, časovou značku a souřadnice pohledu X a Y (obr. 89). Ty jsou na rozdíl od programů ostatních výrobců uváděny v % monitoru, a nikoliv v pixelech. Vyexportovány budou dva soubory za každého uživatele. První z nich obsahuje raw data a je zde označen jako „all_gaze", druhý z nich pak fixace (označen jako „fřxations"). Jelikož v Gazepoint Analysis není možné specifikovat parametry identifikace fixací a import fixací do programu OGAMA nefunguje, je důležitý pouze první typ souborů. Soubory s přídomkem „all_gaze" pro všechny respondenty je nutné zabalit do archivu formátu ZIP a nahrát do webového rozhraní aplikace gp2ogama. Zde je rovněž nutné nastavit rozlišení monitoru, na kterém probíhalo testování. Po odeslání dat bude stažen ZIP archiv obsahující soubory připravené pro import do OGAMA. Další postup už je totožný s importem dat ze SMI (viz kapitola 6.1 a obr. 88). 6.3 Detekce fixací a sakád Ve všech eye-traeking studiích je velice důležitá volba a nastavení metody identifikace fixací a sakád, protože toto nastavení může ovlivnit výsledky studie. Důležité je také zvolené nastavení ve studii popsat, protože bez této informace nelze výsledky srovnávat s ostatními pracemi. Eye-tracker SMI RED 250 ukládá naměřená eye-traeking data do formátu *.IDT. Pomocí aplikace SMI BeGaze je možné tato data uložit do textového dokumentu ve formč *.txt. Exportovat lze raw data i identifikované fixace a sakády. Tab. 7 Vyexportovaná prvotní naměřená (raw) data Time Trial LPORX[px] LPORY[px] Stimulus 2864092592 1 842,89 543,96 010 - 3d.jpg 2864100960 1 845,4 543,45 010 - 3d.jpg 2864109212 1 843,58 544.34 010 - 3d.jpg 2864117593 1 838,73 542,74 010 - 3djpg 2864125956 1 839,69 544-45 010 - 3d.jpg Exportovaná data obsahují časovou značku a s ní související měřené parametry očí. Jedná se především o polohu pohledu (Point of Regard, POR) ve směru osy X a Y. Tato hodnota je udávána v pixelech použitého monitoru a pro většinu studií, včetně aplikace v kartografii, je tato hodnota nejdůle-žitější. Mezi další parametry' patří například velikost zornice, pozice středu 143 Pre-processing dtil zornice, pozice a úhel natočení hlavy, pozice korneálního odrazu a další. Ukázka vyexportovaných raw dat je v tabulce 7. Tabulka obsahuje pouze časovou značku (Time), souřadnice pozice pohledu levého oka (L POR X, L POR Y) a název obrázku, který se k daným datům vztahuje (Stimulus). Tato data mohou být v aplikaci SMI BeGaze, případně pomocí dalších nástrojů, např. EMD (Komogortsev a kol., 2010), OGAMA a další, klasifikována na fixace a sakády. Ukázka takto klasifikovaných dat je v tabulce 8. U každé fixace nebo sakády je uvedena časová značka jejího začátku a konce (Start, End), dále délka trvání v mikrosekundách (Duration) a souřadnice v pixelech. U sakád jsou zde uvedeny souřadnice začátku i konce. Tab. 8 Eye-tracking data klasifikovaná na fixace a sakády Event Start End Duration StartX StartY EndX EndY Fixation 2864092592 2861850875 758283 842,69 519-71 Saccade 2864850875 2864875886 25011 844.16 489.87 614.32 473-56 Fixation 2864875886 2865475793 599907 577-39 437-20 Saccade 2865475793 2865509248 33455 586.56 455-07 944.01 679-79 Fixation 2865509248 28657J7480 208232 965.64 687.75 Saccade 2865717480 2865742492 25012 96391 682.63 966.17 689-33 Fixation 2865742492 2865867448 124956 968.57 687.98 Saccade 2865867448 286.5900712 33334 970.97 674.98 106.58 455-91 Fixation 2865900782 2866117401 216619 1059.43 451.11 6.3.1 Algoritmy pro detekci fixací a sakád Fixace je možné identifikovat manuálně (Harris a kol., 1988), ale existuje také velké množství klasifikačních algoritmu. Komogortsev (2010) zmiňuje několik studií, které se těmito algoritmy zabývaly, např. McConkie, 1981; Salvucci a Goldberg, 2000; Sauter a kol., 1991. Mezi nejčastěji používané patří algoritmy I-VT (Velocity Threshold Identification) a I-DT (Dispersion Threshold Identification), jejichž srovnání je znázorněno v tabulce 9. Tab. 9 Porovnání algoritmů I-VT a I-DT (upraveno podle Salvucci a Goldberg, 2000 Metoda Přesnost Rychlost Robustnost Jednoduchost Počet Parametrů I-VT SS * ss 1 I-DT s SS s 2 Legenda: SS - velmi dobré, V = dobré, * = špatné Algoritmus I-VT (Velocity Threshold Identification) je využíván pro data naměřená s frekvencí 250 Hz a vyšší (Holmqvist a kol., 2011). V naměřených datech se pro každou pozici oka vypočítá rychlost pohybu. Tato rychlost je poté porovnána s nastavenou prahovou hodnotou. Pokud je naměřená rychlost vyšší než prahová hodnota, je tento záznam označen jako část sakády. V opačném případě je označen jako část fixace. Primárním typem pohybu, který tento algoritmus detekuje, jsou sakády. Jako fixace jsou označeny úseky dat mezi nalezenými sakádami (Salvucci a Goldberg, 2000). Pro data naměřená s nižší frekvencí se nejčastěji využívá algoritmu I-DT (Dispersion Threshold Identification). Ten vyžaduje dva parametry -prahovou hodnotu pro rozptyl (Dispersion) a délku trvání fixace (Duration). Hlavní nevýhodou tohoto algoritmu je vzájemná vysoká závislost těchto dvou parametrů (Salvucci a Goldberg, 2000). Malá prahová hodnota pro rozptyl a velká hodnota pro délku mohou vést k tomu, že nebudou identifikovány žádné fixace. Z tohoto důvodu je u I-DT algoritmu velice důležité správné nastavení parametrů. Při vhodně zvolených prahových hodnotách však I-DT poskytuje velice dobré výsledky (Salvucci a Goldberg, 2000). Algoritmus I-DT je zaměřen na detekci fixací na základě prostorové a časové blízkosti naměřených pozic oka. V algoritmu je definováno časové okno, které se pohybuje naměřenými daty. Prostorová blízkost bodů obsažených v časovém okně je porovnávána s definovanou prahovou hodnotou. V případě, že je rozptyl nižší než prahová hodnota, body obsažené v časovém okně jsou označeny jako část fixace. V opačném případě se okno o jeden záznam posune a první bod předchozího okna je klasifikován jako část sakády (Komogortsev a kol., 2010). 6.3.2 Srovnání nastavení algoritmu I-DT Hledáním optimální prahové hodnoty rozptylu se zabýval Blignaut (2009). Ve své detailni studii došel k závěru, že optimální prahová hodnota pro rozptyl by měla být 1°. Podobnou hodnotu uvádějí i Salvucci a Goldberg (2000), kteří doporučují nastavení prahové hodnoty mezi 0,5° a t° vizuálního úhlu. Holmqvist (2011) doporučuje stanovení prahové hodnoty v intervalu mezi 0,5° a 2°. V některých aplikacích se prahové hodnoty uvádějí ve stupních, v jiných v pixelech. V případě, že je oko respondenta vzdálené od roviny obrazovky 70 cm, pak hodnota 1° vizuálního úhlu odpovídá 42,7 px. Výpočet podle goniometrických funkcí ostrého úhluje znázorněn na obrázku 90. 144 145 Eye-tracking (nejen) v kognitivní kartografii Pre-processmg dat 1680 px 475 mm x=2'lg0,5"70 K »1.22 cm 1,22 cm-42.7 px ____---—70 cm ...................------ Í 42.7 px álníbo úhlu - 42,7px ve stimulu Obr. 90 Převod mezi prahovou hodnotou udávanou ve stupních a pixelech Ve většině studií zaměřených na hodnoceni kartografických děl údaj o nastavení identifikačních algoritmů chybí. Hermans a Laarni (2003), kteří se zabývali analýzou hledání konkrétního objektu v interaktivní mapě, použili prahovou hodnotu rozptylu 20. Coltekin (2009) zkoumala efektivitu interaktivních map a prahovou hodnotu rozptylu nastavila na 50 px. Sama autorka však uvádí, že se toto nastavení neopírá o žádná předem stanovená pravidla. Stejné nastavení využila i ve své další studii (Coltekin a kol., 2010) a uvádí příklady dalších autorů, kteří použili stejné nastavení (např. Goldberg a Kotval, 1999). Irwin (1992) se zabýval stanovením optimální prahové hodnoty délky fixace a zjistil, že 100 ms je vhodný a praktický kompromis mezi teoretickým minimem a maximem. Ke stejnému zjištění došli také Manor a Gordon (2003). Podle Holmqvista (2011) by se měla prahová hodnota délky fixace pohybovat v rozmezí 50-250 ms. Hodnota 100 msje často využívána v kartografických studiích (Coltekin a kol., 2010; Coltekin a kol., 2009; Fabrikant a kol., 2010). Oproti tomu Hermans a Laarni (2003) nastavili prahovou hodnotu délky fixace pouze na 80 ms. Stanovení prahových hodnot algoritmu I-DT se může lišit podle oblasti studia a konkrétní studie. Doporučuje se také, aby byly vytvořené fixace porovnány s původními naměřenými daty (Holmqvist a kol., 2011). Pro určení nejvhodnějšího nastavení algoritmu I-DT, který je při analýze eye--traeking dat na KGI UP nejčastěji využíván, byla srovnána čtyři nastavení algoritmu I-DT označená jako Fix í-Fix 4. Fix 1 je základní nastavení používané programem SMI BcGaze. Nastavení Fix 2 použité ve studii Blignauta (2009) je velice podobné. Obě vytvářejí menší počet delších fixací. Takové nastavení je vhodné například pro úkoly, kdy uživatel nad stimulem neřeší žádný specifický úkol (free-viewing). Pro účely kartografie je však vhodnější identifikovat větší počet fixací s menší průměrnou délkou. Proto je nutné zvolit menší prahovou hodnotu rozptylu. Nastavení používané například ve studii Coltekin (2009), ale i dalšími autory je označeno jako Fix 3. Nastavení Fix 4 je definováno autorem na základě porovnání identifikovaných fixací s původními naměřenými daty. Prahové hodnoty jednotlivých nastavení jsou uvedeny v tabulce 10. Tab. 10 Srovnávaná nastavení identifikačního algoritmu v programu SMI BeGaze Fix 1 FÍX2 Fix 3 Fix 4 Autor nastavení SMI Default Blignaut (2009) Coltekin (2009) Popelka (2014b) Délka (ms) 80 100 100 80 Rozptyl (px) 100 90 50 50 Rozdíly mezi Fix 1-Fix 2 a Fix 3-Fix 4 jsou jasně patrné z ukázky na obrázku 91. Kružnice v prvních dvou řádcích (Fix 1, Fix 2) jsou jasně větší než v řádcích následujících (Fix 3, Fix 4), protože délka fixací je větší. hi-šij ilí til £ 11 » " í!ř Si] li! Z E £ Č š a Obr. 91 Porovnání čtyř nastavení identifikace fixací pomocí I-DT algoritmu Autorem vytvořené nastavení Fix4 je modifikací nastavení využívaného v kartografických studiích (např. Coltekin a kol., 2009). Pro ověření korektní identifikace fixací doporučuje Holmqvist (2011) vizuální porovnání fixací s prvotními (raw) daty. Protože nastavení Fix 3 a Fix 4 jsou si velmi podobná, identifikované fixace jsou téměř stejné. Při detailním pohledu je ale možné nalézt několik důležitých rozdílů. Výřez scanpath na obrázku 92 zobrazuje data jednoho uživatele 146 147 Eye-trackhtg (nefen) v kognitivní kw-iogrqfti (P04) na podkladu stimulu obsahujícího turistickou mapu. Úkolem respondentů v tomto experimentu bylo nalezení optimální trasy mezi dvěma body. Rozdílně identifikované fixace jsou na obrázku 92 označeny pomocí šipek. Při použití nastavení Fix 4 bylo identifikováno více fixací než při Fix 3. Při srovnání s původními naměřenými daty (bílá linie) je patrné, že se v těchto místech oko opravdu zastavilo (fixovalo). Obr. 92 Porovnání rozdílů výsledku identifikačního algoritmu. Při použití nastavení Fix 4 (vpravo) bylo nalezeno více fixací než v případě nastavení Fix 3 (vlevo). Rozdíly jsou označené pomocí šipek. Bílá linie reprezentuje původní naměřená data. 6-3-3 Nastavení detekce fixaci v SMI BeGaze a OGAMA Pro nastavení prahových hodnot identifikačního algoritmu v SMI BeGaze slouží nabídka File - Adjust Event Detection. Pokud zařízení umožňuje záznam s frekvencí alespoň 250 Hz, jsou přístupné nabídky jak pro Low Speed, tak pro Higb Speed (obr. 93). Adjust Event Detection EventDetection: ©lowSpeed ©Highspeed fixation detection parameters Geometry Mm. duration: [ 601 ms Stimulus screen resolutxxt Max.dispersion; j 50]px Horizontal: 1920 px Vertical: 1200 px Physical stimulus dimensions: Horizontat 474 mm Vertical: 297 mm Obr. 93 Nastavení detekčního algoritmu v prostředí SMI BeGaze Pm-processing dat Kromě prostého zadání prahové hodnoty délky (duration) a rozptylu (dispersion) umožňuje dialogové okno pouze vyřazení první fixace. V experimentech prováděných na KGI UP tato volba není používána, protože díky fixačnímu kříži všichni respondenti začínají prohlížet stimulus ze stejného místa na monitoru. Jak bylo uvedeno v kapitole 6.1, do OGAMA lze importovat data naměřená například pomocí eye-trackeru SMI. OGAMA by rovněž měla umožňovat import fixací, avšak bylo zjištěno, že tato funkce nefunguje. Z toho důvodu byla importována pouze raw data a následně byly nastaveny parametry pro identifikaci fixací přímo v aplikaci OGAMA. OGAMA provádí detekci fixací pomocí algoritmu I-DT, což je jeden z důvodů, proč jej volíme i v SMI BeGaze. V OGAMA se detekční algoritmus fixací nastavuje už při zakládání nového projektu, ale samozřejmě lze toto nastavení měnit i později. K tomu slouží Fixation Module (obr. 94). V okně moduluje nutné vybrat jednoho respondenta a konkrétní stimulus. Poté se zobrazí jeho fixace nad daným stimulem, a to jak graficky, tak jejich výčet v tabulce v dolní části modulu. Dialogové okno s nastavením detekčního algoritmu zobrazíme po stisku ikony ozubeného kola. Změna prahových hodnot se v datech projeví až po stisku tlačítka „Start" v okně modulu. Pomocí ikon napravo od tohoto tlačítka můžeme zvolit, zda bude změna provedena pouze pro vybraného respondenta nebo pro všechny respondenty v experimentu. Tato funkce může být užitečná v případě, že hledáme ideální nastavení identifikačního algoritmu a nechceme čekat, až se fixace přepočítají pro všechny respondenty. Obr. 94 Nastavení fixací v Fixation Module programu OGAMA 148 149 Eye-Iracking (nejen) v kognitivní kartografii Nastavení parametrů algoritmu I-DT v programu OGAMA jc od SMI BeGaze poměrně odlišné. Je nutné nastavit následující parametry: • Maximum distance - maximální vzdálenost v pixeleeh, kterou od sebe mohou být body vzdálené, aby byly stále považovány jako součást fixace; • Minimum number of samplcs - minimální počet bodů, které tvoří fixaci; • Merge - sloučení po sobě jdoucích fixací, které jsou blíže, než je maximální vzdálenost; • Diameter ratio of fixation - poloměr vykreslené kružnice bude zvětšen o rozdíl mezi délkou konkrétní fixace a touto hodnotou. Klíčové jsou především první dva parametry. Rovněž je nutné dávat pozor, zda je správně nastavena hodnota frekvence záznamu dat. K problémům může docházet zejména v situaci, kdy jsou nejdříve nastaveny parametry pro identifikaci fixací a až poté je stanovena hodnota frekvence. V této situaci totiž dojde ke změně parametru Minimum number of samples. Při hledání optimálního nastavení parametrů pro detekci fixací v OGAMA byl využit snímek scanpath z SMI BeGaze, vytvořený pomocí výše zmíněného nastavení 1-DT algoritmu (80 ms, 50 px). Přes tento obrázek byly vykreslené fixace detekované programem OGAMA. Parametry byly modifikovány, dokud nebylo nalezeno takové nastavení, které nejlépe odpovídá fixacím identifikovaným pomocí SMI BeGaze (tab. 11). Nejdůležitější parametry jsou „Maximum distance" a „Minimum number of samples", které odpovídají parametrům zadávaným do SMI BeGaze -rozptylu a délce fixace. Experimentálně bylo zjištěno, že optimální nastavení pro frekvenci 120 Hz je 15 px a 10 bodů. S použitím tohoto nastavení je výsledná trajektorie oka (scanpath) téměř shodná s trajektorií vytvořenou v aplikaci SMI BeGaze. Důležité je zmínit, že v tomto případě měla data frekvenci 120 Hz. V případě záznamu s frekvencí 250 Hz by měl parametr Maximum number of samples mít hodnotu 20. Pro 60 Hz by to potom byla hodnota 5. Hodnota parametru „Diameter ratio of fixation" ovlivní pouze grafické zobrazení fixací prostřednictvím scanpath. Se zobrazením scanpath z aplikace SMI BeGaze nejlépe korespondovala hodnota parametru 12, pouze u velmi dlouhých fixací docházelo k rozdílům, jak je patrné z obrázku 95. Zde jc porovnán scanpath vzniklý v aplikaci SMI BeGaze (fialové kruhy) s fixacemi identifikovanými v aplikaci OGAMA (modré kružnice) pomocí výše uvedeného nastavení algoritmu. K jediné odchylce došlo v levé části obrázku vlevo, kdy aplikace OGAMA identifikovala jednu krátkou fixaci navíc oproti SMI BeGaze. Rozdíl v grafické vizualizaci velmi dlouhých fixací je znázorněn na obrázku vpravo. Obě nesrovnalosti je možné vyřešit změnou parametrů identifikačního algoritmu, ale tato změna by ovlivnila všechny ostatní fixace. Obr. 95 Srovnání fixací identifikovaných na dvou různých stimulech programy SMI BeGaze (fialové kruhy) a OGAMA (modré kružnice). Rozdílně identifikované fixace jsou označené červenou šipkou. Závěrem kapitoly lze shrnout optimální nastavení detekce fixací pro SMI BeGaze i pro program OGAMA. Optimální hodnoty pro kartografický výzkum jsou uvedeny v tabulce 11. Tab. 11 Optimální nastavení detekce fixací pro kartografický výzkum v programech SMI BeGaze a OGAMA Parametr algoritmu I-DT Optimální nastavení SMI BeGaze Min. duration 80 ms Max. dispersion 50 px Maximum distance 15 5 (60 Hz) Minimum number of samples 10 (120 Hz) OGAMA 20 (250 Hz) Merge NO Diameter ratio of fixation 12 6.4 Čištění dat Před vlastní analýzou naměřených dat je nutné zkontrolovat, zda jsou naměřená data dostatečně kvalitní. Častým problémem může byt (prostorový') posun dat způsobený nedostatečnou kalibrací nebo chybějící data (DataLoss). 6.4.2 DataLoss DataLoss neboli ztráta dat může být způsobena ztrátou signálu (eye-tracker nevidí oko), ale také třeba prostým mrknutím. Z toho plyne, že téměř nikdy není dosaženo zaznamenání 100 % dat. Mnohdy se ale stane, 150 151 Eye-ttačkmg (nejen) v kognitivní kartografii že je ztraceno větší množství dat, a analytik by měl takového respondenta z testování vyřadit, aby neovlivňoval výsledek celého experimentu. V prostředí SMI BeGaze lze vyexportovat tzv. Participant Overview (sekce Specialized Statistics). Zde je pro jednotlivé respondenty vidět odchylka kalibrace ve směru os X a Y ve stupních (obr. 96). Součástí Participant Overview je rovněž tzv. Tracking Ratio, což je hodnota udávající, kolik procent z celkové doby trvání experimentu byl zaznamenáván pohyb očí. To znamená, pro kolik procent záznamů jsou v datech uložené jiné hodnot)' než o;o. V SMI BeGaze bohužel nelze tuto statistiku zobrazit pro jednotlivé stimuly, ale pouze pro celý experiment. P01 04 02 976 P03 0.4 06 370 rot 03 0.4 3S.7 P05 20 20 972 0.E DS »3 P09 OJ 0.4 92 5 P1C OJ 03 990 Obr. 96 Ukázka Participant Overview. Tabulka ukazuje odchylku kalibrace a Tracking RaLio pro jednotlivé respondenty. Oproti tomu v aplikaci OGAMA je možné vyexportovat procento chybějících dat pro jednotlivé stimuly. Ve Statistics module je nutné zvolit Trial information - Additional parameters a zde je nabídka DataLoss. Vyexportovat jdou jak absolutní, tak i relativní data. Kromě počtu chybějících záznamů (tj. záznamů se souřadnicemi o;o) lze zobrazit i počet záznamů naměřených mimo monitor (např. -200 px). Data jsou vždy vztažena k jednotlivému respondentovi a jednotlivému stimulu. Pro hlubší analýzu těchto dat je vhodné využít tabulkový procesor a pomocí kontingenční tabulky si zobrazit, u kterých stimulů a respondentů byla zaznamenána chybějící data. To lze udělat například tak, že v řádcích kontingenční tabulky budou zobrazeny jednotlivé stimuly, ve sloupcích respondenti a jako hodnota pole bude vybrán součet DataLoss (relativní hodnota). Protože pro každou kombinaci respondenta a stimulu je pouze jedna hodnota, bude tento „součet" odpovídat původním vyexportovaným datům. Výslednou kontingenční tabulku lze upravit tak, jak je znázorněno na obrázku 97. Pomocí funkce podmíněné formátování byly označeny ty buňky, kde byla ztráta dat vyšší než 10 %. Z tabulky je vidět, že u respondentů a6i8, a624 a a62ó byly vysoké hodnoty DataLoss u velkého množství stimulů. Tato konkrétní data byla zaznamenávána pomocí zařízení EyeTribe, takže úplně stoprocentní data se nedala očekávat. Přesto by bylo asi vhodnější tyto respondenty z následné analýzy Pre-processing dat vyřadit, a to i přesto, že celková průměrná hodnota DataLoss za všechny stimuly je nižší než 100 %. Velmi důležitá jsou pole označena oranžovou barvou, kde OGAMA nevyexportovala žádné hodnoty. To je způsobeno tím, že byl proces nahrávání nečekaně přerušen a nebyla zaznamenána vůbec žádná data. Z toho plyne, že respondenta a6o6 je nutné z analýzy rovněž vypustit. řfcOj a 602 »604 a&06 a 608 a616 a61B ä62Q ob! ? ■624 ,JÚ?.Ó . ulohal 1 iPí ■,.ri2 0,85 0.0c 2,23 0.34 6,44 29,51 3,24 1,89 7,as 4,51 5.52 ■ ■I..' .-i > it>g 3,44 0.77 i, 53 2,50 1,07 2,5; 1J EH 4,29 1.46 13 44 5.57 4, as UlOlMl_l.jp£ 3,93 1,90 0,50 1,88 1,58 5 15 1,97 ::»- ■: M J ] 6.44 ulotial 4.ip£ %_tl 6.65 1,16 ifiS 1,04 L :i VMM 1,64 2,23 10,19 8,73 4,92 itlohai bodl ipí 3.C7 1,08 n ',í ■:.:: 0,00 2 ■:. 0,00 4.66 3.23 6.25 14,35 3,26 úloha) bodJ.ipg S 5: :," L OJ 2 .': 0,34 1.85 0,20 3,45 1.55 11.92 5 h ulohal ImifJ.ipft 3.75 : -: í :: 1,77 0,14 2,98 0,54 2,66 r.n £.75 2.2: : 0; 4.80 0,00 1.19 :,jy 0,66 1.9S 3,21 8.75 ■1.17 4.S3 " > ipc 1,62 7,43 2,10 1,3S 0,00 8,63 3.01 i,sí 3,84 ulOh»2 ! iPÍ 1 5.9t> 2.63 D, DO □,00 1,46 ■ 71 0,00 2,12] 3,83 4,37 c.61 uloha2_4 jPH 7,21 c,as 1,22 0,73 0 6L 4,71 1,80 3,60 17,14 ň 6" • ■■■í,ai ľ-.iJI 6,20 C.c<5 [i.ŮO 0,76 0,40 4,24 7,0? 15,22 u a 7,75 ulohaíJmdJ pg 4.01 ese 3,00 0,00 0,00 0,3! 1.73 2,63 8,63 2,10 ulohií Uni«2.)pjt 2,43 3.52 0,38 0,00 0,97 0,75 2.39 0 4" 1,78 0.73 1,34 .;!.)! : p„ 5,36 5,85 0,00 c ■-' 0.-5 i cc 4,71 1.62 .. ■■: 9,67 5,56 ,-icha) i-pa 1,23 0,63 1,52 o.c; 0,00 5.73 4,86 2,78 3,66 5,98 2.í4 úloha J í pf 2,90 4,87 c.c: 1,69 1.87 3,20 0,00 2,04 s,:i 13 l,f.S ulOhiJ 4 |pf> IM . 1,37 1,25 14 :■ 5,50 1.72 2i -'• S.4s i.57 .iionil twwli (:■• :.:o 1,31 0,60 1,71 0 0: 3.20 2,90 1; ,\ B,57 4.3i ulohíl bod 2 j PS a k 3,53 O.O: 0.25 1,10 0,00 3.33 : 4, - 52 5.28 <.n-i(_ :..;tj jp,; 2,2S 8,17 0,00 0.12 1,81 C 03 2,7B 1,44 í, 3-; 2,19 2.7í Průměr 4,56 '. r> 0,66 2,24 0,56 3,11 E, 04 3,29 1,83 9,56 5.£4 4,44 Obr. 97 Upravená kontingenční tabulka ukazující DataLoss pro 11 respondentů Je na analytikovi, jak si nastaví hraniční hodnotu a která data do analýzy použije a která nikoliv. Toto rozhodnutí záleží především na použitém zařízení a také na typu úkolu. Pokud měl například respondent během experimentu za úkol něco hledat v zadání na papíře, dá se předpokládat že DataLoss bude u těchto experimentů vyšší (protože musel hledat v zadání, a tím pádem se nedíval na monitor a souřadnice jeho pohledu tedy byly o;o). Ne všechny chyby v datech je lze takto jednoduše odhalit. Příkladem může být situace na obrázku 98. DataLoss v tomto případě nepřesahovalo ani 7 %, přesto však tato data nelze použít. Polovina ze zaznamenaných fixací se nachází na levém okraji stimulu. Tento typ chyby je typický pro záznam pomocí EyeTribe trackeru. Pokud je toto zařízení použito, je nutné věnovat hlubší pozornost kontrole dat a stimuly či respondenty, u kterých se tyto chyby vyskytují, z výsledného hodnocení vyřadit. 152 153 kve-rracking (nejen) v kognitivní kartografii Fre-processing dat 3 Tí^- "^S--FIT- m ]■> 'buvkb li""**""'" t —~i---- i£-s--"^IT^i, c * • — - ,! Obr. 98 Chyba v datech, kterou je nutné odhalit vizuální inspekcí. 6.4.2 Chyby způsobené nevhodným nastavením detekce fixací Dalším častým zdrojem chyb při analýze eye-tracking dat je nevhodné nastavení prahových hodnot detekčního algoritmu. Optimální nastevení identifikace fixací jak v SMI BeGaze, tak v OGAMA bylo popsáno v kapitole 6.3.3. Korektní nastavení identifikace fixací je velmi důležité, protože valná většina metod analýzy pracuje právě s fixacemi. Na obrázku 99 je znázorněno, jak změna dvou nej důležitějších parametrů identifikace fixací v OGAMA ovlivní výsledek. V levé části obrázku je korektní nastavení algoritmu tak, jak bylo popsáno v kapitole 6.3.3. V pravé části je upravené nastavení. Je jasně patrné, že tato změna způsobila, že z původních deseti fixací zůstaly pouze čtyři. Obr. 99 Porovnám korektního (vlevo) a nesprávného (vpravo) nastavení identifikace fixací v programu OGAMA K chybám velmi často dochází v případě, že uživatel nesprávně nastaví frekvenci záznamu dat a poté ponechá defaultní prahové hodnoty identifikačního algoritmu. To se stává zejména při použití EyeTribe trackeru, kdy si uživatel myslí, že zaznamenával data s frekvencí 60 Hz, ale zapomněl změnit nastavení a ve skutečnosti byla data zaznamenávána pouze s frekvencí 30 Hz. Pokud v takovémto případě ponechá defaultní nastavení detekce fixací, může se stát, že dosáhne průměrného počtu fixací na stimulus menší než 1. Z takových dat poté samozřejmě nelze vyvozovat žádné závěr}". 6.4.3 Odchylka dat V kapitole 6.4 bylo uvedeno, že v prostředí SMI BeGaze lze vyexportovat odchylku kalibrace. Ta by měla být co nejmenší. Většinou se uvádí méně než 0,5° či 1°, ale vždy záleží na charakteru stimulů a účelu testování. Pokud budou na stimulu zaznačovány malé oblasti zájmu, je nutné mít odchylku kalibrace co nejmenší. Ve všech případech je ale vhodné vizuálně zkontrolovat, zda scanpaťh odpovídá stimulu. Například zda je při čtení textu zaznamenána trajektorie pohybu očí na dané větě nebo jestli není posunuta. Tato kontrola by měla probíhat i během vlastního eye-tracking testování, aby bylo možné například upravit pozici respondenta před monitorem. Pokud jsou naměřená data posunuta, je možné tento nedostatek opravit i zpětně posunutím celého scanpath. Tato možnost je dostupná v programu OGAMA, nicméně je nutné opravit data pro každého respondenta a každý obrázek, tudíž je tato operace velmi časově náročná a navícje do dat vnášena určitá nejistota, protože záleží na analytikovi, o kolik px data posune. Ukázka takového posunu je vidět na obrázku 100. V levé části jsou zobrazena data jednoho respondenta, která jsou od reality posunuta směrem dolů (respondent se díval na legendu, ale data jsou níž). V pravé části obrázku došlo k posunu dat o 40 px směrem nahoru. Důležité je každou změnu v databázi OGAMA uložit. Tato operace ale většinou trvá dlouho a OGAMA během ní bohužel někdy nečekaně spadne. Obr. 100 Data zaznamenaná s posunem směrem dolu (vlevo) a stejná data po korekci v programu OGAMA (vpravo) '7,4 155 Eye-tracking inejenj v kognitivní kartografii Pre-processing dot Obdobně lze fixace posunout i v SMI BeGaze. Výhodou je, že lze posunout fixace za určitý časový úsek, tedy ne za celou dobu sledování stimulu. Nevýhodou je to, že je celý proces o něco složitější. Pokud výzkumník zjistí, že od určitého okamžiku došlo k posunu zaznamenaných eye-tracking dat, což se může stát například díky změně pozice respondenta, může data opravit pomocí nástroje Offset Correction. Ten je dostupný v nástrojích Custom Trial Selector, Gaze Replay, Scan Path a Bee Swarm. Výzkumník neprve umístí posuvník časové osy do času, kdy došlo k posunu. Následně v okně stimulu stiskne pravé tlačítko myši a zvolí možnost Offset Correction. Poté drží levé tlačítko a pomocí tahu myši posune kurzor na místo, kde má být další fixace. Po uvolnění dojde k posunu všech dalších fixací. Po tomto posunu se v menu zobrazeném po stisku pravého tlačítka objeví možnost Reset Offset Correction, která vrátí fixace na původně naměřené pozice, ovšem až od času, ve kterém byla tato možnost zvolena. V SMI BeGaze je možné tyto nástroje různě kombinovat a řetězit tak, jak je znázorněno na obrázku 101. Run ~l I 1 I—l I-1 I- _o I o o I o Triíl 1 Tri»l 2 Trial 3 Obr. 101 Řetězení nástrojů Offset Correction a Reset Offset Correction v prostředí SMI BeGaze (SMI, 2008) Velice důležité je pamatovat na to, že posun fixací v SMI BeGaze není omezen pouze najeden stimulus, ale dojde k posunu všech dat od zadaného času až do konce experimentu. 6.5 Segmentace záznamu obrazovky Posledním typem předzpracování eye-tracking dat je takzvaná segmentace záznamu obrazovky. V aplikaci SMI BeGaze se tato funkce jmenuje Custom Trial Selector a jejím účelem je rozdělení stimulu do více trialů či úseků. Typicky se tato funkce používá v případě, že je stimulem záznam obrazovky. V modelovém případě byla analyzována mapová aplikace, nad kterou respondent řešil pět razných úkolů. Při zobrazení naměřených dat v SMI BeGaze je v seznamu stimulů vidět pro každého respondenta videozáznam pro každý úkol zvlášť (obr. 102). Není tedy možné porovnat chování několika respondentů během jednoho úkolu. Stimuli P01-KirecmKv -^—mm 1 ■ 1 1920x1200 «■ P01-scrrec1.mkv 1920x1200 ■ POI-scrrecimkv 1920x1200 ■ P01 -scrrec3jnlcv 1920x1200 ■ P01-scrr«4jnlcv 1920x1200 ■ POI-soretíwnlcv 1920x1200 ■ P02-scrrecm1ev 1920x1200 ■ P02-scirec1.nl lev 1920x1200 ■ P02-sarecZmlcv 1920x1200 ■ Obr. 102 Zobrazení stimulů při záznamu obrazovky v prostředí SMI BeGaze Pomocí Custom Trial Selector lze videozáznam rozdělit na libovolný počet úseků, například na počet odpovídající jednotlivým úkolům. Funkce Custom Trial Selector je dostupná prostřednictvím ivkony v horní oblasti prostředí SMI BeGaze (obr. 103 nahoře). Nejprve je nutné vytvořit sereenshot, nad kterým budou separovaná data zobrazována. V časové ose v dolní části obrazovky si uživatel zobrazí požadovaný moment a poté pomocí tlačítka „+" v levé části obrazovky vytvoří sereenshot neboli Custom Trial. Ten si může libovolně pojmenovat (např. úkol 1). Následně na tento Custom Trial klikne a v časové ose označí odpovídající úsek videa. Pomocí žlutého pruhu v dolní části obrazovky se zvýrazní, že daná část záznamu odpovídá tomuto konkrétnímu trialu. Obr. 103 Použití funkce Custom Trial Selector v prostředí SMI BeGaze 156 157 Eye-tracking (nejen) v kogninvní kinrografii Tento postup je nutné zopakovat pro všechny respondenty, takže tato operace může být časově velmi náročná. Nicméně výsledkem je přiřazení záznamu všech respondentu k jednotlivý™ sereenshotům, které se následně jeví tak, jako by se respondenti dívali na stejný obrázek. Při následném zpracování je nutné pamatovat na to, že vytvořený Screenshot nemusí odpovídat tomu, co na obrazovce respondent skutečně viděl. Využití Custom Trial Selectol- je tedy vhodné především v těch případech, kdy je obraz víceméně statický, ale z nějakého důvodu bylo využito záznamu obrazovky. K tomu může dojít například v případě, že stimulus obsahuje nějaké interaktivní prvky. Příkladem může být studie Opacha a kol. (2017), která obsahovala množství úkolů nad stejnými mapami obsahujícími glyphy. Při najetí myší nad jednotlivé glyphy byly interaktivně zobrazeny určité informace (obr. 104) a navíc stránka obsahovala pole pro zadávání odpovědi. Z toho důvodu nemohly být jako stimuly použity obrázky. -------' '--- > Ä g CL - ji — E9 2 .v. ~ Obr. 104 Ukázka prostředí obsahujícího interaktivní prvky Pre-processing dat P01 P02 P03 P04 P05 P06 ÍSS^ShMMI wiwm ««iib 'iiwf li mi ■§■)■ 1 IIIHMMHHMll mb< li 1 ni li ■■■ ■i Mwitin mt Vyhledáván' ■Í Nástroje maov ■1 Mapové pole - - Strom vrstev ■IIB1 1 P07 ■i II II P08 ■miiHiii P09 P10 P11 |BHBHHBlBHIBHBBillWII iii ■■MIH! ______.. .„—^^.IIIIHHMIiMaHi ■■■■■■ P12 P12 P14 P1Í lil 1 ■■ľ1"""-'1 ■■¥■■■■■ii 0 10 20 30 40 50 60 70 80 90 Time [s] 100 110 Obr. 105 Sequence Chart vytvořený z dat záznamu obrazovky segmentovaných pomocí Custom Trial Selectoru Custom Trial Selector lze využít i v případě, kdy se obsah mění velmi výrazně. Příkladem této situace může být analýza mapové aplikace popsaná v modelovém příkladě na začátku této kapitoly. Přestože respondenti mohou s mapou pohybovat atd., základní rozdělení obrazovky na jednotlivé části, jako je mapové pole či strom vrstev, je vždy stejné. Po použití Custom Trial Selectoru je tedy možné analyzovat čas ěi počet fixací zaznamenaný v oblastech zájmu odpovídajících jednotlivými segmentům mapové aplikace. Výsledkem tedy může být například Sequence Chart, který ukazuje, do kterých části aplikace se respondenti během úvodního seznámení s prostředím dívali (obr. 105). 158 159