ANOVA Seminář 5 Původ dat, se kterými budeme pracovat •Data bicyclists.sav pocházejí se studie, která se zabývala různými prediktory toho, v jaké vzdálenosti řidiči motorových vozidel předjíždějí cyklisty: •Walker, I. (2007). Drivers overtaking bicyclists: Objective data on the effects of riding position, helmet use, vehicle type and apparent gender. Accident Analysis & Prevention, 39(2), 417–425. https://doi.org/10.1016/j.aap.2006.08.010 •Autor sám najezdil na kole 320 km v různých britských městech. Jezdil v různé denní době od 7:00 do 18:00 a po různých silnicích. •Zkoušel jezdit s helmou/bez helmy a v různé vzdálenosti od kraje silnice. •Zaznamenával, v jaké vzdálenosti jej předjíždějí motorová vozidla (pomocí ultrazvukového snímače) a o jaké vozidlo se jednalo. • Stručný popis dat Proměnná Popis id Prostý numerický identifikátor události (předjetí) vehicle Typ vozidla, které cyklistu předjelo color Barva vozidla, které cyklistu předjelo pass_distance V jaké vzdálenosti cyklistu vozidlo předjelo / kolik místa mu nechalo (v metrech) street Typ silnice, po které cyklista jel na kole, když jej vozidlo předjelo. time Denní čas v hodinách + minutách, kdy došlo k předjetí. hour Denní čas (pouze hodina), kdy došlo k předjetí helmet Měl v době předjetí cyklista nasazenu cyklistickou přilbu? kerb V jaké vzdálenosti od kraje vozovky cylista na kole jel, když byl předjet. bikeline Jel v daném momentě cyklista v pruhu pro cyklisty? city Město, kde cyklista jel (Salisbury, Bristol, Porthmouth). date Datum Zadání analýzy Analýza 1 •Pomocí one-way ANOVA nejprve otestuje H., že jsou rozdíly v bezpečnosti předjetí mezi typy vozidel, která cyklistu předjela (proměnná vehicle). •Pomocí ortogonálních kontrastů pak ověřte: –Zda profesionální řidiči míjí cyklistu v bezpečnější vzdálenosti než ostatní řidiči. Předpokládejme, že profesionálové řídili tyto typy vozů: Large Goods Vehicle, Bus, Heavy Goods Vehicle, Taxi. –Zda řidiči jednostopých motorových vozidel (Powered Two Wheeler) míjí cyklistu v bezpečnější vzdálenosti než řidiči osobních aut (Ordinary Car, SUV/Pickup). –Zda profesionální řidiči ve větších vozidlech (Large Goods Vehicle, Bus, Heavy Goods Vehicle) objíždějí cyklistu v méně bezpečné vzdálenosti než řidiči taxíků. – • Analýza 2 •Pomocí faktoriální ANOVA ověřte, zda řidiči míjí cyklistu v méně bezpečné vzdálenosti, –když má cyklista helmu (helmet, předpokládáme, že když má cyklista helmu, řidiči nemají tak silný pocit, že jej ohrozí těsnějším předjetím) a –když jede dále od okraje silnice (kerb, tj. blíže středu silnice). •Počítejte s interakcí mezi nošením helmy a vzdáleností cyklisty od okraje silnice. Efekt nošení helmy by se měl projevit především tehdy, když cyklista jede blíže okraje silnice (protože když jede blíže středu silnice, řidiči nemají takový výběr v tom, v jaké vzdálenosti ho předjedou). •Do modelu zahrňte také hlavní efekt typu vozidla (ale nikoli interakce typu vozidla s ostatními prediktory). • – Opakování One-way ANOVA Typy kontrastů http://www.jds-online.com/files/JDS-563.pdf My se zaměříme na tzv. ortogonální kontrasty •Pravidla pro jejich vytváření: 1.Dopředu promyslete, jak chcete skupiny srovnávat. 2.Vytvořte si stromový diagram plánovaných kontrastů a nezapomeňte, že každá skupina by se měla objevit samostatně pouze v jednom kontrastu. 3.Maximální počet kontrastů = 1 – počet srovnávaných skupin. 4.Skupiny (resp. skupina), kterým přiřadíte v daném kontrastu pozitivní váhy (koeficienty), se porovnají se skupinami, kterým přiřadíte negativní váhy. 5.Pro každý jednotlivý kontrast by se součet vah měl rovnat nule. 6.Skupině, kterou nechcete do kontrastu zahrnovat, dejte váhu = 0. 7.V rámci jednoho kontrastu volte takové váhy, aby se pozitivní váhy nasčítaly do 1 a negativní váhy do -1 (výhodné v rámci ANOVa – hodnota kontrastu je pak rovna rozdílu srovnávaných průměrů.) –V rámci jednoho kontrastu volte takové váhy, aby hodnoty pozitivních vah odpovídaly počtu skupin s negativními váhami a (obráceně) aby absolutní hodnota negativních vah odpovídala počtu skupin s pozitivními váhami (výhodné, když chceme kontrasty použít v regresi – hodnota kontrastu vynásobená počtem srovnávaných skupin je pak rovna rozdílu srovnávaných průměrů). 8. Příklad ortogonálních kontrastů Kontrast Skupina 1 Skupina 2 Skupina 3 Skupina 4 Skupina 5 Součet vah C1 +2 –3 +2 +2 –3 0 C2 +2 0 –1 –1 0 0 C3 0 0 +1 –1 0 0 C4 0 +1 0 0 –1 0 Součin sloupce 0 0 0 0 0 0 Faktoriální ANOVA •Podobně jako v případě one-way ANOVA ji používáme k testování rozdílů mezi průměry skupin. •Na rozdíl od one-way ANOVA ale pracujeme s více než jednou nezávislou kategorickou proměnnou ("faktory") a více nás zajímá jejich interakce: můžeme např. očekávat větší rozdíly mezi muži a ženami při nižší úrovni vzdělání. •Příklady: Chceme zjistit, jaký efekt má pohlaví a úroveň vzdělání na zájem o politické dění. Chceme zjistit, jaký efekt má typ pracovní pozice a věk (rozdělený do několika kategorií) na míru stresu. Chceme zjistit, jaký efekt má pohlaví, typ citové vazby a partnerský status na well-being atd. Předpoklady mezisubjektové ANOVA 1.Závislá proměnná je měřena minimálně na intervalové úrovni. 2.Nezávislá proměnná (proměnné) je kategorické povahy. 3.Dostatečný počet případů. Měli bychom zkontrolovat četnosti v jednotlivých buňkách. 4.Nezávislost pozorování. Každý respondent byl měřen jen jednou a členství v kategoriích každé nezávislé proměnné je vzájemně výlučné. 5.Absence silné multikolinearity (v důsledku nevyváženého designu). Stejně jako v případě předchozích analýz platí, že když spolu naše nezávislé proměnné (prediktory) souvisejí příliš silně, je obtížné identifikovat jejich jedinečný efekt (např. kdybychom analyzovali efekt pohlaví a vzdělání, ale naprostá většina žen z našeho vzorku by měla vysokou školu, zatímco naprostá většina mužů by měla pouze střední školu bez maturity). Zvolený typ součtu čtverců pak může zásadně ovlivnit odhad efektů jednotlivých prediktorů. 6.V rámci každé skupiny (v případě faktoriální ANOVA se tím myslí v rámci každé kombinace úrovní všech nezávislých proměnných) ověřujeme: a)Normalitu rozdělení závislé proměnné. b)Absenci odlehlých případů. c)Shodu (homogenitu) rozptylů (Welchova ANOVA tento předpoklad nevyžaduje). d) d) d) 7. Velikosti účinku Velikosti účinku: kontrasty a srovnání dvou konkrétních skupin Příklady tabulek Příklady tabulek