Faktorová analýza o cíl faktorové analýzy o základní pojmy, postup o interpretace faktorů o příklad Cíle faktorové analýzy o cílem faktorové analýzy (exploratorní) je n 1) redukce dat – zmenšení počtu proměnných odstraněním nadbytečných proměnných (tj. těsně korelujících s ostatními proměnnými) n 2) idetifikace struktury dat – prozkoumat vztahy mezi proměnnými Výsledek faktorové analýzy o výsledkem faktorové analýzy (exploratorní) je vytvoření několika hypotetických proměnných – faktorů n někdy bývají nazývány latentní proměnné o faktory jsou lineárními kombinacemi původních proměnných (váženými součty) o vysvětlují vztahy mezi původními proměnnými Faktorová analýza o korelace většího množství proměnných se analyzuje tak, že se hledají shluky proměnných, které spolu navzájem korelují silně a s ostatními proměnnými naopak slabě nebo vůbec o faktory se interpretují podle toho, které proměnné obsahuje daný shluk Faktorová analýza o cílem je najít malé množství faktorů, které vysvětlí velké množství variability dat o faktory jsou navzájem nekorelované (=každý měří jinou dimenzi dat) Korelační matice Korelační matice Extrakce faktorů o extrakce faktorů – na základě matice vztahů mezi proměnnými (např. korelační matice) n pokud např. všechny původní proměnné vzájemně silně korelují, pak můžeme celkový rozptyl zachytit pouze jedním faktorem n naopak pokud jsou všechny vzájemné korelace slabé, pak potřebujeme k vysvětlení celkového rozptylu tolik faktorů, kolik je původních proměnných o počet extrahovaných faktorů – do určité míry závisí na rozhodnutí výzkumníka Korelační matice Korelační matice Vlastní hodnota o podíl variability původních proměnných, vysvětlených faktorem, se označuje jako vlastní hodnota (eigenvalue) o používá se i označení vlastní čísla nebo charakteristické kořeny o součet vlastních hodnot všech faktorů odpovídá počtu původních proměnných Faktorová analýza o cílem je vysvětlit co největší množství rozptylu (80-90%) původních proměnných co nejmenším počtem faktorů o při rozhodování o počtu extrahovaných faktorů se používá tzv. sutinový graf (scree plot), který ukazuje závislost vysvětlené variability na počtu faktorů – znázorňuje pro každý faktor hodnoty vlastních čísel o faktory jsou uspořádány podle toho, kolik variability původního souboru proměnných vysvětlují Extrakce faktorů o 3 možná kritéria n vybereme prvních x faktorů, které vysvětlují dostatečné množství rozptylu n vybereme faktory s vlastní hodnotou větší než 1 (Kaiserovo kritérium) n v sutinovém grafu najdeme náhlý přechod z prudkého klesání do mírného Sutinový graf pro korelační matici předmětových testů Tabulka vlastních čísel Extrakce faktorů o podle Kaiserova kritéria – 2 faktory o podle sutinového grafu – 2 faktory o podle tabulky vlastních čísel – n 2 faktory vysvětlují 86% rozptylu n 3 faktory 95% Interpretace faktorů o interpretace faktorů – faktorová analýza sama o sobě nenabídne označení faktorů (to je opět na výzkumníkovi) o faktor bývá označen na základě proměnných, které k němu mají nejtěsnější vztah (nejvyšší tzv. faktorové náboje/zátěže – korelace mezi faktorem a položkou) Faktorové zátěže Komunalita o část variability proměnné, která je vysvětlená extrahovanými faktory, se nazývá komunalita o zbylá část (1-komunalita) se nazývá jedinečnost o komunality všech proměnných v modelu by měly být vysoké – ty s nízkými komunalitami je vhodné vyřadit Tabulka komunalit Rotace faktorového řešení o rotace faktorového řešení – usnadní interpretaci faktorů o cílem rotace je dosáhnout, aby původní proměnné měly vysoké zátěže s co nejmenším počtem faktorů – a s ostatními faktory měly naopak zátěže nízké (celkový podíl vysvětleného rozptylu ale zůstává stejný) o rotace může být ortogonální (tj. předpokládá, že faktory jsou nezávislé; např. Varimax) nebo šikmá (předpoklad korelace mezi faktory; např. Oblimin) Faktorové zátěže po rotaci Varimax Faktorové skóry o výsledky faktorové analýzy lze uložit v podobě nových proměnných – faktorových skórů, a s nimi pak dále pracovat o pro náš příklad bychom proto mohli uložit dvě nové proměnné – výsledek z didaktického testu přírodovědných a z humanitních předmětů (místo původních 5) Analýza hlavních komponent o analýza hlavních komponent (PCA = principal component analysis) o metoda extrakce faktorů – na rozdíl od analýzy hlavních faktorů (PFA) využívá veškerou variabilitu proměnné, zatímco PFA pouze společnou s ostatními proměnnými o většinou mají podobné výsledky o PCA se používá více (především jako metoda redukce dat), PFA spíše pro objasnění struktury dat Faktorová analýza - příklad o příklad aplikace FA: o Osecká, L., Řehulková, O., Macek, P. (1998). Zdravotní stesky adolescentů: struktura a rozdíly mezi pohlavím. Sborník konference Sociální procesy a osobnost, MU Brno. Faktorová analýza - příklad o cílem studie bylo mj.vytvořit typologii adolescentů na základě jejich zdravotních obtíží o adolescenti v dotazníku označili, jak často trpí každou z 18 nabídnutých zdravotních obtíží Faktorová analýza - příklad o bolesti hlavy o dýchací potíže o žaludeční potíže o závratě o nechutenství o nervozita, neklid o nespavost o noční můry o nesoustředěnost o nevolnosti o silný tlukot srdce o třesení rukou o náhlé zpocení o průjem, zácpa o bolesti v zádech o krční bolesti o bolesti na prsou o bolesti v pánvi Faktorová analýza - příklad o typologie na základě 18 proměnných by byla příliš složitá – je třeba tento počet snížit o autoři spočítali faktorovou analýzu (metodou analýzy hlavních komponent) a extrahovali 3 faktory (vysvětlovaly celkem 48% společného rozptylu) Faktorová analýza - příklad Faktorová analýza - příklad o první faktor nazvali nevolnosti – sytily ho především tyto potíže: n nevolnosti n nechutenství n závratě n žaludeční potíže n bolesti hlavy n nervozita, neklid Faktorová analýza - příklad o druhý faktor označili vegetativní obtíže – sytily ho především položky: n třesení rukou n nespavost n náhlé zpocení n silný tlukot srdce n nesoustředěnost n noční můry Faktorová analýza - příklad o třetí faktor označili bolesti – sytily ho především tyto potíže: n bolesti v pánvi n průjem, zácpa n bolesti na prsou n krční bolesti n bolesti v zádech Faktorová analýza - příklad o místo původních 18 proměnných indikujících frekvenci zdravotních potíží měli nyní 3 proměnné (lineární kombinace původní proměnných) – nevolnosti, vegetativní potíže a bolesti o s nimi pak pracovali při typologii (viz další přednášky) Literatura o Hendl: kapitoly 13.7 a 13.8 o článek Osecká, L., Řehulková, O., Macek, P. (1998). Zdravotní stesky adolescentů. In M. Blatný (Ed.): Sociální procesy a osobnost. Brno 1998, str. 135-144.