Faktorová analýza PSYb2590: Základy psychometriky | Přednáška 4 12. 3. 2024 | Petr Palíšek & Hynek Cígler (& Adam Ťápal) FA v kostce Pokud a zároveň , pak platí: Metaforické pochopení FA nestačí. Je nezbytně nutné skutečně rozumět analytickému principu. Uvedené vzorce je bezpodmínečně nutné chápat, znát a umět použít. Jsou jednoduché; zbytek hodiny se je pokusíme interpretovat. Konceptuální úvod do FA • Faktorová analýza a realismus • Latentní proměnné • Faktorová analýza •Specifikace FA •Datový model FA •Common Factor Model •Druhy FA Validita v realismu Specifikace očekávání Typicky se komunikuje symbolicky, symboly ale implikují matematickou strukturu modelu Stavební kameny: Latentní proměnná (nepozorovatelná) Manifestní proměnná (přímo pozorovatelná) Kauzální vztah Korelace (kovariance) Specifikace modelu FA Specifikace modelu FA Předpoklady: 1.Vztahy (kovariance, korelace) mezi manifestními proměnnými jsou vysvětleny jednou latentní proměnnou 2.Po kontrole efektu latentní proměnné jsou manifestní proměnné vzájemně nezávislé (parciální korelace příslušných MVs jsou po kontrole efektu LV nulové) 3. Specifikace modelů (obecně) Na základě teorie jde nicméně specifikovat mnoho různých variant např.: Specifikace modelů (obecně) Na základě teorie jde nicméně specifikovat mnoho různých variant např.: Diagram of a diagram with circles and arrows Description automatically generated A diagram of a triangle with numbers and circles Description automatically generated https://psyarxiv.com/km37w/ Specifikace modelů (obecně) Na základě teorie jde nicméně specifikovat mnoho různých variant např.: https://bpb-us-w2.wpmucdn.com/u.osu.edu/dist/6/60429/files/2023/07/6b99f784-3793-4461-9ddc-11483cec 75da.pdf Specifikace FA modelů V případě faktorové analýzy si ale vystačíme s: Stavební kameny: Latentní proměnná (nepozorovatelná) Manifestní proměnná (přímo pozorovatelná) Kauzální vztah Korelace (kovariance) Take home message 1. Faktorová analýza je jeden ze způsobů testování teoretických očekávání spojených se vztahem mezi atributem a nástrojem Latentní proměnná A diagram of the sun Description automatically generated Latentní proměnná https://www.researchgate.net/publication/10758565_The_Theoretical_Status_of_Latent_Variables A close-up of a text Description automatically generated Latentní proměnná Víc názorů, dle Borsbooma (2008) je rozdíl mezi MV (manifestní p.) a LV (latentní p.) epistemologický, ne ontologický Jinými slovy – proměnné nejsou nutně latentní, nebo manifestní, jde vždy jen o to, jak přesně je dokážeme pozorovat MVs tak jsou vlastně speciálním případem LV, protože jdou přesně pozorovat https://www.researchgate.net/publication/232051996_Latent_Variable_Theory Latentní proměnná Hlavním rozdílem je vztah mezi skutečnou pozicí člověka na měřené proměnné (variable structure) a pozorovanou pozicí člověka na pozorované proměnné (data structure) Manifestní proměnná: Pozice člověka na měřené proměnné se do pozorované proměné překládá přímo (deterministicky) Latentní proměnná: Vztah mezi skutečnou pozicí člověka v atributu se do jeho*její pozice překládá pravdpodobnostně Teoreticky je možné, že se z dnešní LV časem stane MV (?) https://www.researchgate.net/publication/232051996_Latent_Variable_Theory Latentní proměnná Dle Borsbooma (2008) jsou LVs poměrně obyčejné, tajemné jsou naopak MVs O mnoha proměnných nemá smysl neuvažovat jako o LV, ačkoliv by to šlo – jejich pojetí jako MV je akceptovatelné zjednodušení (v psychologii třeba pohlaví, věk) Dle Borsbooma (2003) je důležité LV neztotožňovat s výstupem analýzy (tzv. operacionální LV), jde vždy o teorií popsanou proměnnou, která koresponduje s něčím reálným LVs můžou mít více forem – nominální, spojitá,… V FA jde vždy o spojitou LV (lidé se liší v míře atributu) Take home message 1. Faktorová analýza (FA) je jeden ze způsobů testování teoretických očekávání spojených se vztahem mezi atributem a nástrojem 2. FA očekává latentní proměnnou, o které jde uvažovat jako o obtížně pozorovatelné, ale existující proměnné, která způsobuje pozorování Historie FA Počátky u Spearmana, který se snažil vysvětlit korelace inteligenčních subtestů Později ji zdokonaloval Thurstone (kniha Vectors of Mind) Následně se stala důležitým nástrojem pro rozvoj psychologických teorií V 70. letech Jöreskog přišel s “konfirmační” FA, paralelně s tím se rozvíjely modely z Teorie odpovědi na položku (IRT), které umožnily další aplikace ve vzdělávání (Rasch, Birnbaum) Dnes je FA členem široké rodiny mnoha různých modelů s latentní proměnnou Common Factor Model Řekněme, že nás zajímá schopnost hrát šachy. Nemůžeme ji pozorovat přímo, jde tedy o latentní proměnnou. Projevuje se skrze jednotlivé šachové partie. Common Factor Model Řekněme, že nás zajímá schopnost hrát šachy. Nemůžeme ji pozorovat přímo, jde tedy o latentní proměnnou. Projevuje se skrze jednotlivé šachové partie. MVs (“položky”): - kolikrát z 10 her porazil*a cvičenou opici? - kolikrát z 10 her porazil*a okresního mistra v šachu? - kolikrát z 10 her porazil*a Magnuse Carlsena? - … - … SCHOPNOST HRÁT ŠACHY Common Factor Model MVs (“položky”): - kolikrát z 10 her porazil*a cvičenou opici? - kolikrát z 10 her porazil*a okresního mistra v šachu? - kolikrát z 10 her porazil*a Magnuse Carlsena? SCHOPNOST HRÁT ŠACHY Adam: (9, 1, 0) Bára: (10, 10, 1) Cecil: (3, 0, 0) Common Factor Model Rozdílná schopnost hrát šachy se projeví rozdílnou úspěšností na různě obtížných položkách Z definice LV víme, že tento vztah nebude dokonalý, ale zatížený chybou Na úrovni jedné položky tedy, v FA: Nebo: Common Factor Model Common Factor Model Jde o regresi! Chyba v FA Co je myšlenou chybou? Nedokonalost vztahu mezi LV a MV je daná: 1.Náhodnými (nesystematickými) vlivy (chybový rozptyl) 2.Systematickými vlivy specifickými pro danou MV (specifický rozptyl) 3. Oba zdroje chyby nemůžeme rozplést, pokud dvě MV nesdílí specifický rozptyl (tj. nemají něco společného nad rámec efektu LV) Společně tak mluvíme o unikátním rozptylu, který je složený z chybového a specifického. Chyba v FA Dále pokud: Tak lze dovodit, že chyba u je to, co zůstává nevysvětlené LV: komunalita Multidimenzionalita Faktorový model může obsahovat více LVs. Nový atribut: boxerská zdatnost MVs: •Kolikrát z 10 boxerských zápasů porazil*a cvičenou opici? •Kolikrát z 10 boxerských zápasů porazil*a okresního šachového mistra? •Kolikrát z 10 boxerských zápasů porazil*a Magnuse Carlsena? BOXERSKÁ ZDATNOST Multidimenzionalita •Kolikrát z 10 boxerských zápasů porazil*a cvičenou opici? •Kolikrát z 10 boxerských zápasů porazil*a okresního šachového mistra? •Kolikrát z 10 boxerských zápasů porazil*a Magnuse Carlsena? •Kolikrát z 10 her porazil*a cvičenou opici? •Kolikrát z 10 her porazil*a okresního mistra v šachu? •Kolikrát z 10 her porazil*a Magnuse Carlsena? • BOX ŠACHY BOX_OPICE BOX_MISTR BOX_MAGNUS ŠACHY_OPICE ŠACHY_MISTR ŠACHY_MAGNUS BOX ŠACHY BOX_OPICE BOX_MISTR BOX_MAGNUS ŠACHY_OPICE ŠACHY_MISTR ŠACHY_MAGNUS Multidimenzionalita Měli jsme: Jak se to změní v multidimenzionálním modelu? Multidimenzionalita Multidimenzionalita Multidimenzionalita Je ale možné modelovat i tzv. crossloading, tedy situaci, kdy jednu MV způsobuje více LVs MVs •Kolikrát z 10 zápasů v šachboxu porazil*a cvičenou opici? •Kolikrát z 10 zápasů v šachboxu porazil*a okresního šachového mistra? •Kolikrát z 10 zápasů v šachboxu porazil*a Magnuse Carlsena? Take home message 1. Faktorová analýza (FA) je jeden ze způsobů testování teoretických očekávání spojených se vztahem mezi atributem a nástrojem (modelů měření) 2. FA očekává latentní proměnnou, o které jde uvažovat jako o obtížně pozorovatelné, ale existující proměnné, která způsobuje pozorování 3. V FA můžeme specifikovat řadu modelů měření, včetně multidimenzionality Common Factor Model Dosud uváděný model predikoval hodnotu jednoho člověka na jedné MV Obsahuje ale příliš mnoho neznámých – je potřeba najít nějaké řešení, které obejde potřebu znát latentní skór konkrétních osob. Faktorová analýza proto stojí na modelování kovariancí mezi MVs (covariance structure). I náš model proto musí počítat se všemi MVs a LVs najednou. Základní pojmy • Jaká je typická podoba dat v případě faktorové analýzy? • Multivariační data – data pro soubor osob, větší množství manifestních (měřených, pozorovaných) proměnných (např. skóry z testů, škál, položek...) Datová matice: Co sloupec, to proměnná Co řádek, to osoba Základní pojmy • Jednotlivé buňky v datové matici představují skór dané osoby na dané manifestní proměnné • Fundamentální premisa faktorové analýzy: Tyto skóry nejsou nějakými náhodnými hodnotami, ale vykazují určité systematické aspekty, kterými se můžeme zabývat Datová matice: Co sloupec, to proměnná Co řádek, to osoba Základní pojmy Datová matice: X = Skór osoby i na proměnné j x11 x12 x1p xij xN1 xN2 xNp p sloupců (proměnných) N řádků (osob) Základní pojmy Čeho si můžeme na těchto datech všimnout? ◦Variabilita každé proměnné napříč osobami ◦ (rozptyl / SD) ◦ ◦Kovariance dvou proměnných napříč osobami ◦ (kovariance / korelace) x11 x12 x1p xij xN1 xN2 xNp Základní pojmy Korelační matice: ◦ R = 1 r12 r13 … … … r1p r21 1 r23 r2p r32 r32 1 r3p ⋮ ⋱ rkj ⋮ rjk ⋱ ⋮ ⋱ rp1 rp2 rp3 1 p manifestních proměnných p manifestních proměnných Model kovarianční struktury Jednoduchý model: Je proto (pomocí krásné matematiky založené na vlastnostech jednotlivých částí modelu) nutné formulovat model kovarianční struktury všech MVs a LVs: Model kovarianční struktury Model kovarianční struktury Common Factor Model Common Factor Model Take home message 1. Faktorová analýza (FA) je jeden ze způsobů testování teoretických očekávání spojených se vztahem mezi atributem a nástrojem (modelů měření) 2. FA očekává latentní proměnnou, o které jde uvažovat jako o obtížně pozorovatelné, ale existující proměnné, která způsobuje pozorování 3. V FA můžeme specifikovat řadu modelů měření, včetně multidimenzionality 4. FA modeluje kovarianční strukturu mezi MVs tím, že ji zjednodušuje na latentní strukturu složenou z faktorových nábojů, korelací mezi faktory a residuálních rozptylů (kovariancí) O co nám tedy ve FA jde? • Cílem je odhalit, pochopit, popsat a/nebo otestovat latentní strukturu, která způsobuje korelace mezi MVs. • Chceme tedy identifikovat (nebo ověřit) počet a charakter (význam) faktorů, které způsobují pozorované korelace mezi manifestními proměnnými. • Jinými slovy, chceme přijít na to, kolik LVs ovlivňuje naše MVs a odhadnout sílu a směr (+/-) faktorových nábojů. • Velikost a směr faktorových nábojů nám napomáhají v určení podstaty LV (dle vazby mezi konkrétní LV a konkrétními MV, viz definice validity) Dva cíle FA Konfirmační cíl Známe latentní strukturu a testujeme, nakolik odpovídá pozorované kovarianční struktuře “Kdyby byla pravda, že inteligenční subtesty způsobuje právě jeden g-faktor, jaké kovariance mezi inteligenčními subtesty bychom museli pozorovat?” Výsledkem je vyjádření shody modelu (očekávání) s daty (pozorováním) a test teorie Explorační cíl Latentní strukturu neznáme, snažíme se ji najít pomocí pozorované kovarianční struktury “Kdyby byla pravda, že inteligenční subtesty způsobuje několik LVs, jaká latentní struktura nejlépe odpovídá pozorované kovarianční struktuře?” Výsledkem je vyjádření shody modelu (očekávání) s daty (pozorováním), ale nikoliv test teorie Dva druhy FA “Konfirmační” FA Umožňuje specifikovat latentní strukturu a testovat, nakolik odpovídá pozorované kovarianční struktuře Ale latentní struktura jde testovat i exploračně (explorační “tunění modelu”)! Lepší název je proto restricted FA, protože vyžaduje specifikovat a umožňuje testovat restrikce, bez ohledu na cíl “Explorační” FA Umožňuje najít latentní strukturu pomocí pozorované kovarianční struktury Ale i EFA vyžaduje specifikovat aspoň počet faktorů, takže jde použít konfirmačně! Lepší název je proto unrestricted FA, protože vyžaduje jen specifikaci počtu faktorů Take home message 1. Faktorová analýza (FA) je jeden ze způsobů testování teoretických očekávání spojených se vztahem mezi atributem a nástrojem (modelů měření). 2. FA očekává latentní proměnnou, o které jde uvažovat jako o obtížně pozorovatelné, ale existující proměnné, která způsobuje pozorování. 3. V FA můžeme specifikovat řadu modelů měření, včetně multidimenzionality. 4. FA modeluje kovarianční strukturu mezi MVs tím, že ji zjednodušuje na latentní strukturu složenou z faktorových nábojů, korelací mezi faktory a residuálních rozptylů (kovariancí). 5. Cílem FA může být konfirmace, nebo explorace. Použít k tomu jdou dva typy FA – restricted a unrestricted, tradičně zvané konfirmační (CFA) a explorační (EFA). Některé otázky k FA 1. Je možné FA provést, i když LV neexistuje / nezpůsobuje MVs? 2. Znamená dobrá shoda FA modelu s daty, že latentní struktura odpovídá realitě? 3. Jaký je vztah mezi FA a reifikací? 4. Jaká jsou využití FA mimo psychometriku? https://www.researchgate.net/publication/321253793_What_is_the_p_-factor_of_psychopathology_Some_ri sks_of_general_factor_modeling