Link: OLE-Object-Data Matematické základy formální pojmové analýzy (materiál k předmětu psychosémantika) M. Filip Formální pojmová analýza (angl. formal concept analysis, něm. formale Begriffsanalyse; dále jen FPA) je matematická metoda z oboru algebry, kterou vytvořil R. Wille v osmdesátých letech (Wille, 1996). Výchozí zobrazení dat pro FPA je tzv. formální kontext K, který obsahuje objekty z množiny O a atributy z množiny A. Vztahy mezi objekty a atributy jsou charakterizovány binární relací R, která určuje na základě vztahu oRa (také psáno ), kdy má daný objekt o z O atribut a z A. Pro obecný popis formálního kontextu se používá výraz K[1]. Takto vymezený formální kontext je dobře zobrazitelný tabulkou, ve které jsou řádky obsazeny objekty, sloupce atributy a incidenční data vyjadřují relaci R. Tab. 1 ukazuje příklad formálního kontextu. Tab. 1: Příklad formálního kontextu +--------------------------------------------------------------------------------------------+ | |a |b |c |d |e | | |-------------+-------------+-------------+---------------+---------------| | |Kouří dýmku |Hodně jí |Mluví nahlas |Trpí nespavostí|Nesnáší alkohol| |------------------+-------------+-------------+-------------+---------------+---------------| |1 |Otec |0 |1 |1 |0 |0 | |-------+----------+-------------+-------------+-------------+---------------+---------------| |2 |Matka |0 |0 |0 |1 |1 | |-------+----------+-------------+-------------+-------------+---------------+---------------| |3 |Syn |0 |1 |0 |0 |0 | |-------+----------+-------------+-------------+-------------+---------------+---------------| |4 |Dcera |0 |0 |0 |1 |1 | |-------+----------+-------------+-------------+-------------+---------------+---------------| |5 |Děda |1 |0 |1 |0 |0 | +--------------------------------------------------------------------------------------------+ Pokud budeme uvádět pouze numerická a abecední označení objektů a atributů, má formální kontext zobrazený v této tabulce množinu objektů a množinu atributů . Relace I je vyjádřena množinou . Pro vyjádření vztahů ve formálním kontextu použijeme operátor derivace, který definujeme pro množinu (Wille, 1996, s.18): pro všechna (1) (množina společných atributů objektů z X). Tomu odpovídá definice pro množinu : pro všechna (2) (množina objektů, které mají společné atributy z Y). Definovaný operátor se dá aplikovat vícekrát na tutéž množinu. Přitom platí: , (další vztahy a jejich důkazy jsou obsaženy v citované knize). Nyní definujeme formální pojem, který je ústřední jednotkou v FPA (Wille, 1996, s. 18): "Formální pojem kontextu je pár , kdy ,, a . X nazýváme rozsahem-extenzí a Y obsahem-intenzí pojmu . P označuje množinu všech pojmů kontextu ." Formální pojem v našem konkrétním kontextu je např. pojem , protože všechny společné atributy objektů 2 a 4 jsou atributy d, e a naopak. Množina P tohoto kontextu obsahuje celkem sedm formálních pojmů: P1. P2. P3. P4. P5. P6. P7. . FPA dále určuje hierarchické vztahy mezi formálními pojmy (Wille, 1996, s. 20): " a jsou pojmy formálního kontextu. Pojem nazýváme podřazeným pojmu v případě, že (stejně platné je přitom i kritérium ). je potom nadřazený pojmu a píšeme . Relace je nazývána jako hierarchické uspořádání pojmů. Takto uspořádanou množinu všech pojmů kontextu označíme P a nazveme jako svaz pojmů (angl. concept lattice) kontextu ." Podřazený pojem má tedy stejný nebo menší rozsah a stejný nebo širší obsah než jeho nadřazený pojem. Tato vlastnost odpovídá základní intuici tradiční sémantiky, že se vzrůstající konkrétností má pojem víc vlastností (je specifičtější) a zužuje se jeho rozsah. Ve směru k větší abstraktnosti platí pochopitelně opačná zákonitost.[2] Pro definování vlastností svazu pojmů slouží množinové operátory průniku a sjednocení. Pro jakoukoliv množinu formálních pojmů potom platí (Wille, 1996, s. 20): "Svaz pojmů Pje úplný svaz, když pro infimum platí: (3) a pro supremum platí: ." (4) Infimum, tj. podřazený pojem s nejširším obsahem, má vždy nulový rozsah a obsah daný jako sjednocení obsahů všech pojmů nadřazených. V našem příkladě je to pojem . Supremum, tj. nadřazený pojem s největším rozsahem, má naopak vždy nulový obsah a rozsah rovný sjednocení rozsahů všech podřazených pojmů. V příkladu tedy představuje supremum pojem . Výsledky FPA se dají snadno zobrazit v grafu, kde uzly znamenají jednotlivé pojmy a spojnice mezi nimi relace , jak to ukazuje obr. 1. Obr. 1: Příklad grafické znázornění výsledků FPA (vysvětlení v textu) Indexy s P označují, který formální pojem kontextu výchozího příkladu daný uzel znázorňuje. Čísla charakterizují umístění objektů a malá písmena zase pozici atributů ve struktuře. Grafická struktura má vlastnosti korespondující s předchozími definicemi. Jakýkoliv objekt na určitém místě struktury má atributy, které nese pojem, jehož je součástí, plus atributy všech nadřazených pojmů (tj. pojmů spojených vzestupně). Např. objekt 5 má atribut a (zobrazený přímo u formálního pojmu P6) plus atribut c (zobrazený u nadřazeného formálního pojmu P5), což odpovídá výchozímu formálnímu kontextu. Naproti tomu libovolný atribut obsazuje všechny ty objekty, které jsou ve struktuře na stejné úrovni a níže. Např. atribut c obsazuje objekt 1 (zobrazený u formálního pojmu P5 podřazeného pojmu P3) a objekt 5 (zobrazený u formálního pojmu P6 podřazeného pojmu P5), což je rovněž v souladu s výchozím kontextem. FPA se stává stále rozšířenější metodou v různých oblastech. Z psychologických disciplín našla dosud největší uplatnění v kognitivní psychologii (modelování mentálních reprezentací sémantických struktur), a v psychologii organizace a řízení (modelování struktur znalostí/vědění v rámci organizace). Potenciálně je použitelná i v kvalitativní metodologii jako nástroj pro vizualizaci struktur, které jsou v datech "skryty". Literatura: Wille, R. (1996). Formale Begriffsanalyse - Mathematische Grundlagen. Berlin: Springer. webové odkazy: http://www.upriss.org.uk/fca/fca.html (základní stránka FPA) http://www.mathematik.tu-darmstadt.de/ags/ag1/fag1/Software/software_en.html (zde je volně ke stažení jednoduchý software pro FPA) http://wundt.kfunigraz.ac.at/ (oddělení kognitivní psychologie v Grazu, která aplikuje FPA a příbuzné metody) ------------------------------- [1] V citovaném německém originálu se objekty označují písmenem G (Gegendstände) a atributy písmenem M (Merkmale). Označení O a A přebírám z anglické literatury o FPA, protože je shodné i s českými termíny objekt a atribut. [2] Podle moderní intenzionální sémantiky je však tato představa, založená na množinově-teoretickém přístupu, neudržitelná -- viz přednáška o atomistické sémantice.