277 15Appendix Kvantitativní popis tvaru pomocí metod geometrické morfometrie Petra Urbanová, Miroslav Králík ,,Všechno měřit, co je měřitelné a pokoušet se, aby to, co ještě není, se stalo měřitelným" (Galileo Galilei) Kvantitativní popis tvaru nebo také morfometrii můžeme definovat jako převod vizuální informace do číselného vyjádření takové kontinuální proměnné, která konkrétnímu tvaru přiřadí vždy jedinečnou hodnotu (popřípadě hodnoty) na číselné ose. Jedním ze způsobů, jak číselně vyjádřit rozdíly ve tvaru objektů, je měření lineárních vzdáleností a úhlů anebo výpočet jejich vzájemných poměrů nebo složitějších indexů. Počátky těchto tvarových analýz, které dnes souhrnně označujeme jako tradiční morfometrii (také klasická nebo konvenční morfometrie), spadají do období na přelomu 19. a 20. století, kdy analytické a deskriptivní postupy biometrie byly v plném roz- Úvod květu, a lze je ztotožnit se jmény jako byl např. Francis Galton, Karl Pearson nebo Ronald Aylmer Fisher. Tradiční morfometrie je na rozdíl od pokročilejších technik postupem jednoduchým a prostým. Z pohledu studia objektů, které nás obklopují, vystačíme s nejzákladnějším měřícím vybavením jako je posuvné a dotykové měřidlo nebo úhloměr. Technická nenáročnost jde však na úkor trivializace celkového popisu tvaru. Toto zjednodušení komplexního pohledu na tvar je již řadu let předmětem ostré kritiky. Miriam Zelditch a její kolegové (2004, str. 2-10) shrnují nedostatky tradiční morfometrie do čtyř základních bodů. Za prvé je tradiční morfometrie schopná poTvar je současně s velikostí klíčovou vlastností, na základě které identifikujeme objekty biologické i jiné podstaty (živé organismy, tělní pozůstatky, kamenné i jiné artefakty). Nejjednodušší koncepce vyjádření vizuální informace o tvaru je založena na pojmech slovního popisu. Numerické vyjádření tvaru, ve smyslu objektivního ,,měření", je naopak jednoduché pouze tehdy, nabývá-li objekt základních geometrických tvarů (kruh, trojúhelník, elipsa). V případě, že je tvar Morfometrie neboli kvantitativní popis tvaru nepravidelný, a to je u většiny objektů, které v biologii a antropologii připadají v úvahu, potom se i numerické vyjádření stává složitější a komplexnější. Následující text by měl čtenáře stručně seznámit s obecnými základy pokročilých metod kvantitativního popisu tvaru. Snažili jsme se vyhnout matematickým vzorcům a komplikovanému rozboru teoretické podstaty metod. Raději jsme se zaměřili na využití postupů v současné antropologii a příbuzných oborech. 278 skytnout dobrou představu o celkové velikosti objektu, ale informace o tvaru je relativně strohá. K tomu se připojuje ještě skutečnost, že v rámci tradičních postupů nelze oddělit tu část variability, která připadá na rozdíly ve velikosti od těch, které jsou určeny výhradně rozdíly ve tvaru. V konečném důsledku to znamená, že hodnoty tradičních rozměrů a indexů jako ukazatelů tvaru v sobě zahrnují také nechtěnou velikost objektu. Druhá výtka se týká vazby mezi měřenými parametry. Lineární rozměry jednoho objektu nebo struktury obvykle začínají od společného počátku, což zvyšuje jejich vzájemnou korelaci a snižuje výpovědní hodnotu rozměrů. Třetí výhrada napadá homologii lineárních parametrů, pokud srovnáváme ty části, které se kvalitativně liší, například odpovídající si části různých vývojových stádií organismu. Lidově bychom to vyjádřili tak, že jsou srovnávány ,,jablka a hrušky". Poslední zásadní problém tradiční morfometrie vidí autoři v neschopnosti plně rozpoznat, zda skutečné rozdíly mezi zkoumanými objekty leží v prostoru mezi dvěma krajními body měřených rozměrů. Pátý bod, kterým výčet Miriam Zelditch doplníme, se vztahuje k omezenému počtu parametrů, které je možné na objektu naměřit. Souvisí buď s fyzickými omezeními, které v reálném světě brání změření rozměru (anatomická nebo strukturní složitost organismu, komplikované měření, fragmentárnost objektů) nebo s tvarem, který je natolik komplexní a komplikovaný, že prosté rozměry nebo jejich indexy nejsou schopny jej plně podchytit v míře, která by byla pro dané účely dostačující. V reakci na tyto kritiky je dnes v morfometrii všeobecně přijímaný názor, podle kterého jsou zmíněné limity tradičního přístupu k analýze tvaru natolik významné, že ani pohodlí spojené s jednoduchostí a nenáročností, kterou tradiční morfometrie poskytuje, není schopné vyvážit ztráty a metodické mezery, které s sebou přináší. V 80. letech minulého století zavál na poli analýzy tvaru vítr zcela nových myšlenek, které se sporadicky objevovaly už dříve v průběhu předchozích dvou dekád (Lu 1965; Lestrel, Brown 1976). V průběhu dalších deseti let pak z počátečních pokusů vzešel zcela nový směr, který je dnes jedním z nejrychleji se rozvíjejících metodických trendů v biologii a který označujeme jako geometrická morfometrie. Metody geometrické morfometrie označují skupinu moderních postupů kvantitativní analýzy velikosti a tvaru objektů pomocí geometrických metod a vícerozměrné statistiky. Od tradičního přístupu se studiu tvaru se liší tím, že jednoznačně oddělují tvar a velikost jako dva nezávislé znaky. Parametry pro popis tvaru, které se v geometrické morfometrii označují jako tvarové proměnné, jsou relativně autonomními ukazateli tvaru. To znamená, že na rozdíl od lineárních rozměrů nejsou vztahy tvarových proměnných natolik silné, aby se navzájem výrazněji ovlivňovaly. V této souvislosti je třeba uvést, že univerzálním parametrem velikosti se v geometrické morfometrii uvádí tzv. veObr. 1. Schéma 4 konfigurací sestavených kombinacemi 53 význačných bodů lebky člověka: a) 53 bodů, b) 49 bodů, c) 34 bodů, d) 17 bodů. 279 Metody analýzy obrysů popisují tvar objektu nezávisle na apriorní definici specifických bodů. Hodnoty tvarových proměnných jsou získány interpolací matematické funkce obrysu zkoumaného objektu, respektive x, y, (z) souřadnic dostatečného množství bodů podél obrysu. Primárním ukazatelem tvaru objektu proto není poloha bodů na objektu jako v případě metod analýzy význačných bodů, ale koeficienty vhodného geometrického modelu, který je tvaru přiřazen (např. matematická funkce). Nejznámějším příkladem metod analýzy obrysů je Fourierova analýza, známá také jako harmonická nebo spektrální analýza. Interpolační funkcí je v tomto případě Fourierova transformace, kterou si můžeme představit jako sérii opakujících se matematických funkcí o zvyšující se frekvenci, tzv. harmonických proměnných, jejichž základem jsou goniometrické funkce sinus a kosinus. Každá harmonická proměnná je vážena Fourierovým koeficientem, který svou hodnotou udává příspěvek dané harmonické proměnné do celkového tvaru objektu. Přínos harmonických proměnných je aditivní. Platí, že čím více harmonických proměnných je při popisu použito, tím přesnější je výsledný popis tvaru (obr. 2). Optimální počet harmonických proměnných pro popis jednoho objektu se odvíjí od složitosti popisovaného tvaru. V biologických vědách se obvykle popisují tvary 20 harmonickými proměnnými (Urbanová et al. 2006). Platí však, že celkový počet harmonických proměnných pro jeden tvar nesmí přesáhnout polovinu z celkového počtu bodů na obryse (tzv. Nyquistovo kritérium) (Lestrel 1997). Do skupiny metod analýzy obrysů patří dále eliptická Fourierova analýza, vlnková analýza nebo analýza vlastních tvarů. Rozdělení morfometrických metod na metody analýzy význačných bodů a metody analýzy obrysů je v mnoha ohledech pouze formální a proto se dnes od něho pomalu upouští. Oba postupy lze různě kombinovat v závislosti na testované hypotéze nebo předmětu výzkumu (Lestrel et al. 2004; 2005). Stejně Obr. 2. Rekompozice tvaru okraje očnice ve dvourozměrném a trojrozměrném prostoru na základě různého počtu harmonických proměnných. Znázorněny jsou rekompozice na základě zleva 1, 3, 5, 10 a 20 harmonických proměnných. likost centroidu. Významným přínosem geometrické morfometrie, pro který neexituje ekvivalent v tradiční morfometrii, je široké spektrum pokročilých vizualizací tvarových změn (obr. 1-10). Podle charakteru vstupních dat můžeme metody geometrické morfometrie rozdělit na metody analýzy obrysů a metody analýzy význačných bodů. Metody analýzy význačných bodů obecně popisují tvar a změny tvaru pomocí význačných bodů. Význačné body jsou a priori definovaná místa na objektu, která si mezi zkoumanými objekty přesně odpovídají. Vstupními daty jsou kartézské souřadnice význačných bodů ­ x, y pro studium dvourozměrných objektů a x, y, z pro objekty ve 3D prostoru. Nejjednodušším objektem pro tvarovou analýzu je trojúhelník, protože pouze objekt popsaný třemi a více body má ,,nenulový" tvar. Soubor význačných bodů jednoho zkoumaného objektu se označuje jako konfigurace. Pro každý soubor dat lze analyzovat libovolnou, ale smysluplnou kombinaci význačných bodů (obr. 1). 280 Nejpoužívanějším postupem pro standardizaci objektů je v současné době prokrústovská analýza, která byla navržena v 80. letech Fredem L. Booksteinem (Bookstein 1982). Postup, který existuje v několika modifikacích (obecná prokrústovská analýza, dílčí prokrústovská analýza, symetrická prokrústovská analýza aj.) je kaskádou geometrických transformací, které mají za úkol minimalizovat vzdálenosti mezi relevantními význačnými body, jenž objekty popisují. Objekty jsou nejdříve navrstveny na sebe tak, aby poloha centroidu byla pro všechny objekty společná, poté jsou proporčně zvětšeny nebo zmenšeny na jednotnou společnou velikost a nakonec vůči sobě otáProkrústovská analýza čeny tak dlouho, dokud prostorové rozdíly ve všech význačných bodech nejsou minimální. Posouzení optimální standardizace se řídí kritériem tzv. nejmenších čtverců (druhá mocnina euklidovské vzdálenosti mezi dvěma body). Standardizované souřadnice, které nesou pouze požadovanou informaci o tvaru, se označují jako prokrústovské souřadnice. Velikost vektoru mezi význačným bodem libovolného objektu a relevantním bodem průměrné konfigurace (tzv. konsenzem) nebo jakékoliv jiné určující konfigurace ve zkoumaném souboru se označuje jako prokrústovské reziduum. Součet prokrústovských reziduí jednoho objektu udává prokrústovskou vzdálenost mezi dvěma tvary. Starším a jednodušší typem standardizace prostorového uspořádání objektů jsou tzv. booksteinovské tvarové souřadnice. Autorem této metody je opět Fred L. Bookstein (Bookstein 1991) a ve své podstatě ji můžeme označit za předchůdce prokrústovské analýzy. Podobně jako prokrústovská analýza i booksteinovské tvarové souřadnice pracují na principu vycentrování a otáčení objektů. Vodítkem pro jejich standardizaci však není soubor všech význačných bodů na objektu, ale pouze dva vybrané body tvořící základnu. Základna je matematicky vlastně směrový vektor, jehož délka a orientace v prostoru určuje, jakým způsobem bude objekt transformován. Pro studium tvaru mnoha biologických i nebiologických objektů (např. keramická nádoba) je tento způsob standardizace výBooksteinovské tvarové souřadnice hodnější než pokročilejší prokrústovská analýza. Za prvé, analýza je pod větší kontrolou uživatele, což je zapotřebí tehdy, pokud se objekty přirozeně ustavují do určitého definovaného postavení v prostoru. Za druhé, zvolené dva body základny lze velice snadno použít v kombinaci s metodami analýzy obrysů. Stačí, aby vedle bodů na křivce byly definovány dva význačné body ležící uvnitř nebo vně analyzovaných obrysů. Příkladem z biologických věd může být postavení očnic na lebce člověka. V základním anatomickém postavení směřují očnice dopředu a jejich spodní okraj leží v jedné rovině. Základna pro ustavení obrysů očnic do popsaného anatomického postavení je pak definována jako spojnice nejspodnějších bodů očnice (antropometrický bod orbitale, Knußmann 1988). Jitak přiřazení pojmu geometrická morfometrie studiím, které aplikují výhradně význačné body, je dnes již nesprávné a zastaralé. Nezávisle na metodice, kterou zvolíme nebo upřednostňujeme, lze kvantitativní analýzu tvaru pomocí metod geometrické morfometrie strukturovat do tří základních fází: 1) sběr vstupních dat, 2) standardizace objektů v souladu s definicí tvaru a výpočet tvarových proměnných a 3) statistická analýza tvarových proměnných a zpětná vizualizace tvarových změn. Vstupními daty pro analýzu tvaru jsou nejčastěji kartézské souřadnice bodů. Studují se však i jiné druhy prostorových dat, jako jsou například úhlové souřadnice (Urbanová et al. 2006; Lu 1965) nebo řetězový kód (Iwata, Ukai 2002; Iwata et al. 2002). Klíčovým bodem, který určuje nejen charakter ostatních kroků, ale také správnost celkového popisu tvaru je standardizace objektů. Standardizace je nutná k tomu, aby bylo možné tvar studovat nezávisle na ostatních složkách variability, např. rozdílech ve velikosti nebo poloze v prostoru. Podle základní definice geometrické morfometrie je tvar právě taková geometrická vlastnost, která je nezávislá na zvětšení daného objektu, jeho poloze a otočení v prostoru (Kendall 1977). Prostorová data, která získáme například digitálním fotoaparátem, laserovým skenerem nebo ramenovým digitizérem tyto podmínky nesplňují. Je proto nutné je transformovat tak, aby žádný z rozdílů nenarušoval vlastní numerický popis tvaru. 281 Obr. 3. Ukázky několika standardizačních postupů obrysů nádob: bez standardizace (a), standardizace prokrústovskou analýzou (b), vycentrované objekty bez standardizace otočení (c), standardizace na základnu shodnou s krajními body hrdla (d), krajními body dna (e) a středy dna a hrdla (f). ným příkladem může být standardizace artificiálních tvarů, jako je archeologická keramika. Jelikož nádoba stojí vždy dnem na podložce, bylo by nesmyslné a pro interpretaci tvarové změny také nevhodné, aby tvary byly superponovány například prokrústovskou analýzou, při které jsou individuální rozdíly distribuovány mezi všechny body zvolené konfigurace bodů. To, jak klíčové je správné určení bodů základny, ukazuje obr. 3. Původní obrysy zobrazených nádob (a) byly superponovány prokrústovskou analýzou (b), vycentrovány na střed gravitace (c), standardizovány na základnu shodnou s krajními body hrdla (d), na základnu určenou krajními body dna (e) a nakonec na základnu určenou středem dna a hrdla (f). Každý z těchto standardizačních postupů poskytne jiné hodnoty tvarových proměnných a současně rozdílnou informaci o tvarových rozdílech mezi nádobami. Je tedy nutné, aby se výběr nejvhodnějšího postupu odvíjel od hypotézy, s jakou tvar objektů studujeme. Booksteinovské tvarové souřadnice tak, jak byly definovány Frendem Booksteinem, pracují výhradně s dvourozměrnými daty. Klouzavé pomocné body Vedle prokrústovské analýzy a booksteinovských tvarových souřadnic je v posledních letech hodně populární také metoda klouzavých pomocných bodů (Bookstein 1996). Na rozdíl od význačných bodů, u kterých se předpokládá, že popisují tvar anatomicky nebo strukturně oddělených částí, alespoň v geometrickém slova smyslu, jsou pomocné body umístěny na jedné jediné struktuře a natolik blízko sebe (např. podél vnějšího okraje), že přestávají být libovolně transformovatelné a zákonitě nesou menší množství informace o tvarové variabilitě v daném místě (tj. stupně volnosti se snižují). Pomocné body bývají obvykle pravidelně rozmístěné podél studovaného tvaru. Není to ovšem podmínkou. Platí, že z pohledu homologie geometrické morfometrie si body navzájem neodpovídají. To je vedle silné korelace další z důvodů, proč pomocné body není vhodné standardizovat jinými standardizačními postupy, například prokrústovskou analýzou. Jako řešení tohoto problému byl proto navržen postup, který standardizuje tvary takovým způsobem, že posouvá pomocné body po určené trajektorii tak dlouho, dokud nejsou prostorové rozdíly mezi tvary minimální. Každý z bodů na obryse v podstatě ,,klouže" tam a zpět po své vlastní tečně umístěné kolmo vůči zakřivení obrysu v daném místě. Kritériem pro určení minimálních rozdílů není metoda nejmen- 282 ších čtverců jako v případě prokrústovské analýzy, ale hodnota deformační energie (viz dále) nebo prokrústovské vzdálenosti mezi tvary. Ačkoliv metoda klouzaProkrústovská analýza je velmi citlivá na lokální odchylky od obecného trendu ve zkoumaných datech. Takovou odchylkou může být například chyba při digitalizaci bodu nebo izolovaná tvarová deformace, kterou pozorujeme u jednoho jediného objektu v souboru. Na základě pravidla nejmenších čtverců se původní vzdálenost jednoho odchýleného bodu rozprostře mezi ostatní body konfigurace. Ve svém důsledku ovlivní tato singularita nejen standardizaci ostatních význačných bodů dané konfigurace, ale i ostatních konfigurací, které standardizujeme. Řešení této situace nabízí metoda robustního Robustní přizpůsobení přizpůsobení. Postup je v principu totožný s tím, jak jsme jej vysvětlili u prokrústovské analýzy. Konfigurace význačných bodů jsou vycentrovány, proporčně zvětšeny nebo zmenšeny na jednotnou velikost a otáčeny tak dlouho, dokud rozdíly mezi konfiguracemi nejsou minimální. Podstatným rozdílem mezi oběma metodami je nastavení meřítka rozdílů mezi objekty v podstoupených transformacích. Zatímco v případě prokrústovské analýzy se transformace vztahují k hodnotě aritmetického průměru (konsenzus), u metody robustního přizpůsobení je to hodnota mediánu. Bez ohledu na to jakou standardizaci zvolíme, jsou výstupem výše zmíněných transformací numerické hodnoty tvarových proměnných. Každá sada tvarových proměnných kvantitativně popisuje specifický tvar, podobně jako délkové a šířkové rozměry popisují proporce objektu nebo hodnoty barevného odstínu, kontrastu a jasu odkazují na vnější texturu objektu. V této souvislosti je potřeba rozlišovat popis tvaru jednoho izolovaného objektu a srovnání dvou a více tvarů (tj. tvarová variabilita). Zatímco v prvním případě je tvar vyjádřen proměnnými, které stojí zcela Fourierova analýza vých pomocných bodů byla primárně vytvořena pro studium dvourozměrných dat, objevily se již i modifikace pro trojrozměrná data (Gunz et al. 2005). Proces standardizace pro potřeby Fourierovy analýzy se odlišuje od metod, které zde byly prozatím popsány. Fourierova analýza je mocným nástrojem pro numerický popis tvaru, ale potřebná standardizace objektů má dva klíčové body, které v případě, že nejsou správně podchyceny, mohou významně narušit správnost celého postupu. Dekompozice křivky do série harmonických proměnných je za prvé citlivá na počáteční bod, od kterého se začne tvar popisovat, a za druhé odchylky v prostorovém otočení tvarově shodných objektů produkují odlišné hodnoty tvarových proměnných. Jedním z řešení, kterým docílíme prostorové shody mezi objekty, je zvolit si na obryse nebo mimo něj právě takový bod (např. význačný bod, pokud lze nějaký definovat), který bude shodně představovat počátek všech obrysů. Vysoká míra homologie mezi počátečními body by měla vyvážit arbitrárnost tohoto postupu. Druhým řešením je standardizace, kterou v roce 1982 navrhli autoři eliptické Fourierovy analýzy Kuhl a Giardina. Podle jejich postupu jsou tvary objektů otočeny tak, že podélná osa objektu (respektive podélná osa elipsy 1. harmonické proměnné) je pro všechny objekty v analýze shodná. Analogický způsob standardizace pro 3D modifikaci Fourierovy analýzy prozatím neexistuje. Je však možné použít alternativní standardizační postupy jako je ustavení trojrozměrných obrysů do jedné roviny. Vlastnosti tvarových proměnných samostatně a u stejného tvaru nabývají vždy stejných hodnot (Fourierovy koeficienty), v druhém případě jsou hodnoty tvarové proměnné vztaženy k zvolenému standardu, který může být zastoupen průměrným tvarem v souboru nebo předcházejícím vývojovým stadiem (prokrústovská rezidua, prokrústovské vzdálenosti). Zde samostatně stojící hodnoty tvarových proměnných nemají vysokou výpovědní hodnotu. V obou případech platí, že počet tvarových proměnných je natolik objemný, že přesahuje optimální množství, které lze jednoduše myšlenkově zpracovat 283 Obr. 4. Srovnání skutečné fotografie a dvou různých portrétů sestavených podle slovního popisu na základě konfigurace 25 význačných bodů. a reprodukovat. Cesta ke srozumitelnějším závěrům vede přes vícerozměrné statistické metody. V této fázi narážíme na překážku, která výrazně komplikuje další postup kvantitativní analýzy tvaru. Tvarové proměnné, které vytvářejí tzv. prostor tvarových proměnných, nesplňují podmínky pro použití standardních vícerozměrných testů založených na předpokladu lineární závislosti mezi proměnnými. Nejznámějším a nejvíce prozkoumaným prostorem tvarových proměnných je ten, který vzniká prokrústovskou superpozicí význačných bodů. Je znám také jako Kendallův prostor nebo Kendallův prostor tvarových proměnných a v žádném případě by neměl být zaměňován s fyzickým prostorem, který nás obklopuje. Je možné na něj pohlížet jako na matematický konstrukt, pro který nám schází ekvivalent v reálném světě. Ačkoliv se tento prostor neřídí stejnými zákonitostmi jako náš fyzický trojrozměrný prostor, platí, že objekty stejného tvaru obývají v prostoru stejnou pozici. Nelineárnost prostoru tvarových proměnných a silná vazba mezi tvarovými proměnnými jsou hlavní překážky, které brání bezproblémovému testování tvarových proměnných metodami jednorozměrné a vícerozměrné statistiky. Východiskem z této situace jsou dva odlišné, ale kombinovatelné přístupy. V prvním případě lze obejít předpoklad lineárnosti jednoduše tak, že použijeme neparametrické statistické postupy, které nejsou omezené postulátem lineárních vztahů mezi vstupními proměnnými. Tímto způsobem lze například permutačním testem prokrústovských reziduí zjistit, zda se statisticky významně liší průměrné tvary ve dvou srovnávaných populacích. Vedle tvarových proměnných, které popisují tvary, však můžeme testovat i proměnné, které určují vzájemné vztahy mezi tvary v prostoru tvarových proměnných. Hodnoty prokrústovských vzdáleností jsou jedny z těchto testovatelných proměnných. Příkladem je srovnání 3 portrétů z obr. 4. Výpočtem prokrústovských vzdáleností konfigurace 25 význačných bodů obličeje bylo možné dojít k objektivnímu závěru, že kresebný portrét číslo dvě je tvarově podobnější skutečné fotografii jedince, která byla předobrazem sestaveného portrétu. Z dalších aplikací je například matice prokrústovských vzdáleností vhodným vstupním formátem do shlukové analýzy, v případě, že máme za úkol zjistit, zda podobné tvary v souboru vytváří přirozené skupiny (typy) či nikoliv. Druhým řešením problému nelinearity je transformace proměnných tak, aby byly splněny podmínky pro následnou aplikaci parametrických testů. Pro tento účel byly navrženy tři možné postupy. Všechny tři jsou známější pod zkratkami odvozenými z anglických názvů ­ PCA (Principal Components Analysis, analýza hlavních komponent), CVA (Canonical Variates Analysis, kanonická analýza) a TPS (Thin-Plate Spline, metoda tenkých ohebných plátků). Zatímco analýza hlavních komponent a kanonická analýza jsou dobře známé metody vícerozměrné statistiky, metoda tenkých ohebných plátků vychází výhradně z metodiky geometrické morfometrie (Bookstein 1997; Slice 2007). Základní princip převodu proměnných do lineárního prostoru je shodný u všech tří metod. Ve své podstatě se jedná o projekci vícerozměrného prostoru tvarových proměnných na tangenciální rovinu umístěnou v bodě, ve kterém se nachází průměrný tvar všech objektů v souboru. Nový ,,promítnutý" prostor se označuje jako prostor tangenciální. Tento prostor 284 je stále vícerozměrný, ale vztahy mezi proměnnými jsou lineární. Linearita je nicméně ustavena na úkor mírné deformace skutečných vzájemných vztahů. Tato deformace je zanedbatelná, pokud pracujeme se souborem tvarů, jejichž rozptyl není příliš veliký. Například pokud se význačné body nepřesunují z jednoho konce objektu na druhý. V opačném případě mohou rozdíly mezi oběma prostory narušit výsledky tvarové analýzy. V analýze hlavních komponent i v kanonické analýze je původní počet tvarových proměnných přepsán do nových proměnných (hlavních komponent, kanonických proměnných), které jsou lineárními kombinacemi původních parametrů. V PCA jsou hlavní komponenty získány tak, aby vysvětlovaly největší podíl celkových rozdílů mezi tvary. Počet transformovaných proměnných Y odpovídá vztahu Y=X-1, kde X je počet vstupních proměnných. Nicméně počet komponent, které bereme v úvahu, je zpravidla mnohem nižší. Obecně platí, že smysluplné jsou Obr. 5. Grafické výstupy kanonické analýzy vytvořené na konfiguracích 12 význačných bodů souboru stop psovitých a kočkovitých šelem (domácí a volně žijící druhy). Znázorněna je poloha centroidů 4 zkoumaných skupin a jejich průměrné konfigurace význačných bodů. Níže jsou pak srovnány rozdíly mezi výstupy analýzy hlavních komponent (PC1 a PC2) a kanonické analýzy (CV1, CV2). 285 pouze ty komponenty, které vysvětlují takový podíl variability, který na ně proporčně připadá z celkového objemu rozdílů. V kanonické analýze není rotace proměnných definovaná ve směru maximálních rozdílů v souboru, ale tak, aby první kanonická proměnná vyjadřovala maximální rozdíly mezi a priori definovanými skupinami a zároveň minimální rozdíly uvnitř skupin. Počet výstupních proměnných není určen množstvím proměnných, které do analýzy vstupují, ale počtem definovaných skupin v souboru. Prakticky to znamená, že pokud chceme zjistit, jaký je vzájemný vztah tří skupin, analýza nám poskytne hodnoty dvou kanonických proměnných. Hodnoty hlavních komponent i kanonických proměnných se označují jako skóre a podle potřeby je lze dále v závislosti na hypotéze testovat jednorozměrnými i vícerozměrnými statistickými testy. Metoda tenkých ohebných plátků (TPS) se od analýzy hlavních komponent i kanonické analýzy liší a zaslouží si detailnější vysvětlení. Princip metody je založen na přirovnání změny jednoho tvaru v druhý k pomyslné deformaci nekonečně tenkého kovového plátu na požadovaný tvar (tj. na tvar zkoumaného objektu). Množství energie, která musí být vynaložená na deformaci takového plátu, se označuje jako deformační energie. Deformační energie je zde základní veličina pro vyjádření tvaru a tvarové změny. Počítá se ze standardizovaných konfigurací význačných bodů pomocí matematické funkce (U-funkce). Ty změny tvaru, na které není potřeba vynaložit žádnou deformační energii, se označují jako afinní (také lineární nebo uniformní) složka tvarové změny. Při afinní deformaci se přesunuje současně skupina význačných bodů (např. proporční zužování nebo rozšiřování, obr. 6). V grafické vizualizaci afinní změny tvaru zůstává zachován rovnoběžný průběh sítě deformační mřížky (viz dále). Přestože se tvar mění, nedochází k deformaci v přesném slova smyslu. Všechny ostatní změny tvaru určují neafinní (nelineární, neuniformní) složku tvarové změny. Matici deformační energie (tedy pouze neafinní složku) je možné dále kombinovat do nových tvarových proměnných, které jsou jejich vzájemnými lineárními kombinacemi. To je důležité pro následné statistické hodnocení tvarových proměnných. Nové tvarové proměnné, které získáme rozkladem matice deformační energie, se označují jako hlavní varpy. Každá hlavní varpa popisující specifickou tvarovou změnu se skládá ze dvou složek. Hodnoty těchto složek se označují jako dílčí varpy. Platí, že hlavní varpy s nižším pořadovým číslem odpovídají změnám, na které je potřeba vynaložit nižší deformační energii (tyto změny jsou globálnějšího charakteru). Se stoupajícím pořadím hlavní varpy se zvyšuje i potřebná deformační energie popsané tvarové změny (změny jsou více a více lokálnější). Strukturu souboru v závislosti na hodnotách afinních a neafinních komponent tvaru lze dále studovat pomocí analýzy relativních varp. Vstupní proměnné (afinní komponenty a dílčí varpy nebo pouze dílčí varpy) jsou tímto kombinovány do nových tvarových proměnných tak, aby popsaly co největší podíl celkové variability v souboru. V podstatě se jedná o obdobu analýzy hlavních komponent. Jediným rozdílem je nastavení hodnoty parametru alfa. Parametr nebo koeficient alfa určuje, kterým tvarovým změnám má být při rozkladu tvaru přiřazena priorita. To znamená, zda mají být zvýrazněny změny globálního charakteru, jež postihují více bodů konfigurace (=1) nebo zda má být kladen důraz na lokální změny tvaru, jež zahrnují pouze jednotlivé body nebo malé ohraničené skupiny bodů (= -1) (obr. 7). Vedle statistických výhod se TPS používá také jako Obr. 6. Dva typy afinních změn tvaru, zužování a rozšiřování tvaru a ,,stříhavý" protichůdný přesun bodů. 286 matematický základ pro grafickou vizualizaci výsledků. Interpolační funkce, která slouží pro výpočet deformační energie, může být graficky znázorněna jako transformační mřížka. Vedle posunu ve zvolených význačných bodech, jsou na základě vypočítané funkce odhadnuty a vykresleny také změny, které probíhají v těch oblastech objektu, které nebyly popsány význačnými body (např. ty části objektu, kde body nelze správně definovat nebo které se nezachovaly). Vizualizaci tvarové změny zavedl do biologických věd Obr. 7. Schéma vlivu hodnoty parametru alfa na tvarovou změnu popsanou první relativní varpou: a) = 0, b) = 1, c) = -1. Obr. 8. Tvarové rozdíly mezi lidskou lebkou a lebkami šimpanze a paviána vyjádřené deformační mřížkou podle D`Arcyho Thompsona. Tvarové proměnné Fourierovy analýzy legendární průkopník matematické biologie D'Arcy Thompson (1917). Pomocí pravidelné čtvercové sítě horizontálních a vertikálních čar byl schopen zobrazit změnu jednoho tvaru v druhý (obr. 8). Pokud nebyla narušena pravidelná čtvercová struktura sítě, pak se organismy lišily výhradně ve velikosti a nikoliv ve tvaru. Význam mřížky podle D'Arcyho Thompsona byl čistě ilustrativní. S matematickým popisem deformační mřížky přišel až o desítky let později právě Fred Bookstein. Hodnoty tvarových proměnných Fourierovy analýzy jsou získány Fourierovou transformací prostorové informace o obryse (kartézské souřadnice, úhlové souřadnice, řetězový kód). Do skupiny tvarových proměnných Fourierovy analýzy patří Fourierovy koeficienty, amplitudy a fázový úhel. Bylo také zmíněno, že Fourierova analýza se vyskytuje ve dvou základních formách - klasické nebo konvenční Fourierově analýze a eliptické Fourierově analýze. Z mnoha odlišností mezi tradiční a eliptickou analýzou uveďme, že vstupními daty tradiční FA jsou úhlové souřadnice, které musí být jedinečné pro každý z bodů na křivce. V praxi to znamená, že dva různé body na obryse objektu nesmí ležet ve stejném směru, třebaže v rozdílné vzdálenosti, od počátku soustavy souřadnic (obvykle střed gravitace). Vstupními daty eliptické Fourierovy analýzy jsou obvykle kartézské souřadnice (x, y, případně z) bodů na křivce. Každému bodu obrysu je tak automaticky přiřazena jedinečná kombinace souřadnic v systému a není překážkou, když jsou dva i více bodů popsány stejnou hodnotou souřadnice x nebo y. S tímto vy- 287 Jakmile je zajištěna linearita a vzájemná nezávislost, je možné tvarové proměnné testovat libovolnými testy jednorozměrné i vícerozměrné statistiky. Permutační a Hotellingův test jsou základními testy pro testování shody průměrných tvarů dvou skupin. Pokud chceme testovat více než dvě skupiny, pak je vhodnější použít vícerozměrnou analýzu rozptylu (MANOVA). Vztahy mezi tvarovými proměnnými a velikostí mezi různými skupinami lze řešit vícerozměrnou analýzou kovariance (MANCOVA). V úvahu přichází také diskriminační analýza, v případě, že potřebujeme vytvořit diskriminační nebo klasifikační model, např. pro určení pohlaví na základě tvaru lebky (obr. 9). Větší pozornost si zaslouží aplikace spojené s vytvořením predikčního modelu na základě lineární Obr. 9. Diskriminační modely pro určení pohlaví člověka pomocí tvarových proměnných lebky a okraje očnice. lepšením je možné analyzovat i komplexnější tvary, které mají složitejší průběh a vytvářejí komplikované útvary, jako jsou například invaginace. Z popsaných vztahů dále vyplývá, že zatímco v klasické Fourierově analýze musí být střed systému souřadnic shodný s centroidem objektů, v eliptické Fourierově analýze lze položit počátek kartézského systému souřadnic libovolně v prostoru. V závislosti na typu Fourierovy analýzy se také liší počet tvarových proměnných, kterými v konečné fázi tvar popíšeme. Zatímco množství amplitud a fázových úhlů odpovídá počtu použitých harmonických proměnných bez ohledu na to, zda se jedná o klasickou nebo eliptickou formu metody, je počet Fourierových koeficientů plně v režii daného typu. U klasického typu je počet dán vztahem p=2n, u eliptické pak p=4n a u trojrozměrné modifikace eliptické Fourierovy analýzy pak p=6n, kde p je počet Fourierových koeficientů na jeden popsaný objekt a n je počet zvolený harmonických proměnných. Statistické testování tvarových proměnných 288 Obr. 10. Alometrické změny tvaru lebky v závislosti na celkové velikosti, tvary spojené s nízkou hodnotou velikosti centroidu jsou zobrazeny vlevo od průměrného tvaru, tvary typické pro větší velikosti jsou zobrazeny vpravo. regresní analýzy. Tvarové proměnné mohou vystupovat jako nezávislé proměnné, na základě kterých predikujeme hodnoty jednoho nebo více závislých znaků (vícerozměrná regresní analýza). Anebo naopak tvarové proměnné figurují v modelu jako závislé proměnné, které jsou predikovány na jedné vstupní nezávislé proměnné (vícerozměrná regresní analýza). Jako příklad první aplikace uveďme predikční model pro identifikaci stop čeledi psovitých na základě 12 význačných bodů otisku předních a zadních končetin (Králík et al. 2008). Soubor 62 identifikovaných a dvou neznámých stop popsaných konfiguracemi 12 význačných bodů byl nejdříve standardizován obecnou prokrústovskou analýzou a poté byly metodou tenkých ohebných plátků vypočítány hodnoty dílčích varp. Regresní model pro identifikaci stop předních a zadních končetin byl sestaven na základě 18 dílčích varp a 2 hodnot afinní komponenty. Vytvořený predikční algoritmus, správně identifikoval 85% stop souboru a byl následně použit pro určení dvou neznámých stop, u kterých nebylo zřejmé, zda jsou otisky předních nebo zadních končetin. Druhý příklad, který zde uvedeme, se týká vztahu velikosti a tvaru. Pokud je tvar objektu odvozen od velikosti, označujeme tento jev jako alometrie. Vícerozměrná regresní analýza umožňuje podchytit tyto vztahy matematicky a predikovat, jaký bude například další vývoj tvarových proměnných uvnitř i mimo pozorovaný rozsah hodnot velikosti. Uváděným příkladem je alometrický vztah tvaru a velikosti lebky. Na základě velikosti centroidu 53 význačných bodů souboru 355 lebek byly predikovány hodnoty 20 hlavních komponent popisující tvarovou variabilitu v souboru (obr. 10). Nastíněný přehled kvantitativní analýzy tvaru pomocí metod geometrické morfometrie měl být pouze krátkým a obecným úvodem do rozsáhlejší problematiky studia tvaru. Metody geometrické morfometrie jsou dynamicky se rozvíjející součástí biologických věd, včetně biologické antropologie. Závěr V sociokulturní antropologii a archeologii se však dosud uplatňují jen málo. Doufáme proto, že tento metodický appendix přispěje k rozšíření povědomí o metodách geometrické morfometrie a jejich širšímu využití při řešení dalších témat i mimo oblast biologických věd. 289 Bookstein, F.L. (1982): Foundations of morphometrics. Annual Review of Ecology and Systematics 13: s. 451-470. Bookstein, F.L. (1991). Morphometric Tools for Landmark Data. Cambridge University Press, Cam- bridge. Bookstein, F.L. (1996): Biometrics, biomathematics and the morphometric synthesis. Bulletin of Mathematical Biology 58/2: s. 313-365. Bookstein, F.L. (1997): Shape and the Information in Medical Images: A Decade of the Morphometric Synthesis. Computer Vision and Image Understanding 66/2: s. 97-118. Gunz, P., Mitteroecker, P., Bookstein, F.L. (2005): Semilandmarks in Three Dimensions. In: D. Slice (ed.): Modern Morphometrics in Physical Anthropology, Volume V: Developments in Primatology: Progress and Prospects. New York: Kluwer Academic Press: s. 73-98. Iwata, H., Ukai, Y. (2002): SHAPE: A Computer Program Package for Quantitative Evaluation of Biological Shapes Based on Elliptic Fourier Descriptorsl. The Journal of Heredity 93: s. 384-385. Iwata, H., Nesumi, H., Ninomiya, S., Takano, Y., Ukai, Y. (2002): Diallel Analysis of Leaf Shape Variations of Citrus Varieties Based on Elliptic Fourier Descriptors. Breeding Science 52: s. 89 - 94. Kendall, D.G. (1977): The diffusion of shape. Advances in Applied Probability 9: s. 428-430. Knußmann, R. (1988): Anthropologie. Handbuch der vergleichenden Biologie des Menschen. Band I: Wesen und Methoden der Anthropologie. Gustav Fischer Verlag, Stuttgart-New York. Králík, M., Urbanová, P., Hyršovská, J. (2008): Hodnocení stop na stavební keramice ze středověké cihelny ze Sezimova Ústí. In: Krajíc, R. (2008): Středověké cihlářství. Sezimovo Ústí - archeologie středověkého poddanského města 4. České Budějovice, Tábor: Jihočeská univerzita v Českých Budějovic ích a Husitské muzeum v Táboře, s. 205-279. Lestrel, P.E. (1997): Introduction and Overview of Fourier Descriptors. In: P. E. Lestrel (ed.): Fourier Descriptors and Their Applications in Biology, s. 22-44. Lestrel, P.E., Cesar jr., R.M., Takahashi, O., Kanazawa, E. (2004): A Fourier-wavelet representation of 2D-shapes: sexual dimorphism in the Japanese cranial base. Anthropological Science 112/1: s. 3-28. Lestrel, P.E., Cesar jr., R.M., Takahashi, O., Kanasawa, E. (2005): Sexual dimorphism in the Japanese cranial base: A Fourier-wavelet representation. American Journal of Physical Anthropology 128: s. 608-622. Lestrel, P.E., Brown, H.D. (1976): Fourier Analysis of Adolescent Growth of the Cranial Vault: A Longitudinal Study. Human Biology 48/3: s. 517-528. Lu, K. H. (1965): Harmonic Analysis of the Human Face. Biometrics 21: s. 491 ­ 505. Slice. D.E. (2007): Geometric Morphometrics. Annual Review of Anthropology 36: s. 261-281. Urbanová, P., Eliášová, H., Králík, M. (2006): Morphometric Outline-Based Approaches in Forensic Anthropology. Proceedings of XX Congress of International Academy of Legal Medicine. Budapest, Hungary. MEDIMOND S.r.l. International Proceedings, s. 207-212. Zelditch, M.L., Swiderski, D.L., Sheets, H.D., Fink, W.L. (2004): Geometric morphometrics for biologists: a primer. Elsevier Academic Press, New York. Thompson D. W. (1917): On Growth and Form. Cambridge University Press, Cambridge. Literatura 290 Termín Český ekvivalent Affine component Afinní komponenta Affine transformation Afinní transformace Allometry Alometrie Amplitude Amplituda Baseline Základna Bending energy Deformační energie Bookstein shape coordinates Booksteinovské tvarové souřadnice Canonical variate analysis Kanonická analýza Cartesian coordinate system Kartézská soustava souřadnic Centroid Centroid, střed gravitace Centroid size Velikost centroidu Cluster analysis Shluková analýza Consensus Konsenzus Correlation matrix Korelační matice Cross-validation Křížová validace Covariance matrix Kovarianční matice Digitizer Digitizér Discriminant analysis Diskriminační analýza Elliptic Fourier analysis Eliptická Fourierova analýza Eigenshapes analysis Analýza vlastních tvarů Eigenvalues Vlastní hodnota Eigenvectors Vlastní vektor Euclidean distances Euklidovská vzdálenost Factor analysis Faktorová analýza Fourier analysis Fourierova analýza Fourier coefficient Fourierův koeficient Fourier descriptors Fourierův deskriptor Fuzzy landmarks Neostré body Generalized Procrustes analysis Obecná prokrústovská analýza Geometric morfometrics Geometrická morfometrie Harmonic Harmonická proměnná Hotteling T2 test Hotellingův test Chaincode Řetězový kód Intra-observer error Chyba hodnotitele Inter-observer error Chyba mezi hodnotiteli Landmark identification error Chyba identifikace význačných bodů Landmark-based methods Metody analýzy význačných bodů Landmarks Význačné body Least squared analysis Analýza nejmenších čtverců Least squares deviation Chyba nejmenších čtverců Logistic regression Logistická regrese Mahalanobis distance Mahalanobisova vzdálenost Návrh české terminologie geometrické morfometrie 291 MANCOVA Vícerozměrná analýza kovariance Manhattan distance Manhattanská vzdálenost MANOVA Vícerozměrná analýza rozptylu Matrix Matice Morphospace Prostor tvarových proměnných Multivariate analysis Vícerozměrná analýza Multivariate regression analysis Vícerozměrná regresní analýza Nyquist frequency criterion Nyquistovo kritérium Ordinary Procrustes analysis Obyčejná prokrústovská analýza Orthogonal projection Ortogonální projekce Outline-based methods Metody analýzy obrysů Partial least squares analysis Dílčí analýza nejmenších čtverců Partial Procrutes analysis Dílčí prokrústovská analýza Partial warp Dílčí varpa Permutation test Permutační test Phase angle Fázový úhel Principal components analysis Analýza hlavních komponent Principal warps Hlavní varpa Procrustes distance Prokrústovská vzdálenost Procrustes residual Prokrústovské reziduum Procrustes superimposition Prokrústovská superpozice Reflection Procrustes analysis Symetrická prokrústovská analýza Relative warp Relativní varpa Render model Stínový model Repeatability Opakovatelnost hodnotitele Relative warp analysis Analýza relativních varp Reproducibility Opakovatelnost dvou a více hodnotitelů Resistant fit Robustní přizpůsobení Semilandmarks Pomocné body Shape Tvar Shape and size space Prostor tvarových a velikostních proměnných Similarity coefficients Koeficienty podobnosti Size Velikost Size-adjusted morphospace Prostor tvarových proměnných s korekcí na velikost Sliding semilandmarks Klouzavé pomocné body Standardization Standardizace (normalizace) Step-wise discriminant analysis Postupná diskriminační analýza Tangent space Tangenciální prostor Thin-plate splines Metoda (tenkých) ohebných plátků Transformation grid Deformační mřížka Translation-rotation-scaling Posun, otáčení a změna velikosti Uniform component Uniformní komponenta "U" function Funkce ,,U" Variable Proměnná Wavelet analysis Vlnková analýza Wireframe model Drátový model