Počítačová podpora v archeologii Jiří Macháček (editor) Ústav archeologie a muzeologie Filozofická/oku/ta Masarykovy univerzity Brno /997 Práce vznikla s podporou grantu Fondu rozvoje VŠ 1996 č. 554, Ústavu archeologie a muzeologie Filozofické jákl/hy MasGlykovy univerzity, Filozojické fakulty MasGlJ'kovy univerzity a grantu GrauIOvé agentury AV ('R Č. A 9002603 © Jiří Macháček 1997 ISBN 80- 210- 1562-4 1. PŘEDMLUVA (VLADIMÍR PODBORSKÝ) ...................................................................................9 2. ÚVOD (JIŘí MACHÁČEK, EDITOR) ............................................................................................. 11 3. DATABÁZOVÉ SYSTÉMY (JAROSLAV SMUTNÝ) ....................................................... ....... 15 3.1 ÚVOD .........................................................................................................•.......................•...... 15 3.2 DATAllÁZOVÉMODELY .............................................•.........••.........•. .........•...........•.......... ..•...... 16 3.2.1 Klasické souborové zpracováni dat.............................................................................. 16 3.2.2 Hierarchické databázové modely. ................................................................................ 17 3.2.3 Síľové databázové modely. ........................................................................................... 17 3.2.4 Relační databázové modely. ..................................•...................................................... 18 3.2.5 Objektové databázové modely ...................................................................................... 19 3.3 DALSí DĚLENí DA-TABÁZOVÝCH SySTÉMŮ........................ ......................••..........••...........•........ 19 3.4 STRUČNÝ POPIS NEJZNÁMĚJS íCH DATABÁZOVÝCH PROGRAMŮ .............•...........•.... .................20 3.4.1 Access ...........................................................................................................................20 3.4.2 Foxpro...........................................................................................................................20 3.4.3 Visual dBase .................................................................................................................2 1 3.4.4 Oracle ...........................................................................................................................21 3.4.5 SQL server ....................................................................................................................22 3.5 ZÁKLADNí PRAVIDLA PRO TVORBU DATABÁZE ................•.........•..........••..........•...........••.........22 3.5. J Sestavení struktury datové báze....................................................................................23 3.5.2 Zabezpečen/dat ............................................................................................................31 3.5.3 VytvoFení spojení sjinými programy............................................................................3 I 3.6 ZÁVĚR ..................................................................................................... ..................................32 4. METODA ZÁKLADNÍHO ZPRACOVÁNÍ ARCHEOLOGICKÝCH VĚDECKÝCH DAT S POMOCÍ POČÍTAČOVÉ PODPORY (JIŘí MACHÁČEK) .................................................33 4. 1 ÚVOD ..................................... .......... .........................................................................................33 4.2 DEFINOVÁNí PROBLĚMU ...........................................................................................................33 4.2.1 PNklad I .......................................................................................................................34 4.3 VÝBĚR DAT A TVORBA STRUKTURY DATABÁZE ............................................ ...........................34 4.3.1 PNklad 2 .......................................................................................................................35 4.4 TESTOVÁNí RELEVANTNOSTI DAT ........................... ............................................................. .. ..36 4.4.1 PNklad 3 ......................................................................... ..............................................37 4.5 PLNĚNí DATABÁZE ................................................................................... .................................37 4.5. I PNklad 4 .......................................................................................................................38 4.6 DATABÁZOVÉ DOTAZY ................................................................ ............................................ .38 4.6.1 PNklad 5 ................ ....... ................................................................................................38 4.7 VIZUALIZACE DAT.....................................................................................................................39 4.7.1 PNklad 6 .......................................................................................................................39 4.8 TESTOVÁNi VÝSLEDKŮ ..... ..................................................................... ...................................41 4.8.1 PNklad 7 ...................................................... .................................................................42 4.9 INTERPRETACE ..........................................................................................................................43 4.9.1 PNklad 8 .............................................. .........................................................................44 4. 10 LITERATURA ...........................................................................................................................44 5. KOMENTÁŘ KE "KÓDU MORAVSKÉ DOMÁCÍ ENEOLlTlCKÉ KERAMIKY" (PAVEL KOŠTUŘÍK, JIŘÍ MACHÁČEK) ..................................................................................47 5. 1 ÚVOD ................................................................................................ ........................................47 5.2 TVORBA ARCHEOLOGICKÉHO KÓDU PRO PRAV ĚKOU KERAMIKU (OBECNÉ ZÁSADY A PRAKTICKÁ REALIZACE)........... ............................................................................................47 5.3 DATABÁZE MORAVSKÉ DOMÁcí ENEOLlTICKÉ KERAMIKY ................ .............. ................. ........50 s 5.3.1 Struktllra databázové tabulky .......................................................................................50 5 3 2 D kri č . k 'd . k . d .. ' I' . k' k· 'ky. _ es 'P 111 o m%vs e OflWCl eneo ltlC ,e elaml ...............................................52 5.4 Pi(iKLADY UŽITÍ DATABÁZE ... ...................................................................................................89 5.5 LITERATURA ................................................... ....................................................... ...................9 1 6. VÝPOČETNí TECHNIKA A ZPRACOVÁNÍ KAMENNÉ ŠTÍPANÉ INDUSTRIE (PETR NERUDA) .........................................................................................................................93 6. 1 ROZDĚLENÍ CELKOVÉ ANALÝZY ...............................................................................................93 6./.1 Analizajader ................................................................................................................94 6.1.2 Allalýza odbitých kusú ..................................................................................................95 6.2 KONKRÉTNÍ APLIKACE........................... ........ ............ .......................................... .....................98 6.3 LITERATURA ........................................................................................................................... 104 7. ARCHEOLOGiCKÁ DATABÁZE ČECH (MARTIN KUNA).................................................. I05 7.1 ÚVOD ....................................................................................... ............................................... 105 7.2 ZDROJE INFORMACÍ ADČ .......................................................................................................105 7.3 STRUKTURA DAT ..................................................................................................................... 106 7.4 SYSTÉM ARCHiV ................................................................................................................... 107 7.5 SBĚR DAT ......................................................................................................................... ....... 108 7.6 AKTUÁLNÍ STAV ADČ ............................................................................................................ 109 7.7 LlTERATURA ......... ............. ..................................................................................................... 109 8. STÁTNÍ ARCHEOLOGICKÝ SEZNAM ČR - INFORMAČNÍ SYSTÉM ARCHEOLOGICKÝCH NALEZIŠŤ (DARA BAŠTOVÁ, LENKA KRUŠ1NOVÁ, ZUZANA SKLENÁŘOVÁ, PETR VOLFÍK) ............................................................................. 115 8.1 ÚVOD ................................ ....................................... ............................................................... 115 8.2 PRINCIPY A TVORBA DATABÁZE ARCHEOLOGICKÝCH NALEZIŠl............................................ 115 8.3 STRUKTURA DATAI3ÁZE .......................................................................................................... 117 8.4 APLIKACE SAS ............................................................................. .. ............... ......................... 119 8.4.1 Normalizace databáze. referenční integrita ............................................................... 120 8.4.2 Datový model databáze SAS ....................................................................................... 120 8.4.3 Stav a vývoj aplikace .................................................................................................. 122 8.5 PROBLEMATIKA ŘEŠEN Í INTRAV I LÁNŮ ...................................................................................122 8.6 STÁn~ Í ARCHEOLOGICKÝ SEZNAM JAKO INFORMAČNÍ SYSTÉM ............................................. 123 8.7 LITERATURA ................................................................................. ............................ ..............123 9. GEOGRAFICKÉ INFORMAČNÍ SYSTÉMY (MILAN KONEČNÝ) .................................... 127 9. 1 CO JSOU G IS? DEFINICE A TERMINOLOGIE.... .................................... .................... ... ... ........... 127 9.1. I Pročjsou GIS tak žádané? ........................................................................................ 127 9.1.2 ll1tegrované systémy.................................................................................................... 129 9.1.3 Co jsou geografická data? ......................................................................................... 129 9.1.4 Složky GIS................................................................................................................... 129 9.1.5 Metadata ..................................................................................................................... 132 9.1.6 Datov)í model ..............................................................................................................133 9.1.7 Ukládání dat ............................................................................................................... 133 9.2 ZDROJE DAT V ČR ...................................................................................................................133 9.2.1 ZABAGED................................................................................................................... 133 9.2.2 Archiv grafick)ích dat KN ........................................................................................... 135 9.2.3 Databáze správních hranic územllích celk,;. .............................................................. 135 9.2.4 Vojensk)í topografický informační systém. .................................................................135 9.3 NovÉ TRENDY ROZVOJE GIS ..................................................... ........... ... .. ............................. 136 9.3.1 GIS v sítích.................................................................................................................. 136 9.3.2 Státní informační systém ČR....................................................................................... 138 6 9.3.3 Co je" information superhighway?" Úloha GIS ...................................................... 139 9.3.4 GIS a informační dálnice ............................................................................................140 9.3.5 Evropské aktivity: GI2000 .......................................................................................... 141 9.3.6 Česká národníprostorová informační infrastruktura................................................ 141 9A LITERÁRNí A ČASOPI SECKÉ ZDROJE O GIS A DIGITÁLNí KARTOGRAFI I. ..... ............. ............... 141 9.5 LITERATURA ........................................................................................................................... 142 10. TEORIE A PRAXE ZPRACOVÁNÍ ARCHEOLOGICKÝCH VÝZKUMŮ S POMocí PROSTŘEDKŮ GIS/LIS (MICHAL KUČERA, JIŘÍ MACHÁČEK)............ ............. ............ .145 10.1 ÚVOD ... ................................................................................ .................... .. ....... .................... 145 10.2 GEOGRAFICKÉ INFORMAČN í SYSTÉMY - DEFINICE A DĚLEN í ..................... .......................... 145 /0.2.1 Definice GIS..............................................................................................................145 10.2.2 DěleníGlS ................................................................................................................146 10.3 FÁZE TVORBY GIS ...................................... .............. ...................... ...... ......•.... ....... ...... ........ 147 /0.3.1 Úvodní studie ............................................................................................................ 147 10.3.2 Sběr dat ..................................................................................................................... 148 10.3.3 Správa dat ................................................................................................................. 15 I 10.3.4 Analýzy nad daty....................................................................................................... 151 10.3.5 Prezentace dat ..........................................................................................................153 10A PROGRAMOVÉ VYBAVENí KA FF MU ...... .......................... ..... ...... ...........................:... ........ 153 10.4.1 MicroStation .............................................................................................................153 10.4.2 MGE-PC2 ................................................................................................................. 154 10.5 PROJEKTY ŘADY POHAN ................................................................................................ ..... 156 10.5.1 Úvod do problematiky projektzi (dokumentace archeologického výzkumu) ............. 156 10.5.2 Úvodní studie ............................................................................................................ 156 10.5.3 Sběr dat ..................................................................................................................... 163 10.5.4 Správa dat .................................................................................:............................... 164 10.5.5 Analýzy nad daty....................................................................................................... 164 10.5.6 Prezentace................................................................................................................. 165 10.6 LITERATURA ..... .................................................................................................................... 165 10.7 UŽIVATELSKÉ PROSTŘEDí POHAN .................................................................. .................... 166 11. GEOGRAFICKÝ INFORMAČNÍ SYSTÉM A VÝZKUM PRAVĚKÉ SÍDELNÍ STRUKTURY (MARTIN KUNA) ....... .................. ..... ............ .............. ..................................... 173 11.1 ÚVOD .................................................................................................................................... 173 11.2 VÝZNAM GIS PRO ANALÝZU ARCHEOLOGICKÝCH A GEOGRAFICKÝCH DAT................. ....... 174 11.3 ZÁKLADNí FUNKCE GIS lDRlSl .............................................. ............................................. 174 llA VYTVOŘENí A ÚPRAVY ARCHEOLOGICKÉ MAPY................................................................... 176 11.5 INTERPOLACE DAT .............................................. ............. ........ ..... ........................................ 179 11.6 PI~íKLADY ........................ ... .. ................................................................................................ 180 11.6.1 PNklad 1: Kontinuita obytných areáhi..................................................................... 180 1I. 6.2 PNklad 2: Počet a rozsah sídelních areálzi .............................................................. 181 11.6.3 PNklad 3: Vztah obytných areáhi ke krajině ............................................................ 185 11.7 DODATEK: POZNÁMKY K VSTUPU DAT DO G IS ATISKU MAP............ ...................................190 11 .8 LITERATURA ......... ..................................................................................................... ........... 192 12. STATlSTICKÁ ANALÝZA ARCHEOLOGICKÝCH DAT (ZDENĚK WEBER) ................ 197 12.1 ÚVOD ............................................ ...... .............. .......... ........................... ...... .................. ....... 197 12.2 STATISTIKA PRO ARCHEOLOGY ............. .............................................. ............ ......... ............. 197 12.2.1 Prvek, znak, soubor, výběr, základní soubor ............................................................ 199 12.2.2 Indikátory a pravidlajejich výběru. .........................................................................20 I 12.2.3 Studium vazeb mezi vlastnostmi (znaky) ajejich hodnotami....................................202 12.3 STATISTICKÉ PROGRAMOVÉ VYBAVENí POČíTAČŮ ...............................................................203 7 12.4 STATISTICKÉ PAKETy...............................................................................•..........•........... ......204 12.4.1 Praktická demonstracej unkce programu WJNKS....................................................205 12.4.2 Doporučený postup při statistické analýze archeologick)ích dat.............................205 12.5 TABULKOVÉ KALKULÁTORy ........... .........................................................~ .........•..................207 12.5.1 Statistickéjimkce EXCELLU....................................................................................2 11 12.5.2 Funkce pro správu seznamli a databází....................................................................2 13 12.6 GRAFY DAT ...........................................................................................................................2 14 12.7 VíCEROZMĚRNÁ STATISTICKÁ ANALÝZA ..............................................................................214 12.8 ZÁVĚRy .................................................................................................................................2 14 12.9 LITERATURA ......................................................................................................... ...............2 14 13. K VYUŽITÍ SERJACE PŘI DATOVÁNÍ SIDLIŠTNí KERAMIKY (VLADIMÍR SALAČ).................................................................................................................2 15 13.1 ÚVOD ....................................................................................................................................21 5 13.2 PROBLEMATIKA DATOVI2ZÁKLADNY ................. ........ ................ ..........................................2 15 / 3.2./ Data ze sídlišť a pahřebišt'........................................................................................216 /3.2.2 PNk/ad - data z laténských sídmťv SZ Čechách ....................................................2 16 13.3 PROGRAM - KOM I3I NAČN Í ANALÝZA ARCHEOLOGICKÝCH NÁLEZŮ (KAA N)......................220 /3.3./ Tvorba matie .............................................................................................................220 13.3.2 Práce s maticemi.......................................................................................................221 /3.3.3 Seriace ......................................................................................................................223 13.4 PldKLAD. SERIACE LATÉNSKÝCH SÍDLlŠTNÍCI-1KERAM ICKÝCH SOUBORŮ ZE SZ ČECH ......223 /3.4.1 BI'eHany ....................................................................................................................223 /3.4.2 Bílinsko .....................................................................................................................229 /3.4.3 Sl Čechy ...................................................................................................................230 13.5 POZNÁMKY K UŽITÍ SERIACE PŘI DATOVÁNÍ SÍDLl Š'ř.. ..........................................................23 I 13.6 ZÁVĚR ...................................................................................................................................234 13.7 LITERATURA .........................................................................................................................235 14. SYNTÉZA STRUKTUR FORMALIZOVANÝMI METODAMI - VEKTOROVÁ SYNTÉZA (EVŽEN NEUSTUPNý) ..........................................................................................237 14. 1 FORMÁLNÍ ASPEKT ARCIIEOLOGICKÝCH STRUKTUR ........................................ ....................238 14.2 POSTUP FORMALIZOVANÉHO ŘEŠENÍ ....................................................................................239 14.2. I Krok O(sestavení deskriptivního systému) ...............................................................239 14.2.2 Krok / (v)ípočet korelačn! lI1atice) ............................................................................240 14.2.3 Krok 2 (výpočet jákta!'!i) ...................................................:.......................................240 /4.2.4 Krok 3 (rotacejaktani) .............................................................................................24 1 /4. 2.5 Krok 4 (faktorová skóre) ...........................................................................................242 /4.2.6 Krok 5 (validace) ......................................................................................................243 14.3 NEDNOSTI PORMALlZOVANÉHO HLEDÁNÍ STRUKTUR ........................................................ .243 14.4 PROSTOROVÝ ASPEKT ARClIEOLOGICKÝCH STRUKTUR......................... ... ............................244 14.5 PŘ ÍKLADY ...................................................................................... ...................... .................244 14.5. I Velikost z/all7kli laténské keramiky ...........................................................................244 14.5.2 Loděnický potok .......................................................................................................248 14.5.3 Vikletice (šňlirové polu'ebiště) ..................................................................................254 14.6 PRAKTICKE PROVEDENÍ ....................... ...................................... .. .........................................257 14.7 L ITERATURA ............................ .......................................... ...................................................257 8 1. Předmluva (Vladimír Podborský) Koncem 60. let se k nám dosta ly prvé informace o možnostech zpracování hromadných dat pomocí výpočetn í techniky. Obtížně se tehdy opatřovala základní literatura k této problematice a zkušeností s novou nadějnou metodikou práce s objemnými archeologickými soubory bylo pramálo. Nebyly ani výkonné kalku l ačky a o počítač ích a kybernetice j sme slyšeli jen z dálky. O to více láka ly nové možnosti, zv l áště když z rozvíjejících se velkých terénních výzku mů narllstal materiálový mobiliář do rozměrll , které hrozily zahlcením a o jehož analyticko-syntetickém využití jsme měli jen velmi nejasné představy. Východisko jsme tehdy spatřovali v matematickostatistických postupech a připravou pro jejich aplikaci, nejprve prostou "kupeckou", ve výh ledu snad mechanickou, bylo vytváření souborll děrných štítkll se základními formalizovanými informacemi O archeologických pramenech, zej ména o keramice; tehdy se ještě nevědělo nic o počítačových data- bázích. Jak tomu bývá při zavádění nových technologií, řada vyznavačů nové "počítačové" archeologie podlehla iluzím o j ed inečnosti a "samospasitelnosti" matematicko-statistických metod a funkci lidského faktoru při závěreč ných výstupech archeologických výzkumlI byla ochotna přenést na počítače, k nimž si ale přístup zjednávala jen s nej větším i obtížemi; počítač sám měl řeš it obtížné vědecké problémy za němé asistence badatele, který pouze shrne a zveřej ní jeho výpočty . Na druhé straně se zformovala konzervativní opozice archeologll, kteří v nových metodách "ohne Seele" viděl i jen l111ikovou hru od skutečné vědy, iluzorní až fantaskní opo/1unismus, v kybernetice pak v krajních případech dokonce ideologicky nebezpečnou buržoasní metodologii. Každopádně j eště dlouho v 70. letech u nás plati lo, že "dnešní badatelé používají počítačel se stejnou samozřejmostí jako antičtí služeb delfské věštírny" ... Za takových poměrl/ a při denn ích problémech s chodem pracovi šť a udržením pracně sestavených týmů bylo úče lné předevš ím připravit vhodné numerické deskripční systémy zpracovávaných archeologických pramenll a soubory výchozích dat, které by se později - až se výpočetní technika dostane do pracoven - řádně vytěžily a vyhodnotily. Na Katedře archeologie brn ěn ské Filozofické fakulty nčkolik takových .,numerických kódll" vzniklo a řada mladých archeologll se pro nové nekonvenční postupy práce s prameny zanítila. Myslím, že jim to bylo ku prospěchu zv láště poté, co se poč ítače i II nás sta ly běžnou pracovní pOnlíkkoll. Bylo ovšem třeba, aby se radikálně změnily poměry. Přístroj ové vybavení a nové technologie se mohly rozšířit teprve po revoluční proměně naší společnosti . P i onýři ,.nové archeologie" mezitím sestárli, větši nou však neztratili nadšení a s elánem se chopi li nových možností, nastupujícícm generacím se otevře ly široké, dříve netušené perspektivy: nové metodologie, výj ezdů do zahranič í, kontaktl/ s badatelskými centry pomocí Internetu atd. le potěšitelné, že na současném \Jstavu archeologie a muzeologie Filozofické fakulty MU v Brně se trad ice hledání nových metod udržela a našla schopné, pracovité a nadšené pokračovatele. Že se daří soustřeďovat kolem tohoto učili ště řadu přednich českých spec ial i stů v "počítačové" archeologii (ale nejen v ní), j e neméně významné; pro výchovu nových badatelů j e to nesmírně užitečné. Předkládaná skripta by to měla dokumentovat. Brno 2. ledna 1997 9 2. Úvod (Jiří Macháček, editor) Hromadné zavádění počítačů do všech oblastí lidské činnosti pracujících s informacemi je jeden z nejradikálnějších projevů technického pokroku posledních desetiletí. Nevyhýbá se ani společenskovědn ím disciplínám. Jak ukazují mnohé příklady (např. ze sociologie, psychologie, muzikologie, lingvistiky, pomocných věd historických), je i zde práce s výpočetní technikou velkým přínosem. K oborlnl1, které maj í pro využití počítačů ideální předpoklady, patří také archeologie. Možnosti aplikace počítačll v archeologii jsou, jak lze soudit podle zkušeností mnohých zahraničích a některých našich institucí, nesmírně široké. Slouží ke zpracování obrovského množství dat rllzného typu, nashromážděného generacemi archeologll. Zásadní roli hraje počítač nejen v inventarizaci deseti- až statisícov)'ch položek nálezového inventáře, sumarizaci informací z terénních výzkum" či prospekční č in nosti, ale i při jejich zpracování a prezentaci. Je při tom využíváno např. databázových systémll, statistických programII a nejnověji i tzv. GIS (Geografických informačních systémll). Skripta, která připravil početný kolektiv autorll, jsoll jedním z prvních pokus" o vysokoškolský studijní materiál, zaměřený speciálně na výuku počítačové podpory v archeologii. Svoji formou jsou proto poněkud odlišná. Nemají za úkol poskytnout jednoduchý návod k práci č i sumarizovat v kompaktní formě naše dosavadní znalosti. Záměrem předloženého materiálu je naopak ukázat šíři a různorodost možností, které nové informační technologie v archeologii nabízejí. Kromě teoretických statí a metodíckých postupů zde proto naleznete i konkrétní aplikace a zkušenosti z praxe. Skripta hy měla především probudit zájem o využití výpočetní techniky a inspirovat archeology k hledání nových metodologických cest v jej ich oboru. Skripta jsou rozdělena do tří tematických částí věnovaných databázím, geografickým informačním systémlllTI a statistice. První část seznamuje s nejrozšířeněj ší počítačovou technologií, sloužící k zpracovaní velkého objemu dat. V úvodu se J. Smutný věnuje databázím z nejobecnějšího hlediska. Popisuje Funkci databáze, představuje některé z nejznámějších databázových programú a definuje zák ladní obecná pravidla pro její tvorbu . V další stati předkládá J. Macháček návrh postupu pro základní zpracování archeologických vědeckých dat s pomocí databází a tabulkových kalkulátoril. Zcela konkrétní aplikací je popis kódu a databáze moravské eneolitické keramiky od P. Koštuříka a J.Macháčka. Možnosti využití výpočetní techniky při zpracování kamenné industrie jsou tématem příspěvku P. Nerudy. Poslední dvě stati jsou věnovány nejrozsáhlejším projektům archeologických databází v České republice - Archeologické databázi Čech (M. Kuna) a Státnímu archeologickému seznamu ČR (L. Krušínová). Jedná se do jisté míry O konkurenční a paralelní projekty, které však hrají v naší archeologii významnou a jedinečnou roli. V příspěvcích se čtenář seznámí s metodologickým pozadím obou projektlJ a mllže srovnat rMné přístupy při tvorbě archeologických databází velkého rozsahu. Druhá část je tematicky věnována technologií pro archeology velice přitažlivé. Geografické informační systémy logicky navazují na databáze, kjejímž negrafickým datlJm dodávají dlJiežíté prostorové "daje. Zachycení reálného světa v počítači se tak stává mnohem komplexněj š í, což v konečných dllsledcích umožňuje jeho hlubší pochopení. V úvodní stati této části se M. Konečný zamýšlí z obecného hlediska nad významem GIS pro dnešní společnost. Seznamuje čtenáře se zdroji digitálních geografických dat v České republice a snaží se přiblížít nové trendy rozvoje GIS. Součástí článku je i pojednání O metadatech, které by zasluhovalo pozornost všech archeo logů, vytvářej ících rozsáhlejší soubory nejen geografických dat. Stať M.Kučery a J. Macháčka je věnována problematice vektorového GIS. Po kapitole o teorii tvorby GIS/LIS následuje popis konkrétní aplikace systému při zpracování výsledkll rozsáhlých systematických výzkumII na Pohansku u Břecl avi. Práce je dop lněna instruktáží k pracovnímu prostředí vyvinutému speciálně pro potřeby digitalizace archeologick)'ch grafických dat v programu MicroStation. Ve třetím z člá nků zaměřených na problematiku GIS předvádí M. Kuna funkce rastrového GIS a jeho možnosti ilustruje na příkladu pozoruhodného projektu výzkumu pravěké krajiny ve středních Čechách. Závěrečné pasáže skript jsou věnovány statistickému vyhodnocení archeologických dat. Z. Weber zde seznamuje čtenáře s počítačovými programy zaměřenými na základní statistiku vědeckých II dat. Práce V. Salače je výsledkem jeho dlouholetých zkušeností se seriací archeologického materiálu. Metodiku tohoto statistického postupu dokumentuje na přík lad u zpracování laténské sídlištní keramiky. E. Neustupný představuje možnosti jednoho z mocných statistických nástrojil - faktorové analýzy. Autor se problémem nezabývá pouze v teoretické rovině, ale i v bohatě dokumentovaných praktických příkladech, což je velice důležité pro pochopení složité metody. Pozoruhodné je propojení výsledkil statistických analýz s G IS. Je jisté, že tato skripta nemohla v plné šíři obsáhnout možnosti počítačových technologií při práci archeologa. Nedostalo se v nich místo např. na fotorea listickou visualizaci archeologických monumentů, prezentaci archeologických dat prostřednictvím Internetu a mnoho dalších témat. Přesto lze doufat, že se stanou zdrojem inspirace pro novou nastupující generaci archeologiI, jejichž úkolem bude hromadné zavádění nových metod v praxi. V Brně 21. 1. 1997 \2 Databáze v archeologii 3. Databázové systémy (Jaroslav Smutný) 3.1 Úvod Potřeba databází vzešla z probléml' při zpracování různých ekonomických a evidenčních agend. Definovat a sestavit datový model, který by dobře reprezentoval příslušnou agendu je velmí náročné. Z mnohotvárného a složítého reálného světa musíme vyčlenit člověkem pochopitelnou předmětovou oblast. Z popisu předmětové oblasti musíme abstraktním odvozením vytvořit sémantický (významový) popis projektované báze dat, to znamená její konceptuální schéma. Popis datové báze je v každém případě velmi značným zjednodušením reality. Jediným kritériem jeho správnosti je schopnost zodpovědět všechny požadované dotazy. A dotazy musí být mOžno formulovat přirozeně, jej ich správnost musí být intuitivně zřejmá a formální aparát použitý pro zápis konceptuálního schematu musí být převoditelný do prostředků přímo realizovatelných na počítači. Od počátku 70 let se objevuj í pokusy o zachycení významu - sémantiky dat ukládaných do informačních systémů. Vznik prakticky použitelného sémantického modelu, který umož'luje popsat konceptuální schema dat, je spjat se s modelem "Entity-vztah" (Entity-Relationship, E-R). Tento model umožňuje zachytit ve svých schematech objekty vnějšího světa, které jsou předmětem našeho zájmu v databázovém modelu. Jde tedy o objektově orientovaný model. V něm rozlišujeme dva základní typy objektů: • entity - objekty v počítači nereprezentovatelné • popisy (deskripce) - s jejich pomocí popisujeme vlastnosti entit Popisy pak lze rozdělit do různých typů, přesně určujících operace, které lze s příslušnými popisy provádět. Vztahy mezi popisy a entitami pak nazýváme atributy, vztahy mezi entitami - relace. Pojem relace nemá žádnou souvislost S relacemi v relačním modelu. Příklad modelu E-R je na obr. I. Jde o klasický případ evidence v bance. Zákazník je reprezentovaný jménem a adresou, konto pak číslem a částkou. Vztah mezi zákazníkem a účtem je " mít účet". V praxi jsou možné další varianty. Zákazník má více účtů, ale jeden účet náleží právě jednomu zákazníkovi. Zákazník Mít účet Účet Objekt - zákazník Vztah - mít účet Objekt - Účet Obr. I. Z výše popsaného je zřejmé, že pro popis datové báze na konceptuální úrovni se používá obecný model dat. Je to souhrn prostředkú pro: 15 • popis dat • popis vazeb • popis omezení pro jednotlivá data Pomocí modelu E-R se dají snadno popsat objekty, jejich vlastnosti a vztahy, které chceme v databázi zobrazovat. Přičemž model E-R má pro popis struktury databáze podobnou funkci jako má vývojový diagram pro popis algoritmu. Pro realizaci musíme místo abstraktního objektu použít jeho implementaci, kterou je většinou záznamový model. Různé záznamově orientované modely se pak liší implementací vztahů. V další části pak budou popsány modely záznamově orientované (hierarchické, siťové a relační). V zásadě se dá zpracování agend rozdělit na následovné úlohy: • Tvorba datové báze • aktualizace dat • vyhledávání dat Pro práci s daty na počítači bylo vyvinuto mnoho nejrůznějších metod, efektivních pro široké spektrum úloh. V následujících odstavcích budou popsány jednotlivé metody z hlediska historického vzniku. 3.2 Databázové modely 3.2.1 Klasické souborové zpracování dat. Data jsou zpravidla organizována tak, že každý objekt zobrazované reality je popsán záznamem souboru, vlastností objektu položkami záznamu. Popis všech objektu tvoří soubor, což je základní objekt zpracování. Tedy stručně řečeno: • záznam popisuje všechny vlastnosti jediného objektu • soubor popisuje všechny vlastnosti všech objektů • položka záznamu popisuje jedinou vlastnost jediného objektu Vyhledávání spočívá v tom, že v souboru nalezneme požadovaná data, např. zadáme vlastnost a hledáme všechny objekty, které ji mají. Cílem je odpověd na dotaz. Aktualizací pak rozumíme opravu dat v souboru, přičemž můžeme přidat nové, nebo zrušit staré popisy objektů. Aktualizace probíhá na dvou souborech. První z nich, kmenový soubor popisuje stav objektll na konci posledního zpracování, druhý změnový popisuje změny ve vlastnostech objektů, které od posledního zpracování nastaly. Výsledkem je třetí soubor, který popisuje výsledný stav objektů, tj. stav po provedení změn. Již z popisu je vidět, že tento zpllsob má řadu nedostaků, které se staly brzdou dalšího rozvoje zpracování hromadných dat. Soubory jsou navrženy podle potřeb konkrétních programů, které je používaj í. Při změně datových struktur se musí opravit i obslužný program. Dalšími problémy jsou redundance a konzistence dat. Redundance je vícenásobný, nadbytečný výskyt infonnace. Je li v souborech obsažen opakovaně stejný údaj, musí mít za všech okolností stejnou hodnotu, protože popisuje jedinou vlastnost jediného objektu. Tento problém se nazývá konzistence dat. Všechna data uložená v souboru musí odpovídat vlastnostem popisovaných objektů reálného světa. Tuto vlastnost nazýváme integrita.Vlastnosti objektů reálného světa se ovšem v čase mění a je třeba, aby se tyto změny včas a při zachování konzistence odrazily v datech, které vlastnosti měnících se objektů popisují. Význačným a velmi pokrokovým krokem bylo oddělení datových souborll od aplikačních programll. Vznikající databázové systémy pak můžeme charakterizovat následujícími vlastnostmi: • struktury aplikačních programů a datových souborů jsou odděleny 16 • přístup k datOm je možný jen prostřednictvím programli databázového systému nikoli přímo • dotazy nejsou pevné • je ullložněn přístup více uži vate l ů současně a vyřešena ochrana dat proti zneužití 3.2.2 Hierarchické databázové modely. Dalším logickým stupněm ve vývoji databázových modelllje hierarchický databázový systém. Y tomto modelu jsou data organizována na zák ladě stromové struktury vycházející z kořene. Jednotlivé datové struktury jsou um ístěny na různých úrovních ležících podél větví, které vycházej í z kořene. Datovým strukturám na jednotlivých úrovních se říká uzly. Pokud z uzlu nevychází další větev, říká se mu lisl. Stromová struktura definuje rod ičovské a sourozenecké vztahy mezi rllznými prvky vdatabázi. Velmi přípomíná organizační schema, které všichni známe pod názvem "pavouk". Obr.2. kořen Synové kořenového uzlu Synové uzlll 1. úrovně Dle obr. 2 je velmi dobře vidět, oč je tento systém lepší než předchozí. Chce-l i uživatel najít nějakou informaci, není potřeba prohledávat celý soubor. Stač í, když se požadavek rozloží na jednotlivé složky a jde se od kořene na příslu šnou větev a z ní na další větev a pod.. Na fyzické struktuře dat na disku v tomto modelu prakticky nezáleží. Větši nou jsou data uložena jako zřetězený seznam položek s ukazateli ocl otce k synům a od sourozence k sourozenci. Posledn í list má ukazatel nulový. Přidání nových položek na jakékoliv úrovni je rovněž poměrně snadné. Musí se pouze změnit koncový ukazatel na ukazatel na další sourozenecký lIzel. Ačkoli je tento model velmi flexibilní, má i některé problematické rysy. První problém vyplývá z počáteční struktury databáze, která je pevně clána. Programátor ji musí definovat, když databázi v)1váří. Pakjiž nemohou být rodičovské vztahy změněny bez úplného přepracování celé struktury. Nej závažněj ším problémem hierarch ických databází však je to, že neposkytují žádnou jednodUell0Umetodu pro definování křížových vztahll neboli vztahl! "mnohý k mnoha". Tento problém je možno vyřeš it ukládáním dat ve více kopiích na rllzných úrovních. Jiným způsobem j e přidání sektll1dárních rod ičovských a sourozeneckých ukazatelů do hierarch ické struktury. Pak ale vzniknou četné cykl ické vztahy a situace se zn ačně zkomplikuje. 3.2.3 Síťové databázové modely. S íťový moclel popisuje databáze, v nichž existují vztahy "mnohý k mnoha" (tj. vícenásobné rodičovství). Vztahy mezi položkami se obvykle označují jako "množiny" z dllvodu od lišení od striktně rod ičovských vztahll v hierarchickém modelu. S íťový databázový model je založen na ukazatelích 17 (lineárních nebo cyklických, které vyjadřují vztahy mezi jednotlivými položkami. Flexibilita při vytváření vztahu "mnohý k mnoha" je nejsilnější zbraní síťového modelu. Avšak vzájemné vztahy mezi rl.znými množinami se mohou stát velmi komplikovanými a obtížně mapovanými. Stejně jako hierarchický může i síťový model poskytovat velkou rychlost zpracování, zvláště použijí-Ii se indexové ukazatele směřující přímo k první položce v prohledávané množině. Síťový model má však stejné problémy se strukturou, stejně jako hierarchický model. Jakmile je databáze vytvořena, každá další změna najiný systém množin vyžaduje, aby byla vytvořena nová struktura. Přidávání nových položek je však oproti předchozímu modelu jednodušší. Stačí pouze definovat novou množinu a změnit potřebné ukazatel, aby se nová množina správně začlenila do zbývajících dat. 3.2.4 Relační databázové modely. Model relační databáze definoval v roce 1970 Dr. E. F. Codd. Tento model je založen na teorii množin, relacích a relačním kalkulu. Opouští myšlenku rodičovských vztahlJ mezi různými položkami. Místo toho organizuje data do uspořádaných n-tic. Prvky takových množín se obvykle znázorIlUj íjako jako řádky tabulky. Každá položka se stává sloupcem tabulky a každý záznam jejím řádkem. Matematickým základem je teorie množin, na základě které se definuj í množiny datových hodnot, které jsou pro systém atomické (nedělitelné). Seskupením těchto datových hodnot na základě jejich příbuznosti získáme doménu datových hodnot. Vztahy mezi datovými hodnotami v doménách tvoří množinu vztahl!. Každý prvek z této množiny vztahů je tvořen dvojicí hodnot, to je hodnotami dvou atomických datových hodnot ze dvou domén. Takový vztah se pak nazývá relace. Nástrojem pro manipulaci s relacemi je relační algebra. To je souhrn pravidel a operací, které manipulují s relacemi jako celky a výsledkem jsou opět relace. Protože relace jsou vlastně množiny, je možné pro práci s relacemi použít základní množinové operace - součin, sjednocení, průnik, rozdíl. Relační algebru je možné použít jako dotazovací jazyk. V roce 1982 Dr. Codd definoval databázový systém pomocí následuj ících podmínek: o všechna data jsou uložena v relačních tabulkách o neexistují vícenásobné přístupové mechanismy o dotazovací jazyk musí umož"ovat operace - selekce, projekce, spojení V roce 1985 tyto podmínky pravidla byla upřesněna a doplněna: o práce s daty je uskuteČllována pouze relačními prostředky o databáze na logické úrovni je dána pouze relacemi o musí existovat přístupový mechanismus k uloženým datllm (název tabulky, název sloupce, hodnota přístupového klíče) o jsou definovány prázdné hodnoty o veškerý popis databázových objektl' je uchován v relačních tabulkách, manipulace s daty je založena na relační algebře o existuje jazyk pro definici dat včetně vytváření pohledů a podpory vstupů a výstupů o existují příkazy pro manipulaci s daty (příkazy - insert, delete, update) o je možné definovat přístupová práva o logické relace jsou nezávislé na jejich fyzické reprezentaci (fyzická datová nezávislost) o funguje logická datová nezávislost Na obr. 3 je pak praktická ukázka relačního databázového modelu. Jde O zjednodušené přepracování modelu E-R z obr I. 18 I Jméno Adresa Číslo účtu Částka Čapek Veveří 95 00001 10.000,Strauss Slatinská 5 00002 25.000,Němcová Česká 5 00003 15.230,Veselý Grohova I 00004 78.800,Fišer Veveří 91 00005 125.560,Čapek Veveří 95 00006 16.802,Obr. 3. Relační model má oproti hierarchickému a síťovému modelu řadu výhod. Snad nejdldežitější z nich je naprostá flexibilita v popisu relací mezi rlJznými položkami. Změna struktury databáze spočívá v pouhém pr-idání nebo zrušení sloupce v tabulce. A to nijak neovlivní ostatní sloupce ani ostatní tabulky. Kdykoliv lze vytvořit novou tabulku jako projekci (podol11ožinu) existujících tabu lek. Staré tabulky lze podle uvážení zrušit. To, že k provedení není nutno znovu vytvářet celou strukturu datové báze, se pochopitelně odrazí v zachování integrity dat. Nejdúležitější rozhodnutí, před které jsme při vytváření datových struktur postaveni, je definování tabulek. Proces dekompozice dat do podmnožin pro jednotlivé tabu lky se nazývá normalizace. Hlavním cílem relačního databázového modelu je zachování maximální integrity dat. Aby mohl být považován skutečně za relační, musí zcela znemožnit přístup k datúm jinak než prostřednictvím dotaZll zpracovávaných jím samým. Relační model vyžaduje, aby programy pracovaly s daty, aniž by znaly jejich umístění v databázi. Zde je velký rozdíl oproti dříve popsaným modelll111, kde programy musí vyhledávat data sledováním řady ukaz.atelů. Program vznášející dotaz na relační databázi prostě požádá o data, kteréje potřeba vyhledat, systém řízení baze dat provede potřebná vyhledávání a poskytne žádanou informaci. Detaily vyhledávání jsou specifické pro každý programový produkt. Prohledávání múže být urychleno vytvořením indexového souboru projeden nebo více sloupclJ tabulky (bude vysvětleno později). Jedinou nevýhodou relačního databázového modelu je, že tabulka reprezentující vztah v relačním modelu zabírá více místa než reprezentace vztahu v hierarchickém a síťovém modelu. Ovšem naprosto převažujíci výhodou relačního modelu, jak již bylo popsáno dříve, je fakt, že obsahuje jen dvourozměrné tabulky, které se navíc snadno implementují jako soubory. Navíc se relační databáze obtížně vyrovnávají s rozměrnými daty proměnné velikosti (texty, obrázky, zvuk, video-sekvence). Děje se tak pomocí datových typlJ BLOB (Binary Large Objects). Na závěr tohoto oddílu je třeba podotknout, že naprostá většina databázových program" dnes provozovatelných na nejrlJzněj ších platformách je založena na relačním modelu. 3.2.5 Objektové databázové modely u objektově orientované databúze jsou určité položky shrnuty do jednoho objektu. Objekt obsahuje data těchto položek a navíc má definovány funkce a zplJsoby jak s daty nakládat. Velkou výhodou objektových databází je možnost práce s rlJznými typy dat, tedy i s nestrukturovanými. Tento typ databází je však v současné době ve fázi vývoje, nicméně do budoucna se jeví velmi perspektivní, obzv l áště s nástupem a rozvojem multi-mediálních aplikací. 3.3 Další dělení databázových systémů Dosud jsme se zabývali popisem databázových systémlr z hlediska typu datového modelu. Podle zplJsobu spolupráce aplikace s databázovým systémem lze databázové systémy na: • souborové databázové systémy (např. typu xBase) • systémy typu kl ient -server 19 Rozdíl mezi oběma typy se projeví především při práci v počítačové síti. Při použití souborového databázového systému veškeré zpracování probíhá na lokálních počítačích. Na počítači typu server jsou uložena pouze data, která se při zpracování přesouvají na lokální počítače. Tento Zpllsob zpracování dat je vhodnější pro nasazení na samostatných počítačích. Při provozu v sítí se tento systém projeví zvýšenou síťovou komunikací. Systémy klient-server pracují na principu dataz-odpověď. Aplikace na lokálním počítači zformuluje dotaz a pošle jej databázovému systému běžícímu na serveru (poskytovač služeb). Ten jej zpracuje a zpět pošle výsledky operace. Velmi významným prostředkem pro formulování dotazů a příkazll směrovaných z klienta na server je SQL (Structured Query Language). 3.4 Stručný popis nejznámějších databázových programů 3.4.1 Access Jde o relační databázový produkt od firmy Microsoft. Dnes existuje ve verzi 7.0. Je určen pro operační systémy Windows 3.11, Windows 95, Windows NT 3.51, 4.0. Tohoto produktu lze využít pro vytváření nejrůznějších databázových aplikací - od nejjednodušších až po komplexní systémy. Access umožlluje stejně jako ostatní databázové programy téže kategorie definovat strukturu tabulek, ve kterých jsou uloženy informace, vytvářet uživatelské vstupní formuláře, zadávat, editovat a mazat data, provádět výpočty a prohlížet nebo tisknout výstupní sestavy, obsahující vybrané informace zjedné nebo více tabulek. Uživaté všech stupM pokročilosti mohou pracovat s Accessem ínteraktívně. Pomocí klávesnice a myší je možno manípulovat s objekty na obrazovce, pracovat s příkazovými tlačítky, vybírat položky ze seznamu a volby z rolovacích menu, připojených k hlavnímu menu. Pro zkušenější uživatele a pro použití v stálých ukončených apl ikacích je Access vybaven nástroj i pro práci S makry. Makro lze použít pro automatizaci operaci tak, že zaznamenáme posloupnost prováděných akcí. Tyto akce lze pak později zopakovat spuštěním makra. Spojením makra s formuláři a sestavami lze vytvořit plně automatizovanou aplikaci s uživatelským menu, která mMe být použita pracovníky, kteří o Accessu nic nevědí. Pro velké komplexní aplikace Access je vybaven programovacím jazykem, nazvaným Access Basic. Tento jazyk je velmi příbuzný jazyku Visual Basic. Součástí Access Basicujsou knihovny zahrnující příkazy pro práci S tabulkami, dotazy, formuláři a sestavami Accessu. Access obsahuje rovněž speciální nástroje, které mají rychle a jednoduše pomoci uživatelllm. Jde o pomocníky (Wizards), kteří uživatele vedou při tvorbě datové struktury, formuláře, sestavy a dotazu. Tyto vytvořené objekty je potom možné dále upravoval. Access samozřejmě umožlluje vyměllovat informace s ostatními programy (jiné databázové programy, tabulkové kalkulátory, textové editory a pod.), které pracují rovněž pod Windows. Velmi výhodné je také použití Access při správě dat uložených ve větším databázovém systému typu klient-server. 3.4.2 Foxpro Jde opět o relační databázový produkt od firmy Microsofl. Dnes existuje ve verzi 3.0. Je určen pro operační systémy, Windows 95, Windows NT 3.51,4.0. Microsoft FoxPro je již dlouho rychlým a výkonným nástrojem pro programátory aplikací Xbase. Nejnovější verze rozšiřuje jeho možnosti objektovou orientací. Výrazná zdokonalení této verze v rychlém vývoji aplikací, přizpllsobivosti a přístupu k datům udělala z FoxPro plnoprávného člena rodiny vizuálních nástrojů Microsoftu. Microsoft Visual FoxPro 3.0, jak se nyní produkt jmenuje, v sobě kombinuje vizuální vývojové prostředí s novými nástroji pro tvorbu řešení, která propojují aplikace Microsoft Office a Microsoft BackOffice. Jeho přizpůsobivá architektura umožlluje, aby již dříve vytvořené programy Xbase pracovaly v operačních systémech Windows NT a Windows 95. Uživatel si může zvolit takový operační systém, který mu nejlépe vyhovuje. Ke zdokonalení uživatelských aplikací, napsaných ve Visual FoxPro, je možné nyní používat objekty a ovládací prvky OLE (o co jde, bude vysvětleno později). Pomocí OLE technologie lze ovlá- 20 dat aplikace Microsoft Omce a editovat je přímo na místě z Visual FoxPro. Stovky ovladačll OLE, nabízených dalším i výrobci, tyto možnosti dále rozš i řují. Data lze propojit s Visual FoxPro bez ohledu na to, zda jsou uložena v aplikacích, databázích klient-server nebo na lokálních paměťových médiích. Vestavěné 32-bitové ovladače ODBC 2.0 (o co jde, bude vysvětleno pozděj i) dávají přístup ke všem populárním databázovým serverovým aplikacím. 3.4.3 Visua) dBase Jde O rel ační databázový produkt od fi rmy Borland. Dnes existuje ve verzi 5.5. Je určen pro operační systémy, Windows 95, Windows NT 3.5 1,4.0. Jde o databázové prostřed í velmi podobných vlastností jako "ccess. Opět i zde se mMeme setkat s maximální snahou tvůrců pomoci uživatellnn v návrhu jednotlivých částí aplikace. Program obsah uje tkz. experty, což jsou programové moduly, které v maximální možné rníře vedou uživatele při návrhu. Visual dBase však j e více vývoj ové programátorské prostr·edí. Jazyk, kterým V isual dBase disponuje, vychází ze standardu Xbase, ale kromě toho velmi vyhovuje všem požadavkům na obj ektově orientovaný jazyk. 3.4.4 Oracle Jde o ví'konné, re lační SQL databázové prostředí typu klient/server. Programy tohoto typu byly donedávna doménou velkých sálových počítačů . Ovšem s nárustem výkonnosti systémů PC se začaly používat i na téh le platformě. Výše popsané databázové systémy v nejnověj ších verzích mohou pracovat v režimu klient/server. Ovšem princip práce je jiný. Data se ze servru přenášej í ke klientu kdalšímu zpracovúní. U sk utečného systému klient/server je klient zbaven této zátěže . Posílá pOllze dotazy SQL a server mu po jej ich zpracování zasílá pouze výsledky. Tím je možné zvládnou mnohem složitější úlohy. Velkou výhodou databází, které přicházejí z prostředí velkých sálových počítačů je integrita dat. Dále tyto systémy podporují transakční zpracování dat. To znamená, datové změny jsou zapisovány na disk až po potvrzení příkazem . Když se zhroutí program, operační systém a pod. dá se vše vrátit do původního stavu. Jsou-Ii dvě transakce spojeny, systém neumožní provést pouze j ednu z nich. Dalšími 7-'1bezpečujícím i funkcemi jsou transakční deníky zaznamenávající všechny změny databáze, a zrcad lení, zapisující data na dvě oddělená místa. V relačním databázovém modelu je také velmi d,lIežitá referenční integrita, která hlídá propojení (relace) mezij ednotlivými tabulkami modelu. Nesmí zllstat Lídni sirotci (odkazy nikam). Systém Oracle rovněž podporuje distribuované databáze. To znamemí, že data jsou uložena na rllzných počítačích. Uživatelé pak mohou pracovat s daty bez ohledu na jejich umístění, nebo-Ii vypadá to jako když data jsou na jediném poč ítač i. S touto technologii přichází doba veřejných datových skladll, z kterých uživatel je schopen používat j emu přístupná data, která jsou umístěna kdekoliv ve světě. V současné době existuje systém Oracle na cca 90 platformách od laptopů až po paralelní superpočítače. V současné době je na trhu Oracle Workgroup 2000. Toto seskupen í zahrnuje pět produktli: • Oracle 7.2 Workgroup Server • Personal Oracle 7.2 • Oracle Power Objects • Oracle Objects for OLE • Oracle Radio Agents Workgroup Server je určený pro pracovní skupiny spolupracuj icí hlavně na sítích LAN (ale i WAN). Předností tohoto systému je také velmi intuitivní grafické uživatelské prostřed í. Pomocí myši lze velmi jednoduše nastavovat všechny parametry, nastavovat uživatelská práva, zři zovat konta a provádět ostatní administrativni úkony. Personal Oracle je přizpllsoben pro lokální provoz. Jinak má všechny vlastnosti jako Oracle Workgroup Server. Značnou výhodou jsou poměrně nízké nároky na hardware počítače a kapacitu pmněti . 21 Power Objects je vývojové visuální prostředí, které je určeno pro vývojáře apl ikací. Objects zajišťuje vývojářům aplikací velmi efektivní přístup k datÍlm v databázích Oracle 7. Radio Agents je prostředek pro připojení mobilních aplikací k podnikovým databázím. Umož"uje práci i bez stálého spojení se sítí a připojení je možné provést i běžnými komun i kačními prostředky jako je telefonní linka. Velmi zajimavý je rovněž produkt Oracle Media Server. Tento produkt podporuje práci S multimediálními daty. 3.4.5 SQL server Jde o výkonný databázový server od firmy Microsoft, dnes ve verzi 6.5. Původně byl vyvíjen s ve spolupráci s firmou Sybase pro platformu OS/2, ale časem přešel jeho vývoj zcela do režie Microsoftu. Dnes je výhradně určen pro operačn í systém Windows NT. Díky velké integraci s tímto operačním systémem využívá maximálně možmé míře jeho služeb, funkcí a zabezpečení. Zárove" je s Windows NT přenositelný na všechny platformy, kde Windows NT pracují. Jde o platformy Intel, Alpha, MIPS a PowerPC. Stejně přenositelné jsou i aplikace, takže není nutno pro každou platformu připravovat speciální moduly. Úzká vazba na Windows NT tak zaručuje uživatelům velkou úsporu nákladů, protože celý systém může růst s výkonem použitého serveru - od jednoprocesorových k víceprocesorovým bez nutnosti složitých zásahů. Microsoft SQL 6.5 disponuje všemi vlastnostmi, které přísluší spičkovému serveru. V dalším textu bude provedeno shrnutí a popis důležitých vlastností datových serVerl1: • transakce • replikace • triggers • stored procedures U distribuovaného zpracování, kdy je zpracování rozloženo přes více serverů, musí být kladen velký důraz na zabezpečení správného provádění transakcí. Transakce je proces, při kterém dochází k práci s daty. Data mohou být měněna, rušena, dophlována. Každý takový proces je uzavřený úsek operací, který začne, provádí operace s daty a pak skončí. A právě konec operace je velmi důležitý. Mohou totiž nastat dva konce operace. Za prvé - vše proběhlo dobře a transakci ukončuje "commit"potvrzení o správnosti. Teprve v tomto okamžiku jsou všechny operace, které byly součástí transakce, potvrzeny a nová data jsou platná. Pokud během transakce došlo ke konfliktu (např. výpadek systému a pod.), nastane "rollback" a data zůstanou beze změny, v podobě jako před transakcí. Pro distribuované zpracování disponuje SQL 6.5 prostředkem zvaným "dvoufázový commit". Transakce je zplatněna až tehdy, když jsou zplatněny jednotlivé změny na všech jednotlivých serverech a poté je transakce zplatněna jako celek. Replikace jsou také operace pro podporu distribuovaného zpracování dat. V podstatě se jedná o automatické zasílání změn dat na místa tzv. předplatitelů. Rozdíl je v tom, že úspěšné přijetí nemusí být potvrzeno. Příkladem ml,že být automatická aktualizace např. účetních dokladů z poboček velkého podniku na centrální server a naopak. Triggers (spouštěče) jsou procedury (programy), které jsou po vytvoření spojeny s databází a díky platnosti pro všechny aplikace přistupují ke sledovaným datům a reagují podle toho, co mají· naprogramováno. Čili mohou uživatele varovat, že něco není v pořádku, mohou spustit program a pod. Stored procedures jsou programy, které zabezpečují vlastní výkonnou činnost databázového serveru ( např. provádění výpočtů). 3.5 Základní pravidla pro tvorbu databáze Každý návrh databáze by měl projít následujícími fázemi: 22 • sestaven í struktury datové báze • tvorba forl11 u lářl' • sestavení dotazL' • tvorba sestav • zabezpečen í dat • vytvořen í spojení s jinými programy (např. prezentačními) V další člÍsti textu budou vysvětleny jednotlivé kroky při sestavení databáze. Protože není cílem tohoto textu věnovat se konkrétnímu programovému produktu, vše bude vysvětleno v co nejobecnější rov ině. Ve výkladu budou použity základní SQL příkazy. Před tím je nutno alespoň velmi stručně vysvětl it, co že (o vlastně SQL jazyk j e. SQL (Structured Query Language) vznikl v polovině 70. let jako potřeba standardizovat dotazy tak, aby byla umožněna spolupráce aplikací s různými databázovými systémy. V současné době SQL je standardním prostředkem pro přístup a manipulaci s daty nezávisle na použitém relačním databázovém systému. 3.5.1 Sestavení struktury datové báze Ještě dříve než začneme používat některý z konkrétních databázov)'ch systémů, musíme vytvořit logický návrh databáze, který popisuje objekty, jejich vlastnosti a vztahy mezi nimi. Co budeme považovat za obj ekty, které jejich vlastnosti popíšeme a které vztahy mezi objekty budou do návrhu zahrnuty, záleží na tom, jaké výsledky od zpracování očekáváme. Jinými slovy na dotazech, na které chceme získat od pověď z báze dat. Jak bylo uvedeno již dříve, relační datový model reprezentuje množina dvourozměrných tabulek (viz. obr. 3). Na každou tabulku se odkazujeme j ejím jménem. Každý řádek reprezentuje datovou větu (record) a každý sloupec pak datovou proměnnou. Množina datových proměnných (položek, flelds) pak definuje datovou strukturu tabulky (structure). Při sestavování tabulek musíme přiřadit každé proměnné (dále položce) jméno a datový typ. Uněkterých položek pak j eště určit maxi mální délku, impl icitní hodnotu a formát zobrazení. Jméno položky milže obsahovat běžné alfanumerické znaky. Není vhodné používat znaky typu ,,&, *, ", #, @, (, ),%" a pod.. Na pořadí položek v tabulce v podstatě nezáleží. N icméně je dobré si pořad í položek vtabulce promyslet, protože tato posloupnost položek ve ve struktu ře tabulek slouží jako implicitní pořadí zobrazení. Jméno položky je jedinečné pro danou tabulku. V rllzných tabulkách mohou být sloupce se stejným jménem. Počet položek tabulky j e většinou omezen na 255, počet řádkú je omezen pOllze kapacitou ukládacího media (pevného disku). Mllže být i nulový. Pakje tabulka prázdná. Větš ina databázových programú umožlíuje při sestavování tabulek použít tři režimy: • režim ,.návrh tabulky" (Table Design) v němž ručně přiřazujeme jmena a datové typy • režim "prllvodce tabulkou" v rámci kterého vybíráme zj iž předem výrobcem software nadefinovaných tabulek a podle uvážení mod ifikujeme jména položek a datové typy • použitím SQL příkazů Postup 2. j e vhodný pro méně zkušenné tVllrce, 3. j e nejvíce používán správci velkých dato- v)/chserverů. V dalších řádcích budou popsány alespoll velmi obecně datové typy položek používaných při sestavování tabulek. Při použití konkrétních produkW musíme počítat samozřejmě s odlišnostmi. 23 3.5.1.1 Nejběžnčjší datové typy Text - textové položky mohou obsahovat všechny znaky, které lze zadávat z klávesnice. To znamená čísl ice, písmena, interpunkční znaménka a grafické symboly. Délka textové položky mllže být až 255 znakll, ale zabírá pouze prostor nutný pro uchování vložen)'ch údajl!' Memo - tato položka může obsahovat všechny znaky, které lze zadávat z klávesnice. Délka této položky mllže být až 32000, ale zabírá pouze prostor nutný pro uchování vložených údajů. Nllmber - položka tohot typu mllže obsahovat pouze čislice, desetinnou tečku nebo znaménko minus. Položek typu "Ilumber" múže.být více druhlJ: byte - obsahuje pouze kladné hodnoty typu integer (celá čísla) od 0-255 i/lteger - celá čís l a od -32 768 do 32 767 IO/lg i/lleger - celá č ísla od -2 147 483 678 do 2 147483 647 si/lgle - číslené hodnoty v j ednoduché přesnosti od -3.4* I038 do 3.4* I0,,38 dOl/ble - číselné hodnoty v dvoj ité přesnosti od - 1.797* I0,,308 do 1.797* 10,,308 COl//lter - položka tohoto typu uchovává hodnoty " Iong integer", které j sou automaticky o jedna zvyšovány přidáním nového záznamu. DatelTime - tato položka reprezentuje dny v ka l endáři nebo hodiny. A/lo/Ne - položky tohoto typu obsahují logické hodnoty, které mohou být vyjádřeny jako O/ I, ano/ne, nebo true/false. OLE object - tato položka uchovává data, která nejsou reprezentována znaky. Mohou to být například grafické objekty, zvukové záznamy, fotografie, video sekvence a pod. Databázové prostředky obvykle nabízí dva zpúsoby práce s tímto typem proměnné. První možnost je, když do proměnné vložíme úplnou kopii objektu (fotka, obrázek, schema). Současně objekt mllže (ale také nemusí) existovat mimo databázi. Další možností je možnost definovat spojení mezi OLE objektem a doku· mentem vytvořeným externím programem. V takovém případě do datové položky j e vložena pouze informace, která je potřeba pro nalezení uloženého souboru s daným objektem. Nutno podotknout, že vypsané typy položek reprezentují datové typy databázového programu "Access". Jiné databázové programy použivají ekvivalentní datové typy, i když s jiným označením. Jak j iž bylo dříve uvedeno, lze tabulku vytvořit SQL příkazem. Jeho syntaxe j e uvedena níže. Velké a malé písmena SQL jazyk nerozlišuje. CREATE TABLE «polozka> ( ( VALUES «seznam konstant» ; Jako malý příklad uvedeme vytvoření struktUly následující datové tabulky a naplníme j i dvěma řádky. CREATE TABLE vcelari (jmeno TEXT(20), adresa TEXT(2S), narozen DATE, kraj TEXT( IS), poc_vceIstev INTEGER, litru medu SINGLE); INSERT INTO vcelari 24 VALUE ('Jaroslav Smutný':Veveří 95','27.01.1970': Jihomoravský',5,20); INSERT INTO vcelari VALUE ('Jan Poláček' ,'Grohova 78','25.1 I. I950','Jihočeský',24, 125); 3.5.1.2 Indexy Indexy hrají v každé databázi důležitou roli. Je to v lastně pomocná složka databáze, která uchovává informace jedné nebo několika položek v tabulce. Ty jsou nazývány "indexy, indexové klíče". Indexy I11l.žeme definovat už při vytváření tabulek, nebo později. Indexy slouží k urychlení operací jako j e setřídění a hledání záznaml' podle k l íčových položek. Takže komplexně řečeno, indexové klíče jsou vhodné pro následuj ící účely: • k urychlení procesu zobrazení záznamu v jiném pořadí, než v jakém byly zadány • k urychlení vyhledávání jednotlivých záznaml' podle jednoznačných hodnot v klíčových položkách • k urychlení dotaZl', které vybírají záznamy podle obsahu klíčových položek • k zamezení zadávání záznamů se stejnými indexovými klíči • podporu vazeb mezi tabulkami • k určení implicitního pořadí zobrazování záznam" Většina tabulek by mě la mít minimálně jeden zvláštní klíč, který se nazývá "primární klíč". Tento určlue implicitní pořadí zobrazení při prohlížení záznam" a navíc slouží jako jednoznačný identifikátor. Následující obrázek velmi zjednodušeně ukazuje princip použití indexových klíčl.. V tomto případě jde o vzestupné setřídění podle položky "příjmení". Příjmení Jméno Číslo věty Smutný Jaroslav 2 Adam Jan 5 Kadm'íka Pavel 3 Zvěřina Pavel I Bílek Miroslav 4 V jazyce SQL vypadá příkaz na indexování následovně: ORDER BY SELECT * FROM vcelari ORDER BY litru_medu DESC; DESC - znamená sestupně 3.5.1.3 Relace Příjmení Adam Bílek Kada.lka Smutný Zvěřina Před dalším postupem musí být provedena optimalizace struktur datové báze. Většina proctukW založených na relačním databázovém modelu umož.luje pracovat s mnoha tabulkami současně. Takže lze se vyhnou zbytečnému ukládání stejné informace vícekrát. Zjedné tabulky lze odstranit informace, které obsahuje jiná tabulka. Tento zpl.sob šetří místo na disku a brání nesrovnalostem. Další možnost, jak se vyhnout nadbytečnosti je zlepšit konzistecci dat a snažit se mít hlavní tabulky co nejmenší. 25 V relačním databázových modelech je možné tabulky různým způsobem provázat. Aby se 2 mohly tabulky provázat, musí existovat tzv. propojovací pole, s jehož pomocí mllžeme realizovat nejčastěj i užívané propojení "otcovské tabulky" se "synovskou tabulkou". Přitom Zpllsob vazby v aplikaci lIení statický, neměnný, ale naopak ho mllžeme dynamicky měnit. Tabulka, která byla v jednom re l ačním uspořádání "otcem", klidně milže být v jiném u spořádání ,.)JyneJ11", nebo jiným potomkem. To je také hlavní rozdíl, kterým se relační model liší od dřívějších modelll dat. Nejjednodušší typ vazby je " I:I". To znamená, že pro každý záznam v jedné tabulce existuje jeden záznam v tabulce jiné. S ložitější je vazba"1:n", kde jednomu záznmu v jedné tabulce odpovídá několik záznamII v tabulce jiné. Nejúplnějš ím typem je vazba "n:n" . Pro kterýkoli záznam z jedné tabulky může být několik záznamů v tabulce druhé. Pokud je mezi tabulkami vazba n ku n, je nutné větši nou spoj it je třetí tabulkou, která má vazbu jedna ku n s ostatními d věma. Pro každou dvoj ici příbuzných tabulek musí být spojující položky stejného datového typu a většinou by mě ly mít stejnou délku. U většiny programových produktů není nutné, aby měly stejné jméno, ale je to vhodné z dllvodu přeh lednosti návrhu. V jazyce SQL vypadá příkaz na sestavení relace a dotazu nás ledovně: SELECT FROM WHERE Operace spojení je provedena příkazem "SELECT" tak, že v klauzuli "FROM" uvedeme seznam jmen spojovaných tabulek a v klauzuli "WHERE" uvedeme podmínku spojení. Na závěr této kapitoly se pokusme vytvořit databázový systém, který by našel uplatnění př i evidenci v Pllj čovně aut. Na tomto příkladu je vidět proces normalizace. Normal izace, jak bylo posáno již dříve, nám pomůže k odstranění opakujících se skupin a nadbytečných (redundantních) ínformací. Normalízací se z celkového výběru atributll vytvářejí postupně jednodušší relace. Zároveň je nutné, aby si č itatel uvědom il některá fakta. Například, že někteří zákazníci si mohou pújčit auto vícekrát, nebo, že půjčovna může mít více stanov išť, kde jsou auta zaparkována. po logické analýze problému prvotn í struktura dat Iz kód Ipříjmení Iadresa Ia kód Imodel Is kód Istanoviště po normalizaci zákazník ,z ·k6d ..' 'příjmení pronájem ,z kód Ia .kód 1půjčeno auto , a l(ód ,i 1model ' cena stanov i ště 1S kód Istanoviště , adresa Ivráceno Is kód Obr. 5. Icena IpŮjčeno Ivráceno I Po logické analýze problému jsme tedy dospěli ke čtyřem datovým tabulkám. Přes šedě zvýrazněn á políčka je provedena relační vazba. 26 3.5.1.4 Formuláře Pokud jsme vytvořili datové struktury a jsme si jisti, že jsou správné a úplné, je možné přistoupit k vytváření vstupních fonnulářů. Ve většině databázových aplikacích hrají formuláře rozhodující roli při vkládání a editaci dat. Vstupní formulář navrhujeme většinou tak, že vzhled se podobá papirovým formulářům, které běžně známe. To samozřejmě urychlí vkládání dat, usnadní kontrolu a orientaci. Velkou výhodou je rovněž to, že tam, kde operátor může při vkládání dat udělat chyby možnosti nejednoznačného zadání, zavedeme ve formuláři objekty, pomocí kterých operátor pouze vybírá data z předem připravených grafických objektů. Mezi tyto objekty patří např. seznamy, překryvné seznamy, číselníky, výběrová logická pole, přepínače. Na následujících obrázcích 6, 7 budou ukázány některé typy formulářel. Osobof údaje: . Ad,••a: 4110 Old Aedmond Ad. Měslo: IAedmond. ..i Region: I""A.. .............1 PSt: ""98..0..52",,,~~..:.r Zemi!: lli:y...~A.....~~~- / * FROM [WHERE ] ; Tímto příkazem tedy provedeme selekci a projekci nad uvedenou tabulkou . Je-Ii místo seznamu sloupcl! uvedena hvězdička, má význam výběru všech sloupcl!. Podmínku selekce uvádíme v klauzuli WHERE. Pro zápis podmínky můžeme používat: relační operátory (=, !=, <>, >, >=, <=, BETWEEN, IN, LIKE ) logické operátory ( AND, OR, NOT) množinové operátory ( INTERSECTlON, UNION, MINUS) konstanty ajména sloupců tabulky Operátor "BETWEEN", který testuje příslušnost do intervalu, se používá ve tvaru: BETWEEN < dolní mez intervalu> AND Pro test příslušnosti do množiny se dá použít operátor "IN" : IN «seznam prvků množiny» Množinový operátor "INTERSECTJON" je možné samozřejmě nahradit logickým operátorem " AND" a množinový operátor "UNION" je možné nahradit logickým operátorem "OR". Operátor "MINUS", kter)' označuje množinový rozdíl, se používá k vyhledávání řádek, které mají vlastnost "A" a současně nemají vlastnost "B". Je možno jej nahradit použitím logických operátorů "AND" a "NOT".Proto řada implementací jazyka SQL tyto operátory nemusí používat. Jako příklad uveďme následující dotaz na tabulku občanll, kdy chceme zobrazit jména a data nástupu do zaměstnání občanů, kteří navíc bydlí na Praze 6 (PSČ - 16000). Konstrukce dotazu vypadá následovně: SELECT prijmeni, jmeno, nastup FROMobcane WHERE psc=' 160 00'; Další složitější dotaz by mohl vypadat takto. Zajímají nás pracovníci, kteří nastoupili po Silvestru 1996, mají plat vyšší než 8000,- Kč. Údaje chceme setřídit podle data nástupu vzestupně, při stejném datu nástupu podle platu sestupně. SELECT prijmeni, jmeno, nastup, plat 28 FROM obcane WHERE nastup > {31.12.96} AND plat > 8000 ORDER BY nastup ASC, plat DESC; Tabulku výsledkll je možné zobrazit na obrazovku, vytisknout na tiskárnu, uložit do další tabulky nebo do textového souboru. Potom j e nutné předešlý dotaz doplnit o následuj ící fráze: trvalí'· TO PRINTER - tisk na tiskárně TO CONSOLE - na obrazovku INTO TABLE - do databázového souboru, který mllže být přechodný, nebo TO FILE - do textového souboru Nutno ještě podotknout, že součástí klauzule "SELEC1" mohou být i jiné vestavěné funkce (např. Trim{) .- ořezání všech mezer, Left{) - ořezání všech mezer z leva a pod.). Rovněž je možná kombinace vypočítaného sloupce a konstantního sloupce. Dotaz by mohl vypadat nás ledovně: SELECT typ, cenaJs, počet_ks, cena_ks • počet_ks. cena_ks • počet_ks * 0,22 FROMzbozi WHERE typ= 'vysavač' ; Velm i dúležité jsou také "agregační dotazy" .Iejich princip spočívá v tom, že se zpracovávají hodnoty z celých sloupcr"1 tabulky, jejichž výsledkem je jediná hodnota. Každou chvíli je potřeba zj išťovat sloupcové statistiky, jako jsou součty, prllm ěry nebo výskyty (četnosti). V SQL se agregační dotnzy realizují většinou s pomocí "sloLlpcových funkcí". SQL nabízí následující sloupcové funkce: SUM{jméno sloupce) - součet hodnot ve sloupci AVGUméno sloupce) - aritmetický prllměr hodnot ve sloupci MINUméno sloupce) - minimá lní hodnota ve sloupci MAXUméno sloupce) - maximální hodnota ve sloupc i COUNTUméno sloupce) - počet hodnot ve sloupci 3.5.1.6 Vytyáření podotázek V jazyce SQL mlržeme dotazy řetězit v tom smyslu, že pro formulaci dotazu na vyšší úrovni ITIllŽCme použít ví'sledky dotazu na nižší, podřízené úrovni. Nižší úrovně dosáhneme vnořením příkaZll ..SELECT - FROM - WHERE" do příkazu "SELECT - FROM - WHERE". Podotázky můžeme rozdělit na podotázky dodávaj ící právě jednu hodnotu a na podotázky dodávaj ící n-tici hodnot. Pod le tohoto kritéria mllžeme podotázky dosazovat do formulací otázek vyššího řádu. Z dllvodu vysvětlení uvedeme následuj íci př íklad. Chceme nalézt všechny včelaře, kteří patří do stejné místní organozace jako včelař Novák Jaroslav. Poznáme to podle toho, že maj í stejné jméno předsedy. Mllžeme postupovat ve dvou krocích. Nejprve nalezneme jmeno před sedy včelaře Nováka Jaroslava a potom dalším "SELECT", kam toto jméno zapíšeme. nalezneme všechny včelaře, jejichž před seda se jmenuje stejně. Místo toho však lze zkráceně napsat: SELECT jmeno, adresa FROM vcelari WHERE predseda= (SELECT predseda FROM vcelari WHEREjmeno='Novák,Jaroslav'); 29 V uvedeném příkladu jsme získali jedinou hodnotu, ale obecně mllžeme získat celou množinu hodnot. Da lší zadání by mohlo vypadat následovně. Na lezněte včel aře z kraje Jihomoravského, který r má více včelstev než kterýkol i včelař u kraje Jihočeského. SELECT jmeno, adresa FROM vcelari WHERE medu > ALL (SELECT vcelstev FROM vcelari WHERE kraj='Jihočeský') AND kraj='Jihollloravský' ORDER BY vcelstev DESC; V závěru pasáže "dotazy" si ukážeme na obr. 8 konstrukci dotazu pomocí návrháře. Tabulka: Aodit Zobrazit k;ri!érla: nebo: ~~----~--------~------~--------~--~ Obr. 8. Jde o návrh dotazu pomocí návrháře databázového programu Access. Dle obr. 8 je vidět, že veškeré zadávání parametru dotazu se děje výběrem myší nebo z klávesnice. Prvním krokem při definici nového dotazu je určení zdroje dat, kterým muže být jedna nebo více existujících tabulek nebo dotazu. Ve vícetabulkových dotazech se musí dále nadefinovat vazby mezi tabulkami. Ve spodní části okna dotazu je výstupní mřížka. Do ní se zadává popis dotazu, položek a počítaných hodnot, které chceme v idět, pořadí třídění a výběrová kriteria. Každý sloupec výstupní mřížky představuje jednu datovou jednotku, položku nebo počítanou položku. 3.5.1.7 Sestavy Sestavy slouží ke komplexnímu zobrazení dat podle různých kriterií. Data tištěná v sestavě mohou být odvozena z jedné nebo více tabulek či dotazu. Každá sestava se skládá z odd ílll, které jsou definovány svou pozicí v tiskovém pořádku . Základních oddílů v sestavě bývá sedm. záhlaví sestavy - tištěno pouze na začátku sestavy 30 I ( 1 ( ( \ r záhlaví sto'ánky - t i štěno jednou na začátku každé strany, jde většinou O název sestavy, datUIll. záhlaví sloupcll a pod. •-áhlaví skupiny - tištěno jednou na začátku každé skupiny, obvykle zahrnuje obsah položek nebo výrazll, které definují skupinu detailní oddíl - ti štěno pro každý záznam odpov ídající výběrové množiny, může obsahovat položka, vypočtené hodnoty a vysvět l ující text pata skupiny - ti štěno jednou na konci každé skupiny,obvykle obsahuje součet nebo jiné statistické přehledy pro danou skupinu pata stránky - ti štěna na konci každé stránky, obsahuje větš inou č ís lo stránky, datum a pod. pata sestavy - je ti štěna jednou na konci sestavy, může být použita k tisku shrnuj ícího přehledu, celkových součtll nebo statistických přehledfl Asi nejlepší metoda jak vytvol'it vyhovující sestavu, je pracovat zespodu nahoru. Tedy zač ít detailními oddíly, které obsah ují data odvozená zjednotlivých položek zdrojové tabu lky nebo dotazu. Teprve až j sme spokojeni s velikostí a rozmístěním objektů v detailním oddílu, mllžeme stanovit správnou pozici odpovídaj ících položek v dalších oddílech j ako j sou nadpisy sloupcll v oddílu záhlaví stránky tak, aby odpovídaly SIOUPClllTI pod nimi. Dá le mllžeme um ístit celkové statistiky do do dílu paty skupiny a do odd ílu paty sestavy pod odpovídaj ící sloupce. 3.5.2 Zabezpečení dat Obsahuje-li databáze citlivé informace, které by mohly být před mětem zneužití (personál ní, "četní data), lIeměl by k těmto informacím mít přístup každý, kdo s daným poč ítačem pracuje. Zabezpečení dat je prováděno větš inou na něko lika úrovních. Každý uživatel je vždy přís lušn íkemlll'č ité skupiny uživatell\. Jak celé sk u pině, tak i jednotlivým uživatelúm je možné přiděl it urč ité oprávnění k manipulaci s daty. Každá skupina a každý uživatel je definován urč itou jdenti fikační posloupnosti. Každý uživatelský účet může mít také heslo. V heslech i ve jménech skupin i uživatelil se většinou rozlišují velká a malá písmena. Standardně j sou vždy předdefi novány dva uživatelské účty a to účet administrátorll a běžných uživatelú. Administrátor je zodpovědný za správu celé databáze, tedy i za přidělován í uživatelských účtll a hesel. Na závěr této pasáže je nutno podotknout, že úči nnost zabezpečení dat velmi závisí na netechnických podmínkách. Všechna opatření jsou bezcenná, sdílejí-li uživatelé hesla, což bývá praxe, která Illl1Že zač ít velmi nevinně, musí-Ii napřík l ad zaměstnanec splnit práci někoho, kdo j e nepřítomen nebo zaneprázdněn . 3.5.3 Vytvoření spojení s jinými programy Někdy je potřeba z nej rúzněj š ích dllvodú importovat i exportovat data z námi používaného databázového programu do j iné aplikace. Tou mllže být napřík l ad tabulkový kalkulátor, který je obzvláště vhodný pro složité matematické výpočty, nebo pro rllzné druhy dalších analýz. Dále to mllže být specializovaný statistický program nebo účetní program, č i některý ze skupiny prezentač ních pro- graml'1. V pod statě ex istují dvě základní metody, jak data využít v rllzných jiných aplikačníc h pro- gramech: • export a import dat v nej rllzněj ších formátech • datový most mezi aplikacemi V prvn ím případě (import/export) se vytvoří kopie daného datového souboru. S tou se pak pracuje zcela nezávisle na originálu. Některé programové produkty umožiíují zpřístupnění některých podporovaných typll sou borů. V tomto případě se kopie zdrojového souboru nevytváří. Nutno podotknout, že mechanismus pro import, export a zpřístupnění souborll je pro všechny podporované externí formáty více méně stejné. Přesto je detailní přístup, pro nevyhnutelné rozdíly 31 mezi těmito formáty a díky programllm, které je vytvořily, mírně od lišný. Sdílení dat vyžaduje vždy jisté znalosti o práci externích programll. Pokud je nemáme, mllže se stát výmena dat obtížnou. Druhým způsobem zpřístupnění "cizích datových soubonY' je použití datového mostu. K nejznámějším pam ODBC (Open Databaze Connectivity). ODBC je rozhraní MS-Windows pro připojení se k databázi, definuje API (Aplikation Programming Interface) pro přístup k databázím. Jeho záměrem je soustředit v sobě fu n kční oblasti společné pro mnoho databázových produktll. Rozhraní ODBC je fyzicky realizováno tak, že pod spo l ečnými funkčními nástroji je sada samostatných ovladač" pro přístup ke konkrétním systémlllll. Apl ikace pracuje s databází pomocí ODBC funkcí. které jsou uloženy v dynamické kni hovně (DLL). Tyto funkce jsou určeny pro klienta databáze. Mezi DLL funkcemi a vlastní databází se nachází databázový ovladač, který převádí obecné požadavky na jakoukoli databázi do tvaru pro databázi konkrétní. Podmínkou je mít ovladač dané databáze. Podstatným rysem ODBC je fakt, že s hostitelským systémem lze komunikovat výhradně pomocí funkcí, které jsou v ODBC zabudovány. Omezením ODBC je pouze to, že standardně neřeší navigační přístup k databázím. Mllže být realizován pouze v případě, že ho podporují ODBC-ovladače jednotlivých systémll. Zároveň není uzpůsobeno pro zpracování dotazll z více datových zdroj" zárovel1. Na obr. 9 je zobrazeno více databázových systémů přístupných pomocí jednotného rozhraní ODBC - vylepšení předchozího zpllsobu. Kromě jednotného přístupu k ODBC, které tak zaj i šťuje přístup ke všem systémlllll, které ODBC podporují, nabízí aplikacím již některé připravené fu nkce, které mohou být využity oběma systémy a nemusi být tak v obou samostatně řešeny (např. převod rllzných tvarů dotazll na SQL, síťový provoz hostitelského systému). Nenabízí heterogenní dotazy a standardně nel'eší navigační přístup. menu menu obrazovki obrazovky sesta\')' sestav; I •ODBC překlad přikazů do SQL, . ovladač ovladač SQUCLl1 SQUCLl 2 • + data 1 data 2 Obr. 9. 3.6 Závěr Na závěr pojednáni O databázích by bylo dobré říci, že snahou autora bylo seznámit č itatele s velmi rozsáhlou, ale také zajimavou oblastí softwarového inženýrství. Bohužel omezení počtu stránek, které byly vyčleněny na tuto problematiku, zabránilo možnosti věnovat se některým pasážim dllkladněji. Přesto se domnívám, že i čitatel, který se nikdy nesetkal s problematikou databází, se po přečtení tohoto příspěvku náležitě zorientuje v dané problematice. Samozřejmě, že při práci s konkrétním produktem bude nutné dále rozšiřovat své znalosti. 32 , 4. Metoda základního zpracování archeologických vědeckých dat s pomocí počítačové podpory (Jiří Macháček) (Práce vznikla s podporou grantu reg.č. 404/94/0410 Grantové agentury ČR) 4.1 Úvod Využití poč ítačel při zpracování vědeckých dat je v současné době samozřejmostí. Ani archeologie není v tomto směru výjimkou. Počítačové technologie se již staly trvalou součástí metodologické výbavy archeologa. Jako každá metoda se však i použití počítačll musí řídit určitými pravidly. V následujících kapitolách si ukážeme, jak postupovat při základním zpracování archeologických dat za pomoci databázových a tabulkových programll. Předkládám metodu komplexní, ne však tak složitou, aby ji nemohl zvládnout průměrně obeznámený uživatel běžně dostupných a rozšířených kancelářských so ftwarů. Metoda nebazíruje na znalosti speciálních matematických či statistických postUpll, vyžaduje však částečné obeznámení s databázovými a tabulkovými programy a některými j ednoduchými statistickými metodami. Základní zpracován í archeologických dat s počítačovou podporou lze rozčlenit do následujících krokll. I) Definování problému 2) Výběr dat a tvorba struktury databáze 3) Testování relevantnosti dat 5) Plnění databáze 6) Databázové dotazy 7) Vizualizace dat 8) Testování výsledkll 9) Interpretace Pro získání důvěryhod ného výsledku je nutno při práci projít všemi navrženými kroky. Jednotlivé kroky se pokusím rozvést a v maximální míře přiblížit za pomoci příkladll z praxe. 4.2 Definování problému První bod metody hraje v celém sledu výše vyjmenovaných kroků nejdllležitěj ší roli, neboť dává našemu snažení náplň a smysl. Měla by mu proto být věnována zv láště zvýšená pozornost. Definování otázky, na kterou se budeme snažit odpovědět, souvisí ve velké míře s filozofickometodologickou výbavou a postoji badatele. Není účelem této statě rozebírat teoretické problémy vědy, dovolil bych si však krátce upozornit na některé skutečnosti. Již samo využití počítačll predikuje náš pohled na svět a vnáší novou dynamiku do vývoje teoretické základny archeologie. Hromadné používání počitačll umoclluje proces nastartovaný v 60. letech v anglosaském světě, kdy zde ve střetu o základní teoretické otázky zvítězilo pojetí Nová archeologie nad tradicionalistickým pi·ístupem. Jedna ze změn spočívá právě ve formulaci otázky. Tázací zájmena CO či JAK jsou zde nahrazována slovem PROČ. Odpověď na otázku, tážicí se po smyslu jevil, je mnohem s ložitěj š í a před pokládá komplexní přístup k řešení problému, což právě výpočetní technika velice usnadlluje. Přeneseno do praktické rovi ny lze říci , že záměrem moderni archeologie již není ptát se např. na to, j aký artefakt se vyskytoval na urč itém sídlišti v určité době, ale PROČ se tam vyskytoval. Formulace otázky je velice důležitá pro další postup práce, neboť otázka před určuje odpověď. Špatně položená otázka I11llže "zhatit" výsledek dlouhé a úmorné práce již v začátku . Lze proto jen 33 doporučit, aby před započetím rozsáhlejšího projektu bylo definování problému diskutováno v širším kolektivu, v případě studentských prací se zkušeným pedagogem. 4.2.1 Příklad 1 JEDNOTLIVÉ KROKY NAVRHOVANÉ METODIKY BUDOU DOKUMENTOVÁNY NA PŘÍKLADU PRÁCE J MACHÁČKA: PODUNAJSKÝ TYP ANEB KERAMIKA STŘEDODUNAJSKÉ KULTURNÍ TRADICE, BRNO 1994. V pn/běhu 6.- 8. stol. dochází ve stl'ední Evropě k hlubokým zásohzlm do společenských struktur a k radikálnípřeměně materiální kultury. Tento proces se odráží i v archeologických nálezech. Kromě výrazných složek invenlál'eÍakým jsou např. zbraně či šperky, mzižeme změny zaregistrovat i u nenápadnější, o to všakpočetnější skupiny nálezzi - keramiky. K zásadnímu zlomu ve vývoji keramiky dochází s nástupem charakteristického zdobení a obláčení. Je to kombinace vlastností, která se stala pro slovanskou keramiku typickou a lze ji sledovat až do vrcholného sll'edověku. Na území ohraničeném na západě horním Mohanem a stledním Labem, na severu povodím horní Odly a horní Vislou, na východě obloukem Karpat a najihu karpatskou kotlínouje lalo keramika vprziběhu 7. a 8.sI01. slylově poměrnějednotná. .Jedna ze zásadních otázek důležitých pro pochopení celého mechanismu vývoje slovanské keramiky souvisí s tím, zdaje zdobená a obtáčená keramika na celém výše zmíněném lÍzemí opravdu homogenní či heterogenní a PROČ lomu tak bylo. 4.3 Výběr dat a tvorba struktury databáze Data a metody, které vybereme pro zpracování našeho úkolu, úzce souvisejí s otázkou, kterou řešíme. V této stati se zaměříme na problémy, které umožllují využití databází a tabulkových procesorů. Jedná se především o hromadné jevy, čítající řádově stovky až tisíce případ ll. Před započetím vlastní práce je nutno vyřešit, jaké informace může a má databáze poskytovat. Abychom mohli takové rozhodnutí učinit je nutné nejdříve vytvořit předběžný model studovaného problému (Neustupný 1986, 532), který bude vycházet z našich předchozích zkušeností a znalostí. Z něho pak odvodíme data důležitá pro řešení našeho úkolu. Jako příklad nám může posloužit např. studium sociální struktury starobronzové společnosti. Na základě našich dosavadních znalostí je zřejmé, že relevantní informace diiležité pro řešení našeho problému lze získat z pohřebišť. Víme např., že hrobové jámy význačných jedinců s bohatou výbavou zde byly hlubší a širší. Na základě tohoto tvrzení zahrneme do naší databáze informace o rozměrech hrobů. Z modelu dále např. vyplývá, že velký význam z hlediska identifikace společenského postavení pohřbených jedinců sehrával počet a typ určitých milodarů např. dýček, šperkl', nárameníků, honosnějších zbraní, možná i kamenný zával, některá antropologická zjištění atd. atd. Všechny tyto informace by bylo dobré v databázi zachytit. Je nutno si však uvědomit, že každý jev či předmět má obrovské množství vlastností - znaků, které lze zaznamenat. Naším zájmem ale není generování velkého objemu data, nýbrž získání relevantních informací, jejichž rozbor povede k efektivnímu řešení. Musíme srovnávat časovou náročnost, kteráje ovlivněna kvantitou dat, jež budeme o jednotlivých jevech či předmětech ukládat, se snahou o získání co nejúplněj ší informace, vedoucí ke komplexnímu pojetí problému. S ohledem na obě hlediska, tedy čas a úplnost informací (informace, které zaznamenáme, nebudou nikdy úplné!) je nutno před započetím práce zvolit kompromisní - efektivní - řešení. Pokud jsme si dobře ujasníli údaje, se kterými budeme pracovat, je namístě navrhnout databázi, do které je budeme ukládat. Dle složitosti dat je nutno rozhodnout, zda použijeme více tabulek (dle terminologie programů MS Access či Paradox), navzájem propojených relačními spojeními, či tabulku jednu. Práci s více tabulkami lze doporučit všude tam, kde vaše data tvoří více logických celků, 34 11; ta kl .I' ta ta n: fr Zl sl v, gl tc I") d, a m h, p' (, (I a 1', o: al al v' 'l] 4 /1í zi R VI p. a. Zl P m ke d např. keramika z hrobll (jedna tabulka), rozměry hrobů (druhá tabulka), antropologické údaje (třetí tabulka) (relačně propojeno číslem hrobu). Takový přístup je zv láště vhodný pro týmovou práci, při které plllí jednotliví členové skupiny r"zně tabulky, které jsou při finálním vyhodnocení spojeny do jednoho databázového systému, ve kterém lze vo lně kombinovat data z rllzných relačně propojených tabulek. 1'0 stanovení potřebného počtu tabu lek je nutno vytvořit jej ich vnitřní strukturu. Databázová tabulka je složena z řádk" a sloupcll. Řádky tvoří jednotlivé záznamy (records) (Jedním záznamem může být např. jeden hrob, jedna nádoba, jedno hradi ště). Sloupce (pole-fields) jsou kategoríemi informací. To jsou vlastností (znaky) jevll či předmět", které jste se po předchozí úvaze rozhodli zaznamenávat (např. hloubka, š ířka, tvar hrobu; barva~ výzdoba, výška núdoby; plocha, datace, nadmořská výška hradiska). V polích je nutno rozložit informace na co nejmenší logické části , což později využijeme při vytváření dotazll a hledání souvztažností mezi nimi (např. pro jméno a příjmení v databázové tabulce zaměstnanCll vytvořte dvě rllzná pole). Rozdělená data lze v databázi rllzně kombinovat, spojená data však lze jen těžce oddělit. Nikdy nevkládejte clo tabulek vypočítávaná data, např. délko/š ířkové indexy. Počítačové programy nabízejí nástroje, které to udělají za vás a bez chyb. NezapomeMe umístit do tabulky údaj, který jednoznačně identifikuje záznam (tzv. identifikátor) (např. číslo hrobu, inv. číslo nálezu). V jedné tabulce se nesmí vysk)1nout dva stejné identifikátory. Identifikátor mllže zárovel1 sloužit jako index (viz výše: Smutný, J.: Databázové systémy). V databázi není možné zapsat jednu vlastnost (znak) rllznými slovy č i symboly. Kdyby k tomu došlo, zpllsobi lo by to velké komplikace při vyhledávání a filtrování databáze. Pro plnohodnotnou a kvalitní práci s archeologickou databází je proto nutno použít při deskripci vlastností (znaků) předmětll č i jevll určitý jednotný systém, v archeologii obecně nazývaný kód. Jeho potřeba souvisí se snahou o objektivizaci a formalizaci informací, které zaznamenáváme. Kódy mohu být, v závislosti na počtu a charakteru znakl', které sledujeme, jednoduché, obsahující pouze několik termínl" či složité (např. Podborský, Kazdová, Koštuřík, Weber 1977 ~ Numerický kód moravské malované keramiky) (viz níže: Koštuřík P., Macháček J.: Komentář ke "Kódu moravské domácí eneolitické keramiky" a Salač V.: K využití seriace při datování sídlištní keramiky). Sledované znaky dělíme na kvantitativní a kva litativní. Hodnoty znaků kvantitativních zjišťujeme měřením. Znaky kvalitativní vyjadřují kvalitu (barva, tvar, poh laví atd.). V kódu musí být ošetřeny jak znaky kvantitativní (přesné určení rozměrú, které měříme; jednotky, ve kterých měl"íme atd.), tak i kvalitativní (přesná terminologie jednotlivých vlastností ~ výzdobné prvky, tvar nádob ald.). Dobře vytvořený kód snižuje ztrátu hodnoty dat, Zpllsobenou subjektivním pr-ístupem jednotlivých pracovníkll. Jestl iže jsme s "spěchem prošli touto přípravnou fází zpracování archeologických dat, mllžeme zač ít se sběrem dat, nejd říve pro testovací sérii . 4J.IPříklad 2 V:h1edelll k velkému množslví maleriálu a oblížnosli celé problematiky. související s přeměnou keramiky lepené v ruce v keramiku obTáčenou a zdobenou ajejím dalším regionálním roznizněl1ím. je ne:by/né zvolil lakovou melodu a výběr malel'iálu. klelÝ by umožnil efeklivně dojít k ul'či/)ím závěrtim. Rozhodljsem se pl'ojednoduch)' rozbor. ve klerém budeme sledoval pJ'edevším 11'01' nádob. jeho závislosl na proslOrll, čase a funkci. Jako [lI'O/llenl10ll základnu jsem zvolil nejlépe a nejkomplexněji prohádal1á polu'ebi.5/ě ze Slovenska doplněná l1éklerými lokalitami z Jr/oravy a Rakouska. Ve své mlO~vze se omeZl~ji 110 keramiku z hrobl;, ze které lze (v porovnání s keramikou z objeklzi na sídlištích) získat kompletnější informaci O tvarll nádob. Pokusil jsém se pracoval s maximálnfm množstvím nálezzi, proto jsem využíval lehce dostupné informace z lileralllr)!. Naslíněl1.Ji pOSIl/p v.'ok měl velkou nev)i/70du v IOIn, že ve věl.vině prací byly vypublikovú1IY pOl/ze nejzákladnějJí metrické údaje Oj. \~Ýška, pn/měr ústí, pn/měl' dna, llěkdy i pn/měr výdUfě), které ul110žiíují pouze ve/mi hruboII tvarovou charakteristiku. 35 I tak však máme k dispozici hodnoty, které klasik bádání o staroslovanské keramice J. Eisner považoval za důležité pro popis tvaru hradištních nádob. Jeho definici lze považovat za jistý druh pledběžného mode/u, ve kleré na základě svých zkušenosti uvádí, jaké informace jsou pro studium keramiky významné: " Mělíme výšku nádoby a srovnáváme ji s její největšÍ ,f:Í1';kou i s ,šÍ!';kou jejího ústi a dlla. .Isou hrnce široké i štíhlé. Mluvíme (] hrncích S vejčitým, baiíatě vejčit)ím až soudkoviOím bNchem, (] hrncích šá/kovitých (okNnovitých) a /Jlísovitých, mají-Ii široké ústí a nevalnou výšku, o hrncich lahvovitých,jsouli v hrdle značně zúženy, a štíhlých hrncích pohárovitých neboli kalichovi/)íCh, mají-li úzké dno a ústí do široka rozevlené. U soudkovitého hrnceje rozdí/mezi šířkou hrdla a dna nevalný...... Malé rozdíly v tvaru nem2/sily vzniknout Úmyslně..... Ovšem v některých končinách I11ziže určitÝ tvar pPevládnoul... " (EISNER 1966,155) Na základě těchto úvah byla pro každou z lokali/ vytvot'ena speciálni /abulka, obsahující následující pole: - název lokality -č. hrobu -/yp hrobu (kostrový, žárový) -identifikátor nádoby -/echnologie výroby (pouze v ruce, obtáčená) -výzdoba (ano, ne) -typ nádoby (pražský typ, podunajský typ, potiský typ - uváděno pouze nčktelJími autory) -vý,~ka nádoby -pn/měr ústí nádoby -pn/měr dna nádoby -pn/měr maximální výdutě (u některých lokalit chybí) 4.4 Testování relevantnosti dat V předcházející kapitole byla zmíněna snaha o maximální efektivitu při sběru dat. Jednou ze základních podmínek tohoto přístupu je výběr vhodných informací, umož'luj ícíeh odpovědět na položenou otázku. Jsou však jevy či předměty a jejich znaky/vlastnosti, které jsme se na základě našeho předběžného modelu rozhodli sledovat, pro řešení studované problematiky opravdu relevantní? Odpověď na tuto otázku je velice důležitá, protože naše práce je ve fázi těsně předcházející vlastnímu plnění databáze - tj. časově, příp. i finančně nejnáročnější část celého zpracování dat. Máme poslední možnost modifikovat databázovou strukturu. Její změny v prl.běhu plnění databáze jsou totiž nesmírně náročné, leckdy prakticky nemožné. Abychom co nejvíce minimalizovali riziko špatného výběru, je nejdříve nutné zpracovat tzv. pilotní projekt. V tomto projektu budeme na vzorku dat testovat, zda vlastnosti, které hodláme sledovat a zaznamenávat, mohou dát odpověď na naše otázky a zda opravdu poskytují žádané informace. Nejlepším postupem je vybrat menší uzavřený soubor dat, který přednostně zpracujeme v dalších navržených krocích, počínaje plněním databáze, přes databázové dotazy, vizualizaci dat k pokusu o stanovení hypotézy. Je vhodné vybrat taková data, která byla již dříve zpracována pomocí jiné metody a obě zjištění srovnat. Pokud budou výsledky pilotního projektu uspokojivé, tzn. takové, které ukáží, že typ dat zahrnutých do našeho výběru ml.že poskytnout dostatečné podklady pro interpretaci, můžeme přistoupit k vlastnímu plnění databáze. V této fázi je vhodné testovat i kvalitu vstupních dat (hlavně z hlediskajejich statistické věrohodnosti), a to především v případě, že je přebíráme z méně věrohodných zdrojI' (starší výzkumy, katalogy atd.) . 36 4 ( s c J A k J /I L z, r o s. II II ,':., 2 s o S tl 4 v p x Š P k n n n a p Z n d Ž v 4.4.1 Příklad 3 olom, že vla.')'lnosli keramiky, které budeme v 11a.r-í práci sledovat, mají vypovídací hodno/u. nás pFesvědčí srovnání v)Jsledku analýzy mel1~~ího souboru získaného pomocí naší metodiky s tradičním archeologickým zprocovól1Í11I. .leden z mála těch. kteN se pokl/sili o hluMí rozbor keramiky ze slovclIIsko-avarského pohřebWě. byl A. TaNk (1963). Cástmateriálu z polu'ebWě v Pr.'i rozdělil na základě tvarových podobností do Člyl' kera/llick.ých skllpin (1-4). Použijeme-Ii na.ve dala a p,':edev,Hmlvarové indexy div a u/v (vjz nfže v kap. Databázové dotazy),' zjistí/lle. že Točíkova seskl/pení nádob (1-3) l1achází sVlij odraz i v I/G.'em v)jádření. Na rozdíl od prvních lI'ech skupin však nejsme schop"i ide/ltifikovat skupi/lu 4 (.Ik. 4 je z hlediska námi sledovaných znakli helerogellní), pro kterou jsou pravděpodobně charakteristické jiné zlIaky než ly. které IJlzižellle na.šÍ /IIetodoll postihl1ol/tl1apl'. /lesledovall)' i/ldex ulvyd či dlu (viz lIíže v kap. Databázové dotazy). DaW/II pNkladem. pN jehož I'ešení byly použity tradiční archeologické metody, a na ktelý mz;žeme zárovelí aplikovatna!ie postllpy. je třídě/lí keramiky z pohřebi.í:tě v Devínské Nové Vsi. Vklasické práci vydělil 1. Eisner (1952) tN hlavní skupiny keramiky - podunajský, potiský a pražský typ. Jedllotlivé skupiny se neodJiliovaly pouze technologií, materiálem. v.l'zdobou, ale i tvarem. 1'0sledni charakteristikaje obsažena i v našich datech. Na základě zpracování těchto dat pomocí počítačových technologií (hl. index dll' a ulv) se ukázalo, že tvol'oFé I'ozdíly mezi podunajským, pOliským a pražsk:(lfll typem z Devíllské Nové Vsi lze poměrně dobře vyjádNI i pomoci noJich dal a ověl-i! statistickým les/ováním. Z oball pilotních projektzi je zl'ejmé, že v.lisledky intuitivní práce erudovaných odborníkzl S malými sOl/bory z větší části odpovídají výsledkzim. které jSll1e schopni získat z na.í:ich dat. Zásadní rozdíl mezi oběma postupy spočívá ve skulečnosti. že zatímco lI'adičními melodami lze zpracovat maximálně desítky kusli, mi,žeme pomocí pačÍ/ačli pracoval s tisíci a posunout tak 11a.~e poznání na novou kvalitativní úrove!'i. 4.5 Plnění databáze Sběr dat je časově nejnáročněj ší část zpracování archeologických informací pomocí databázových programil. Abychom zbytečně neplýtvali svými silami či svěřenými hodnotami. lze k této fázi přistoupit teprve po uspokojivém absolvování předcházejících krokll. Než začneme s vlastním sběrem dat, je nutno vytvořit takové pracovní prostředky, které maximálně zefektivní a usnadn í naši práci. Tento postup je nutný předevš ím tehdy, pracujeme-Ii ve větším týmu lidí, z nichž někteří jsou zaangažováni pouze pro sběr dal. Vhodnou pomllckou j sou formuláře, a to ať již papírové či počítačové. Papírové formuláře použijeme všude tam, kde není z rozličných důvodů možné vkládat data přímo do počítače (nedostatečný počet počítačů, nekvalifikovaný personál. špatné klimatické podminky atd.). Jejich v)'hoda spočívá v tom, že je lze použít prakticky kdykoliv a kdekoliv, nevýhodný je narilst práce spojené s převodem dat z papírového formuláře do počítače. Pokud lze při sběru vkládat data přímo do počítače, je dobré použít databázové formuláře. Ty nabízejí jednoduchý ZP'lsob zobrazení dat, a podobně jako papírový formulář určuj í data, která chceme shromažďoval. " Izolují" uživatele od základní databázové tabulky, která je poměrně nepřehledná a pro vyphlování neefektivní. Formuláře tak šetří čas a brání vzniku chyb v textu . Při jejich tvorbě lze použít rilzné instruktivní popisky, grafické efekty aj. Formuláře nabízejí nejvhodnější rozvržen í pro zadávání, změny a zobrazení záznamII v databázi. V jednom formuláři lze spojit více tabulek dohromady, a tak zefektivn it jejich vyphl ován í. Data milžeme vkládat pomocí seznamu, na kterém j sou uvedeny položky, které lze do patřičného pole vložit. Tato fun kce zabraňuje chybnému vyplnění či použití termínů, které se nevyskytují v našem deskripčním systému, což je z hlediska kvality databáze velice dilležité. 37 V procesu sběru dat je nutná vzájemná kontrola, sloužící k včasné identifikaci chyb rllzného v typu a rozsahu (nebezpečné jsou zv láště chyby systémové). Mějte na paměti, že svou prací vytváříte Zl dllležité informace, jejichž hodnotaje přímo závislá na jejich kvalitě. (/ V závěru této fáze by mě lo dojít k "pročištěn í" databází, tzn. vyhledání a odmazání duplicit- h ních záznamll, odstraňování překlepLI atd. n 4.5.1 Příklad 4 Pro vlastní anal)'ZlI keramiky 7. -8. stol. byla sestavena databáze z více /lež 2000 nádob pocházejících z II lokalit. 4.6 Databázové dotazy Jedním z hlavních dllvodú použití databází při zpracování archeologických dat je schopnost těchto počítačových programII rychle a efektivně řadit, třídit, kombinovat, vyhledávat a sumarizovat naše informace. V databázových dotazech lze za pomoci relací spojovat i data z více databázových tabulek. Moderní databázové systémy umožIlují provádět výpočty (délko/šířkové indexy, procentuální zastoupení aj.) a vytvářet nová pole, která obsahují výsledky těchto výpočlú. Při velkém počtu záznamů (řádově tisíce) je to prakticky jediný způsob jak zpracovat velký objem dat. Pomocí databázových výběrových dotazú a relačního propojení více tabulek zjistíme během několika sekund např. nejen, který z velkomoravských hrobll na Moravě je nejhlubší (pokud ovšem máme tyto in formace v databázi), ale i jaké předměty se v něm vyskytly. Jestliže jsem dostali in formaci, že zemřelý z tohoto hrobu měl při sobě meč, téměř okamžitě po modifikaci naší otázky zjistíme rozměry všech hrobů na Moravě, v nichž se vyskytla tato zbral'. Hned nato se dozvíme, v kolika případech byl meč v kombinaci s keramikou, jaký měla tato keramika ornament, jak často je tento ornament na nádobě se zaobleným okrajem, ve kterých sídlištních objektech se vyskytují zaoblené okraje či zda se tyto objekty objevují v superpozici s jinými objekty atd. atd. atd. Kromě výběrových dotazll se nabízejí i další databázové technologie. Pro hromadné zpracování dat jsou důležité především tzv. křížové dotazy (dle terminologie MS Access) neboli kontingenční tabulky (dle term inologie programu MS Excel). Pomocí těchto výkonných nástrojú získáme shrnutí značného objemu dat v kompaktní, dobře č itelné a srozumitelné formě. Takto zpracovaná data umožňují snadné sledování jejich tendence k seskupování, ev. k vytváření urči tých trendII a závislostí, tzn. umožllují identifikaci projevll archeologických struktur. Jako příklad bychom mohli uvést výstup z databázové tabulky fragmentll keramiky Geden fragment = jeden záznam) s informacemi např. o výzdobě či tvaru keramiky a objektech, z nichž pocházej í. Pomocí křížového dotazu téměř okamžitě zj istíme např. počty všech možných kombinací mezi typy okrajů a typy výzdoby v našem souboru č i zastoupení jednotlivých keramických typll v objektech. V křížových dotazech programu MS Access lze kombinovat až čtyři znaky, v případě přípravy dat ve výběrovém dotazu i více. Jedná se nejspíše o jedinou technologii mimo oblast složitých statistických a matematických algoritmů, jež nabízí tak rozsáhlé možnosti kombinace a sumarizace velkoobjemových dat. výstupy Z křížových dotazů, ev. kontingenčních tabulek jsou ideálním východiskem k vizualizaci dat pomocí grafů (viz níže) i k tvorbě deskriptivních matic, které jsou východiskem pro další statisticko-matematické zpracování (viz níže: Neustupný E.: Syntéza struktur formalizovanými metodami -vektorová syntéza, Sa l ač V.: K využití seriace při datování sídlištní keramiky). Možnosti vytváření databázových dotazll jsou obrovské. Závisí především na množství našich dat a struktuře databáze, která musí umožnit maximum kombinací mezi rllznými daty. 4.6.1 Příklad 5 I" L (I I~ T L 4 k n s' n k Zl o P J' o II V v P R ~ n h h ť 4 l. V pnlběhu databázového zpracování keramiky z hrobll 7.-8. stol. bylo vytvot'eno několik dotaZlI, ve k ktelých byla keramika tNděna podle svých vlastnostíjak v rámci j edné tabulky (nap". nádoby lepené r 38 ,'rl/ce. ob/lÍčené, zdobené či lIezdobené). lak v rámci více /"bulek. V do/azeeh byly /o/iž spojovány záznamy splliující urči/Oll podlllíllku (oCIf1/'. zdobená keramik" ze žárových hrobz1) z několika tabulek (loka!;!) do tabulky jedné. TokIo JIOFe vy/volené svubOl:Y daL lImožnily srovnání keramiky z rfíznýcll hledisek, ted" nejeli lI1ezi jedno/livÝll1i lokali/allli, ale i regiony (,kupinallli lokalit), pNp. mezi ve.'ke/'011 keramikou uratých vlastností vzhledem ke kel'amicejin)ích vlas/noslí bez ohledu na lokalitu, z 11íž pocházel". U všech nádob byl II dotazech ou/oma/ieky l~)'počílál1 tvar0v.Ý index (d/v): dno dělené vJíškou a index (u/v): ústí dělené v)í,~k()lI. Pomocí nich pak ~iedl1odll.511jeme lvar !ládoby do lichoběžníku o jednotné l:Mce = .I. jehož rovlloběžné zúkladny IvoN ústí CI dno. Tam. kde /0 b)'lo lIIožné, byl "yp06/án i index (u/vyd) (us/í děleno výdll/í), k/el} zjednoduSeně ('''arak/erizllje u/vál'ení horní čás/i nádoby, a index (d/II) vyjadhljícípOlllěr lIIezi dnelll a lÍstílll. Do/abáze lak byla doplněna o následující pole: - i/u/ex div - illdex u/v - index u/vyd - illdex d/u 4.7 Vizualizace dat Obrovské množství výsledků, které lze získat pomocí databázových dotazů, není pouze velkým přínosem databázových programl', ale i u rči t)'m problémem. Pokud nebudeme pracovat S vícerozměrovými statistickými technologiemi jako např. clusterové či faktorové analýzy (viz niže: Neustupný E.: Syntéza struktur formalizovanými metodami - vektorová syntéza), které dokáží vyhodnotit mnoho znakl' najednou, stojíme před problémem, jak se v získaných výsledcích orientovat. Prostředkem, který poskytne rychlou a názornou informaci o povaze zkoumaného jevu je graf. Graf je zobrazením vzájemných vztahl' dvou nebo více proměnných veličin pomocí symbolll. Usnad'luje vyhodnocování dat a porovnání rl.zných hodnot z databáze. Používáme několik typl' grafll. ledním ze základních gram j e sloupcový graf, který umožrluje pOl'Ovnání jednotlivých záznam,. (např. počet střepů v jednotlivých objektech), dále graf výsečový, jenž zobrazuje poměr j ednotlivých částí k celku (např. poměr jednotlivých typů okrajli v sídlištním o~iektu) a předevšim XY (bodový) graf. Ten zobrazuje vztah nebo stupe'l vztahu mezi několika hodnotami. Výsledek j e vykreslen jako body dané i'adou souřadnic XY. Tímto grafem je možno především vyjádi'it tendenci dal ke shlukování, příp. sledovat vývoj a změnu dat v nestejnoměrných časových intervalech. XY (bodové) grafy jsou nejčastěji používány pro vědecké účely. Vytvá ření gram umož"ují i některé databázové programy. Obecně je však vhodněj ší použít pl'O tvorbu grafů specializované softwary zvané tabulkové kalkulátory (např. Execel, Lotus 123). Tyto programy nabízejí kromě graflr i silné nástroje k analýzování dat pomocí vzorcl', umístěných v buňkácll. Bu"ka, která je tvořena prl. sečíkem řádku a sloupce, má jednoznačnou adresu (napi·. B4 - písmenemjsou označovány sloupce a čís lem řádky v tabulce), a lze tak na ni odkazovat. V tabulkových kalkulátorech ml.žeme provádět rychle a poměrně jednoduše výpočty z velkého množství dat. Programy nabízejí nejen matematické, ale i základní statistické funkce, např. tvorba histograml', výpočet průměr" , mediánů, směrodatných odchylek, regresí atd (viz níže: Weber Z.: Statistická ana lýza archeologických dat). 4,7.1 Příklad 6 IIIdexy div a 1// 1' byly vypoN/ány II všech nádob. Použijeme-Ii ty/o indexy do XY (bodového) gl'ajil. kde ilO ,'odorov"é ose leží index d/va /10 svislé ose i/ldex u/v, zjednodu.Šlljeme Ivar nódoby do lichoběž/l;kll ojednotné vJíšee = I, jehož rovnoběžné základny tvoN ústí a dno, a 1I11ižeme tak zidealizova/lé tvarl' nádob porovnúva/ mezi sebou bez ohledu najejich absolu/ní I'ozměly (graf I). 39 Použitím indexu u/vyd a jeho kombinací s indexem d/u v XY (bodovém) p'ajil získáme další zajíl/lOv)í pohled na ce~ý soubor keramiky, v němžjsou vhodně kombinovány Ili hodnoty - ústí, maximální lJ'dllť CI dno. Vy/voFil jsem sérii grafů, kde I1lližeme dobl":e sledoval poměly mezi tvaroll)ím ~\peklrem nádob z n ;zn)ích pohFebiS'l~ z nichž některé zde budu prezentoval. Pro věl,ií názol'l1os1 o pl'esllosl jsem použil i grafického vyjádPení rozdělení relalivllí ('eIIlOsli dal zjednoIIÍl~)íe" pol/l'ebiH Podle rozdělení čelnosti lze loliž posoudil, jak se základní dala z hlediska své velikosli rozpadají nojednotlivé čelnosli, ledy počty pNpadll phpadající pNslušným inlervahllll o stejné velikosti, které jsou de./inovál1Y zvlá,5tním stalislick)JI11 postupem, vycházejícím z variaó,íflO rozpělí souburu. Rozdělení čelllosli bylo oUlomatieky vypočíláno v labulkovém kalkulátoru MS Exee/. Na vodorovné ose jsoll vždy l:)mesel1y hodnoty tvarového indexu (pri léto metodě mi,žeme sledovat vždy jeli jeden index 1), rozdělellé du slejllě velk)íe" inlervahl, a na ose svislé "odlloly relolivní čel- 1I0sli, kleré lěmlo kOlegoriílll odpovídají. Relalivní <'clnost se vypočílájako J!oll1érjednollivJ'c" absolutnich čelnoslí k rozsahu souboru. Křivka pak spojuje lakto vynesené body. Vzniklý spojnicový graf naz}'vállle polygollell1 (graf2). Podobně jako pN lJ/'edchozí anal)íze jsem vytvořil sérii grafi!, ve klelJích lze srovnávat polygolly jednolliv)ích lokalil a vylvořil si laklJl'edHavu ojejich vzájell1ném vztahu. V Idkov)ích grafech i polygonech relolivní četllosli se zletelně ,ýsují Iři okruhy keramick)ích lral'll. V oblasti nizk)íeh hodnot se koncenlruje keralllika ze žárových pohřebišt; ve sl1'ední oblasli keralllika z kosl1'ov)íCh hro/ni jihozápadního Slovenska a vysoké indexy se objevují II nádob z hornorakol.lskéllO GusellZl. Rozdíly zaznamenáváme i mezi pohPebWi z jihozápadního Slovenska. kde se vyděl!Ui dvě skupiny: Devínska Nová Ves s Záhorskou Bystricí a Štúrovo s I-Iolíarema a Novými Zámk)'. Zdobená a obtáčená keramika - Graf (d/v)/(u/v) 1,2 1.1 • •• • •• "<> • • ••0,9 • • • •ft • •ulv • • o!. • • • •0,8 • •• • ••• rl' • • • •0,7 • • •• , ...~ ••• • .'0,6 • 0,5 0,3 0,35 0,4 0,45 0,5 0,55 0,6 0,65 0,7 0,75 0,8 dIv • Čakajovce 6Gusen • Pohansko Graf I. Zdobená II obtáčená keramika - graf(D/V)/(U/v). 40 4. 11 í, se no T} to tel na dv lo~ St; Je, ch sp dv ve ce če Zdobená a obtáčená keramika - Rozděleni relativní četností indexu div 0,25,- - - - - - - ---;:; - - - - - - - - - - - - - - - - - - - - - - - , 0,2 0,15 0,30 0,36 0,42 0,48 0,54 0,60 0,66 0,72 0,78 0,84 0,90 ___ Čakajovce + Pohansko X~ Gusen Uraf2. Zdobená Cl obtáčená keramika - Rozdčlcní relativní čeln osti indexu dIv. 4.8 Testování výsledků Lze předpok l ádat, že pokud projdeme všemi navrženými kroky, dospějeme k urč i tým zjištěnim, které naleznou svi.j odraz jednak ve výsledku databázových dotazi., jednak v grafech. Naše data se budou ri.zně seskupovat nebo budou vyjadřovat určité tendence a závislosti. Zj i štěná strukturovanost zkoumaných dat je projevem zákonitosti v archeologických pramenech (Neustupný 1986, 542). Tyto struktury je nutno interpretovat. Než však přejdeme k vlastni interpretaci, musíme ověřit spolehlivost našich zji štěnÍ. Jestliže to data svým typem a rozsahem umožiíují, lze k dosažení tohoto cíle ve velké míře použít metod matematické statistiky. Statistika nám dává k dispozici ri.zné postupy, kterými vyjadřujeme statistickou věrohodnost našich výsledki.. K elementárním z nich patří např. zj i šťování významnosti shody či rozdílu mezi dvěma výběry, tj. vzorky dat, které zkoumáme (např. tvar nádob ze dvou lokalit), č i statistické závislosti mezi dvěma proměnnými tzv. korelaci (např. mezi časem a tvarem nádob) (viz níže:Weber Z.: Statistická analýza archeologických dat). Větš in a metod j e popsána ve statistických příručkách. Přib l ížíme si proto jako příklad pouze jedinou z nich. Jedná se o Kolmogorovlrv-Smirnovovl'v test pro dva nezávislé výběry, který je v archeologii obecně používán (Smetánka 1971 ). Je to metoda, kterou lze jednoduše a přitom poměrně spolehlivě zhodnotit statistickou významnost rozdílu mezi dvěma soubory nálezů. Patří do velké skupiny testl' shody. Pomocí zvoleného statistického postupu testujeme, zda dva výběry pocházejí z jediného základn iho souboru. Jedná se o neparametrický test, který neklade velké nároky na předem dané podmínky, které jsou u jiných metod vyžadovány. Je založen na hodnoceni rozdilu kumulativních četností dvou výběrl" Mi.žeme ho využit ve dvou případech, a) když jsou výběry menší nebo rovny 40, v tomto případě musí mít stejné rozsahy b) když jsou výběry větš í než 40, pak mohou být rl.zně velké. V prvním případě používáme absolutní kumulativní četnost, v druhém relativní kumu lativní četnost. 41 .Iako testovací kritérium se používá hodnota rozdílu kumulativních četností obou výběrll v té třídě, kde je jeho absolutní hodnota největší. Označujeme ho jako D. Kritické hodnoty j sou pro ma lé výběry tabelovány, pro velké se vypočítávají. Mají své speciá lní rozdělení, závislé na rozsahu výběrll a na zvolené hladině významnosti (0,0 I nebo 0,05, tzn. zjištěný výsledek lze přij mout s 99% nebo 95% pravděpodobností). Označujeme je jako Do.ol nebo Do.o, . Jestliže je D> Do.o" zamítáme nulovou hypotézu a tvrdíme, že na zvolené h l adině významnosti nelze oba soubory považovat za výběry z téhož základního souboru a naopak. Výpočet hodnoty D [ze dle příruček (Reisenauer 1970, 99- [03) poměrně jednoduše automatizovat v tabu lkových kalkulátorech typu MS Excel. Pokud zjistíme, že na určité h l adině významnosti [ze naše zj i štění podepřít statistickým testováním, nic nám nebrání v tom, abychom přešli k poslední fázi naší práce - interpretaci. Ta bude mít nesrovnatelně vyšší váhu, jestliže bude vycházet ze statisticky ověřených výs[edkll. 4.8.1 Příklad 7 VZla/,y mezi soubOly z koslrových polu'ebišťjihozápadního SlovellSka lze díky jejich velkému rozsahu vyjádNI i pomocí exaklních slatislických pOSIl/pti. Využijeme osvědčeného Kolmogorovova-Smirnovova teslu pro dva nezávislé v)iběl)l. Ph leslování hledáme odpověď na olázku, zda se výběrová rozdělení čelností Slalisticky významně neliší, neboli zda oba výběly pocházejí z jediného základního sO/lbom (Reisel1auer 1970, 99). Postl/pně budeme les10val jednotlivé indexy a vždy dvě lokalily mezi sebou. Výsledky slatislick)ich leslli umíslíme do přehledné labulk)l (tab 1). Slalistická pozorování pOlvrzl/jí na vysoké hladině významnosti na.(e závělY o Ivarových skupinách keramiky najihozápadním Slovensku, ke kterým jsme dospěly na základě p,'edchozího dalabázového zpracovál7í a visualizace dal v grafech. Naše závělY se lak z hlediska slalistikyjevíjako spolehlivé. LOKALITA I LOKALITA 2 INDEX D 00,05 OEvíNSKA HOLlARE div 0,0558 [4 0,1808 0 <0 0.05 NOVÁ VES OEvíNSKA ŠTÚROVO div 0,084453 0,17695 0 <0 0.0> NOVÁ VES HOLlARE ŠTUROVO div I 0,059656 I 0,203988 I 0 <0 0 O> DEV[NSKA ZÁHORSKÁ div NOVÁ VES BYSTR.[CA HOLlARE ZÁHORSKÁ div BYSTR[CA ŠTÚROVO ZÁHORSKÁ div BYSTRICA OEVINSKA NOVÉ ZÁMKY div NOVÁ VES , HOLlARE INOVEZAMKY I div ŠTÚROVO INOVÉ ZÁMKY I div ZAHORSKÁ BYSTR.ICE OEV[NSKA NOVÁ VES OEvíNSKA NOVÁ VES , STUROVO OEV1NSKA NOVÁ VES NOVÉ ZÁMKY ŠTÚROVO HOLlARE HOLlARE ZÁHORSKÁ BYSTRICA div u/v u/v 0,194296 0,19598 DDO.05 0,0693152 0,1359833 0 <0 0.0> 0,0400 II I0,1696746 I 0 <0 0.0> 00436494 1o 165486 1 I 0 <0 0 0>, , 0,2027559 0,18569 D>00.05 0,207839 0,1807095 D>Do.05 0,11[ 163 0,18395 D<00.05 0,145668 0 <0 0.0> o,[77853 0 <0 0,05 42 VÝSLEDEK Shoda Shoda Shoda Shoda Shoda Rozdíl Shoda Shoda Shoda Rozdíl Rozdíl Shoda Shoda Shoda s s a ~ c 2 t r \ r LOKALITA I LOKALITA 2 INDEX D Do,os VÝSLEDEK HOLlARE ZÁHORSKÁ u/v 0,244383 0.2299 D>Do,05 Rozdfl BYSTRICA ŠTÚROVO ZÁHORSKÁ ulv 0,329484 0.2273 0 >DO,05 Rozdfl BYSTRICA DEVÍNSKA NOVÉ ZÁMKY ulv 0,16609 0,13984 D> 0 0,U5 Rozdfl NOVÁ VES HOLlARE NOVÉZAMKY ulv 0, 11 8 19 0,1695 DDo,05 Rozdfl BYSTRICA DEVÍNSKA HOLIARE ulvyd 0,235732 0,18471 D>Do.05 Rozdfl NOVÁ VES OEVÍNSKA ŠTÚROVO ulvyd 0,355407 0,20256 O>DO.05 Rozdfl NOVÁ VES ŠTÚROVO HOLlARE ulvyd 0,200094 0,21609 0 <0 0 05 Shoda OEviNSKA ZÁHORSKÁ ulvyd 0,21565 0,257383 D< OU.Ol Shoda NOVÁ VES BYSTRICA (Do.o,l HOLlARE ZÁ HORSKÁ ulvyd 0,3539 12 0,227547 D>0 0.05 Rozdfl BYSTRICA ŠTÚROVO ZÁHORSKÁ ulvyd 0,483258 0,24227 14 0>00.05 Rozdfl BYSTRICA 43 DEVÍNSKA ŠTÚROVO dlu 0,214286 0,20 162 0 >0 0,05 Rozdíl NOVÁ VES OEVÍNSKA HOLlARE dlu 0,09232 0,18470 0 :.~..-j 14 1S tJ I ) ~ I ) CI)} ~~ j) 12 (I) o 16 18 Obr. 5. Keramické třídy moravské domácí cneolitické keramiky. 58 TYS (tvrdost stěn Kód 2 3 lechem) 4 KH (druh keramické hmot jedince) Kód 2 jemnozrnná (do I m.n) 4 středozrnná(do 2 mm) 6 zrnitá (do 3 mm) 7 hrubozrnná (nad 3 mm PKH ( řiměs v keramické h motě) Kód V' mam kódu 2 3 4 5 8 9 4 5 6 7 8 2 4 5 6 7 8 jed ince vně a uvnitř) V' znam kódu 03 vh loubená 04 lastická S9 IDV (druh výzdoby jedince vně a uvnitř) IKód IVýznam kódu 134 Ivhloubená a plastická I05 Iinkrustace 135 Ivhloubená a inkrustace RVV (rozložení vhloubené výzdoby vně a uvnitř) Kód Význam kódu I okraj 2 hrdlo 3 plece 4 výduť 5 spodek 6 dno 7 nožka 8 ucho 12 okraj a hrd10 23 hrdlo a plece 24 hrdlo a výduť 34 plece a výduť 35 plece, výduť a spodek 45 výduť a spodek 50 celé tělo Pokud je výzdoba uvnitř přidává se O, například 03, 050, 035 IRPV (rozložení plastícké výzdoby vně a uvnitř) IKód IVýznam kódu 101 Iokraj 02 hrdlo 03 plece 04 výduť 05 spodek 06 dno 07 nožka 12 okraj a hrdlo 14 okraj a výduť 23 hrdlo a plece 24 hrdlo a výduť 34 plece a výduť 35 plece a spodek 45 výduť a spodek Výzdoba na moravské domácí eneolitické keramice se rozpadá na dvě hlavní složky: I. Vhloubenou výzdobu, která představuje lakové výzdobné projevy, které se zahlubují do povrchu keramických tříd (vpichy, vrypy, jamky, rýhy, žlábky, brázděný vpich, prstování, bernburgská výzdoba, slámování, voštinování). 60 2. Plastickou výzdobou rozumíme vše, co vystupuje na povrchu keramických tříd, kromě vOštinování. Patří sem výčnělky, zvláštní plastické tvary, provrtané výčněl ky, ucha, lišty a okrajové lišty. VV (vhloubená výzdoba) Kód Skupiny výzdoby Význam kódu Ol vpichy - obr. 6 vpichy 02 vpich v horizontálních řadách 03 dvě horizontální řady vpichlt 04 šikmé řady vpichll 05 svislé řady vpichli 06 troiúhelníkový vpich v horizontální '·adě 07 nepravidelný vpich v horizontálních řadách 08 hrotitý vpich v klikatce 09 dvoj itý oblouk 10 trojúhelníky z vpichll II troiúhelníky vyplněné vpichy 12 I páska vyplněná vpichy 13 dvojbřitá sekera z vpichll 14 I přesypací hodiny z vpichů 15 vpichy ohraničené liniemi 16 vpichy s klikatkoll 20 vrypy (na rozdíl vrypy od vpichli j sou protáhlejší) obr. 7 21 svislé vrypy 22 obdéln íkové vrypy v řadách 23 vrypy v horizontálních dvoiřadách 24 vrypy ve více horizontálních řadách 25 vrypy ve tvaru šipky 26 horizontální řady segmentových vrypli 27 kapkovitý vryp v horizontální řadě 28 Ipásky vyp lněné vrypy 29 zv lněný těliskový vryp 30 jamky - obr. 8 jamky 31 horizontální řada jamek 32 jamky ve svislých řadách 33 oválné jamky v horizontálním uspořádání 34 oválné jamky střídavě položené ve dvou řadách 35 oválné jamky střídavě položené ve třech řadách 36 zahrocené jamky na těle nádoby 37 šikmo orientované oválné jamky v horizontální řadě 38 jamky nepravidelného tvaru v horizontální řadě 39 I jamky trojúhelníkového tvaru postavené na hrot v horizontální řadě 40 jamky trojúhelníkového tvaru postavené na základně v horizontální '·a- dě 41 jamky trojúhelníkového tvaru postavené na základně ve dvou horizontálních řadách 42 Uamky půlměsícového tvaru v horizontálním uspořádání 43 jamky tvaru segmentu v horizontálním u spořádání 61 ------------------- -- ---.VV (vhloubená výzdoba) Kód Skupiny výzdoby Význam kódu 44 "kávová zrnka" v horizontální řadě 45 jamky obdélníkového tvaru v horizontálním uspořádání 46 okrouhléjamky na těle nádoby 47 I plastické trojúhelníky vyplněné jamkami 48 I girlandy vytvořené jamkami 50 I rýhy - obr. 9 rýhy 51 vodorovné rýhy přerušované svislým i 52 šikmé rýhy 53 svislé rýhy 54 "i" motiv 55 šikmé klikatky 56 několikanásobné klikatky 57 mřížování 58 motiv nepravidelné "rybí kosti" 59 hroty na těle nádoby 60 žebříkovité klikatky - jednoduchá 61 žebříkovité klikatky - dvojitá 62 spojené kosočtverce 63 ptačí stopa 64 křížky 65 obrvené kolečko 66 ,rýhovaná pole v kombinaci s jamkami 67 I rýhy ve tvaru "nepravidelných vlčích zubů" 68 "rybí kost" 69 trojúhelníky zavěšené na rýze 70 žlábky - obr. IO žlábky 71 vodorovné žlábkování 72 šikmé žlábkování 73 svislé žlábkování 74 několikánásobný Pllloblouk 75 žebřík vodorovný 76 žebřík šíkmý 77 žebřík svislý 78 "hrábě" 79 žlábkovaná větévka 80 žlábkované "x" 81 několikanásobné žlábkování do klikatky 82 vlčí zuby 83 nepravidelné vlčí zuby 84 žlábkování nepravidelného uspořádání 85 nepravidelné žlábkování v polích 86 žlábkování do čtvrtin kruhu 87 "rybí kost" 88 "rybí kost" svislé orientace 89 žlábkovaná klikatka 90 trojúhelník vyplněný horizontálními žlábky 91 šikmá vlnice 92 nepravidelné žlábkování kombinované jamkami 62 vícenásobná klikatka 100 brázděný vpich brázděný vpich - obr. II 101 několikanásobné vodorovné linie 102 šikmo orientované linie 103 několikanásobné linie svislé orientace 104 105 106 107 ostavené na vrchol 108 ostavené na základnu 109 žebříkovitá klikatka 110 vícenásobné klikatk III 112 113 114 11 5 soustředná kolečka prstování - obr. 12 120 svislé 121 šikmé 130 "bernburgská "bernburgská výzdoba" výzdoba" -obr. 12 140 slámování -obr. slámování 12 141 voštinování - voštinování obr. 12 63 Vpichy ..........) 01 -- - e • , , • " c "c < , • • ,, " " o , ", " o o o " , oc c c ,c ,, , c c c , , o • " " c ,, ' ' c,- eo , C ,, c- e • • c , I • ", c , • , " , .. " "• c • • , " , • c , , •c C • • • "" , •, • c , • c " 05 --- - 09 13 cce~ c('c ec C c. C " " o " 001 c C') c cen 0 · 0 ccc o c c () oe c c- c o ť!ceecC'C _. - --- c " " " (l('lCCCť' 02 03 ) , hL) G t:; Cl ()C(I()C t> CC>()()(J 06 07 10 11 Q n " c " 14 15 Obr. 6_ Vhloubená výzdoba - vpichy (1-16)_ 64 cC C o "" cc co c "c "c "_e "co- o c- e " / • • • 04 , , p~ ~ , lb'" , ~ C • 47 O () (I (: """"1 OOOV0(l0 c O(l () 7F(ioOoO c- o O (I 0000 ' o O (I o o O o C (I (' () (} 32 33 34 O rvHo vr tJOOCOfJC{J ()\d>O(lt~) O O 0°00 00 COQOOO OO C O O Ocf, ť 36 37 38 ~. O\J vV M)b t, lJ b !~\ éJ t;, Ij !;:) ~ b !c,' k · b lJ!)lJtJ!Jt:;e (s7 ~, \,":-y ~-.1' 40 41 42 44 45 46 -.0 oe. ee....~··f!°O ~ ....:·.o•• o....·~eoe .. 0(,".," ! ...,.: .... oc.c.,· c;~e~!"O,~~~ ll/ll:c"~ ::,~".i~~o:e :l ti" .,,,",:~}.;.!:.,;,J;);:~ 63 67 71 75 Obr. 16. Plastická výzdoba- provrtané výčnělky (61-80). 79 64 68 72 76 ~ « ,"<;o.. .-;") /(\~ l~81 82 83 84 85 86 87 88 89 90 91 92 93 ObL 17. Pluslická výzdoba - provrtané výčně l ky (81-93). 80 Ucha k,~l" ;'r....· :. j. 1.·:.\ 101 ~:.: .~ .: '..·· f·'..·" ... ' ............ 105 /~ h"\ Ji, f(" P,. .. V. " . ' .....:,;.. ,. 109 113 102 103 104 106 108 110 111 112 114 - .._ _.. - . - - - - , ,..--- ----, ~--- ~l··;l···. " , .'". .; , . . / .. \, ~ ... . ..... . " ' - ' 117 _· '-~w L -_ _---=-----' hi 118 119 120 Obr. 18. Plastická výzdoba - ucha (10 1- 120). 81 0 ····0 121 122 123 124 .......,,,~~c;..;é.' __""". ··";;~;:mj!J.Jna~~&ý 125 126 127 128 Obr. 19. Plastická výzdoba - ucha (121-129). 82 Lišty b 60,(1 ce Ů-'fF. '6 66(".66f'.~-' ---- ._.fo'·· jil-., to,1"0\-~~; _ ~J 1M- ~~ c:i__ 1::J(u uo.uf 131 132 133 134 Tnu1) D]TEID)]X () OO O(JO ff' .c c.rc:.C,J.) (jUnnnD DD ft I H DDft ~ 135 136 137 138 - (i Cfl Coe O.Q -O c () C0.0 OO '(Q (k . (1). ~ťl)' 1.. UU Oq Dt' f, O Q O Q t O O fJ Ó. O: Q "I'; ec' ~1';1t.: go o " (3 e (;) '" G o '-co 163 164 165 166 ~c c ~~~CITf) c 167 168 169 170 Obr. 21. Plastická výzdoba - lišty (15 1-1 70). 84 I I 171 172 173 174 175 176 177 178 179 180 181 182 oeeoooC'o.I10. 'c QOOQo6bqc ~~ 18] 184 185 186 187 188 189 190 ObL 22. Plastická výzdoba - lišty (171 ·1 90). 85 T:ITUITITTI: CQQOCOQQQ llTJ[D Iť Cr" ]5cCQEOhÓ(5 ~Cr~{OO ~o()c~~:A( ~.l .'V' '~ L'_~-=-L_.....o/v_~""---.J;/"V~"0 L!\~_---'-'-~---.J 191 192 193 194 Q ~) .ť) Cl ceCi1'. (" run [lC/ll!t [: () C: o{J o() (! (!Q o o.. ť . ť o /)0 oe : : .. .Q .' r flf fflJ (!()(!ccoo})o~ čl C 1J2..... ...~Q~i2t~ 1 () c '" t:) c! " <) \č t:> '" ~ C: C C <> '"() c O t:> C " " c C ~ I; ll' ~; " o '" 199 200 201 202 203 204 205 206 a a.coo t o oOlla 207 208 209 Obr. 23. Plastická výzdoba - lišty (191·209). 86 Okrajové lišty ",'W , ~ I -vvvv- 211 212 213 214 ,---------, ,--------, , -- - ----, ,-- -- --, 215 216 217 (lP'Pf.' . f " ' Q \ ,+ " . ': 219 220 221 223 224 225 tllf'" li,..f..l1, 227 228 229 Obr. 24. Plastická výzdoba - okrajové lišty (21 1-230). 87 218 222 226 -~t;'"'tttr ..()"J2-,;o{2 230 231 232 233 234 .,," .~c>(5"ť),~ - , ..._,_. :Jl'''''''/ o.C· f ·!L~ ~l'2~iU::.:C. . -- Qf:.~: !j,íi~Ó15:::c:t fJ,"o"li-12 "oť:CC;-C; ífiflFiYo t" ,Q..g;. ;~R4 (5.:!'2-o-i"'oC 7J..."(y-~i{''-(JC 235 236 237 238 I239 240 241 242 .-----_..----_.-. ~; 243 244 245 246 '.'-..."---.,,"----JJU.OOO UW".t· 247 248 249 250 Obr. 25. Plastická výzdoba - okrajové lišty (231-250). 88 J1:L':tJ..::e ",ULl-> f () () II I -m:....-m~D'-. ~ ~. ~l ~\t_V.:~\d: I 251 252 253 254 I } C_ťJ JJ....lt.!1 tL , ~~~ IT:E.e.TE ... _....~~. _ • . :..A<.. 255 256 257 258 Obr. 26. PI.s Vlastnosti pohledu

Vrstvy pohledu Palety Základn í palety Hlavní paleta 167 Ovládání pohledu Modifikace elementu Výběrová ohrada Měření Nastavení tabletu Digitalizace Objekty - základní obrys Materiály Vnitřní kresba objektu Pomocná kresba Texty - č ís la Zavři subpalety Digitalizace Nastavení tabletu Předvolby Zachycení Tlačítka User Prostředí Preference Help Vyber komponenty uživatelského prostředí Vyber uživatelské prostředí Roletové nabídky Soubor, Editace, Nastaveni, Pohled, Zachyceni, User a Help skrývaj í do češtiny přeložené a zjednodušené nabídky standardního prostředí programu MicroStation. Jejich ovládání lze zvládnout intuitivně, případně odkazuji na literaturu [MicroStation - User's Gu idc. Bentey Systems, Inc. 1994.] b vzhled upraveného dialogového okna (pllvodně View Allribules) .Vlastnost ohledu II "';plnění l!l.'llditelné lr.fov~~f t Viditelné tei ......zapnutí chytání na mřížku < F2 > ...... informace o elementu < F3 > ......zoom + (zvětšení) < F4 > ......zoom - (zmenšení) < FS > ......zoom okno < F6 > ......zapnutí všech vrstev < F7 > .. .... vypnutí všech vrstev (mimo aktivní vrstvy) < FS> ...... uzavření elementu < F9> ...... připojení referenčního výkresu < Fi l> ...záložní kopie (uložení výkresu do souboru * .bak) < CTRL> ...odpojení referenčního výkresu < CTRL> ... DOS Prompt ("odskok" do DOSu) ... ukončení programu (s uložením nastavení a kompresí výkresu) 171 Další informace o pracovním prostřed í POHAN a možnostech jeho získání najdete na internetovské adrese http://www.phil.muni.czlarcheo/index_cz.hlmI. \ 172 .. 11. Geografický informační systém a výzkum pravěké sídelní struktury (Martin Kuna) 11.1 Úvod Výpočetní technika, a to především databázové systémy a statistické programy, přinesla v posledních desetiletích přelom v efektivním využití archeologických dat. Software typu geografických informačních systémel (GIS) je dalším krokem v tomto směru . GIS jsou softwarovými produkty, zaměřenými na zpracován í prostorových informací. Jejich přínosem je zejména možnost přímé vizualizace archeologických situací v reálném (geografickém) prostoru a možnost analýzy jejich uspořádání a vzájemných souvislostí s prvky geografického prostředí. GIS se v archeologii uplatňují zejména ve dvou oblastech. Za prvé, GIS se stávají nástrojem uchování a zpřístupnění archeologických informací v jejich prostorovém kontextu. V této roli jsou GIS používány při dokumentaci terénních výzkumll a jako součást inrormačních systémII na úrovni lokality, regionu nebo celého státu (pojem GIS je zde, podobně jako jako v případě pojmu "databáze", užíván jak k označení samotného softwaru, tak výsledného souboru informací, který je tímto prostředkem zpřístupněn uživateli). GIS jsou proto významným dophlkem databází, využívaných pro potřeby péče o archeologické dědictví. Druhou oblastí využití GIS v archeologii je studium prostorové struktury archeologických pramenll a jejich geografického prostředí. Obě zmíněné oblasti použití, tj. dokumentace archeologických dat, motivovaná spíše praktickými ohledy, a na teoretických motivech založené studium, spolu úzce souvisejí, nicméně implikují dí lčí rozdíly v prioritách při výběru dat, ve způsobech dokumentace a v neposlední řadě i při výběru konkrétního softwaru. V současné době již totiž existuje celá řada produkttl typu GIS, lišících se podstatně nejen cenou, ale i složitostí obsl uhy a využitelností pro rllzné úkoly archeologické práce. Tzv. veklorové GIS (pojem vektorový zde souvisí s technikou počítačového záznamu prostorových objektll jakožto bodll-vektorll v prostoru a pomocí body vymezených linií a polygonll) obecně ullložiíují velmi přesnou a z hled iska kapacity paměti počítače úspornou evidenci dat. Proto jsou využívány např. ve státní správě, kde se stávají základem rozsáhlých informačních systém ll, občas j iž zahrnujících i vrstvy archeologických informací (např. Okresní úřad Chrud im, připravují se další; srov. Neustupný I996a). K nevýhodám těchto systémll patří jejich vyšší cena, uživatelská náročnost a v některých případech i absence analytických funkcí, které jsou potřebné z hlediska odborných cílIl archeologie (např. GIS PC ARC/lNFO). Naproti lomu tzv. raslrové GIS (uchovávající každou z mapových vrstev jako "rastr" čtvercll o určité velikosti) jsou orientovány spíše na odborné úkoly. Vzhledem k tomu jsou zpravidla vybaveny větším množstvím analytických funkcí, bývají levněj š í a uživatelsky přístupnější. Jejich jistou nevýhodou je komplikované propojení s doplňujícími databázovými informacemi, velké nároky na paměť počítače (omezující v praxi rozsah studovaného území) a nižší kval ita reprodukce prostorové informace, včetně tištěného výstupu. Je však pravděpodobné, že rychlý vývoj softwaru povede brzy ke stírání rozdílll mezi těmito dvěma hlavními druhy GIS. Použitelnost rllzných typll GIS k odborným úkolllm se bude rozšiřovat i s rozvojem technických parametrtr dostupného hardwaru. Užití GIS v archeologii má dosud v ce losvětovém měřítku poměrně krátkou historii. Jeho počátky sahají do 80. let a souvisejí s rozvojem počítačového zpracování map, zejména ve Spojených státech. Za mezník je považován rok 1985, kdy byla této problematice věnována vlastní sekce na konferenci Společnosti pro americkou archeologi i (Kvamme 1995). Sám pojem GIS se v archeologii objevuje teprve v druhé polovině 80. let s nástupem softwarových výrobktr ARC/INFO, MOSS, GRASS nebo IDRISI, Pllvodně vyvinutých pro potřeby armády, státní správy, v případě IDR1Sl pro potřeby univerzitn ího výzkumu v oblasti přírodních věd (zejména pro analýzu satelitních snímkll). Současné možnosti GIS jsou, kromě řady dílčích publikací, nejlépe ilustrovány učebnicovou prací V. Gaffneyho a Z. Stančiče GIS approaches 10 l'egiol1a/ ana~ysis: A case study oj the is/and oj Hvar (1991; rec. 173 Gojda 1993) a dvěma základními sborníky příspěvků specializovaných konferencí, shrnujícími přístupy k GIS v kontextu americké a evropské archeologie (Allen, Green a Zubrow eds. 1990; Lock a Stanči č eds. 1995). V České republice bylo využití GIS pro potřeby evidence archeologických dat a dokumentace výzkumů v současné době již zahájeno na více archeologických pracovištích (např. SÚPP Praha, ÚAPPSZČ Most, Archaia Praha aj.). Naproti tomu možnosti aplikace v analýze prostorové struktury archeologických dat jsou prozatím rozvíjeny jen několika výzkumnými projekty oddě lení prostorové archeologie ARÚ Praha; první výsledky j iž byly publikovány (Kuna a Adelsbergerová 1995; Neustupný 1995a; Neuslupný 1994, 1996b; Neustupný a Vencl 1995, Neustupný a Venclová 1996; Kuna 1996). Na zkušenosti z těchto projektll navazuje i tento příspěvek. Po technické stránce se tyto projekty opírají O vektorový GIS PC ARC/INFO, sloužící zej ména k digitalizaci mapových vrstev, a rastrový GIS IDRISI v. 4.0 a v. 1.0 pro Windows (produkt Clark University, Worcester, Mass., USA), používaný k vlastní analýze archeologických a geografických dat. 11.2 Význam GIS pro analýzu archeologických a geografických dat Nesporným přínosem archeologie posledních tří desetiletí je dlJraz na poznání strukturálních otázek vývoje spo lečnosti, k nimž patří např. vztah spo lečnosti k přírodnímu prostřed í, sledování demografických trendů, organ izace sídelních areálů atd. Řešení těchto otázek předpokládá uchopit archeologické prameny jako pozůstatky strukturovaného systému, který má formální a prostorovou dimenzi, včetně specifického vztahu ke konkrétn ímu geografickému prostředí. V GIS lze spatřovat metodologický nástroj převratného významu, který umožlluje nejen novým ZPllsobem řeš it řadu existujících teoretických otázek, ale který nutně povede k formulování otázek nových. Jelikož veškerá archeologická data j sou informacemi prostorovými, GIS v budoucnu nezbytně ovlivní všechny roviny archeologické práce: od sběru dat v terénu, přes metodiku analýzy dat až po Formulaci nových teoretických pojmů. Z hlediska odborných cílll archeologie je mimořádně významné, že GIS umožň ují : (a) Operativní promítání formálních vlastností archeologických pramenů do reálného (geografického) prostoru a naopak, 0. převádění geografických (prostorových) vlastností do prostoru Formálního. Příkladem mllže být např. promítnutí archeologických typů do topografické nebo speciální mapy a zpětné načtení určitých geografických údajll (vzdálenost od vodního zdroje, typ geologického podloží apod.) do dalabáze. (b) Analýzu prostorového uspořádání (např. plošný rozsah, hustota, vzájemná vzdá lenost) celků vzniklých terénn ím výzkumem nebo formá lní analýzou a na tomto zák ladě definici nových prostorových celkll archeologických pramenů . (c) Zj i šťování takových vlastností geografického prostoru, které jsou významné z hlediska chování minulých populací, avšak které nejde zj istit v běžně dostupných mapách (např. mapa sklonu a orientace svahu, areálll dosupnosti); vytváření libovolných kombinací mapových prvkll a vrstev. (d) Přístup k prostorovým datům jako k souvislému povrchu plynule se měnících vlastností, tedy nikoliv jenjako k m noži ně nesouvislých pozorování. (e) Vizualizaci prostorových dat způsoby, které neumožlluje běžná mapa (např. profily terénem, trojrozměrné modely) ajejí využití pro archeologickou analýzu a interpretaci. 11.3 Základní funkce GIS IDRlSI Základní princip rastrových GIS je velm i jednoduchý. U rč itý prostor (zpravidla jde o reálný prostor definovaný geografickými souřadnicemi, ale mllže j ít o jakýkoli prostor s libovolnými souřadh icemi) je rozdělen do sítě buněk (tzv. rastru) o zvolené velikosti. Každé bujíce jsou přiřazeny tři numerické proměnné : souřadnice X a souřadnice Y (popisující její polohu) a třetí proměnná, která označuje stav (hodnotu) dané bujíky, někdy též označovaná jako souřadnice Z. Souřadnice Z jednotlivých buněk rastru mohou vyjadřovat bud' urč i tou měřitelnou hodnotu, přís lušej ící dané bujíce mapy (např. 174 nadmořsko u výšku), nebo stav (vlastnost) dané b1l11ky (např. mohou být pořadovým č íslem archeologického na leziště, označen ím druhu geologického podloží apod .). V prvním případě jde zpravidla o reálná č ísl a, v druhém případě o čís l a celá (označující tzv. nominální proměnnou), fungující jako identifikátory urč ité třídy objektll mapy. Uspořádání buněk s urč itou hodnotou Z vytváří v počítač i digitální analogii tíštěné dvourozměrné mapy, přičemž přesnost zobrazení zvolených objektů závisí především na velikosti bun ěk, či li .,hrubosti" užitého rastru. Velikost buněk lze definovat l i bovolně, j e však přitom nutné brát ohled na kapacitu pevného disku a rychlost počítače. Je-I i souřadní cí Z celé číslo (infeger), zabírá každá b1l11ka 2 byty paměti, u č íse l reálných dvojnásobek. V některých aplikacích, např. při studiu geomorfologie terénu, je často nezbytné pracovat s rastrem poměrně malým (1 Ox IOm a menším); z toho vyplývá, že každá mapová vrstva regionu o rozloze IOx IOkm se bude skládat Z 1,000,000 buněk a zabírat zhruba 2 až 4 MBy paměti. Tento rozsah mapových vrstev představuje zi"ejmě rozumnou hranici velikosti z hlediska j ejich zpracovatelnosti dnes dostupnou výpočetní techn ikou: běžné operace s vrstvami tohoto rozsahu na počítači typu PC 486 nebo Pentium trvají kolem 10 vteřin, s l ožitějš í pak něko lik minut; některé výpočty však mohou trvat i řadu hodin. Podstata GIS spočívá v rozkladu topografické, speciální nebo archeologické mapy na jednotlivé "vrstvy" (coverage, image). Takovou vrstvou může být např. vodn í síť, výškopis, poloha současných sídel, typy geologického pod loží nebo výskyt archeologických nálezlJ. GIS v první řadě umožIluje zobrazit mapovou vrstvu na obrazovce v libovolném výřezu, odečítat z obrazovky přesnou polohu (X,Y) vybraných bodlI a hodnotu (Z) příslušné buňky, překládat přes rastrový obraz libovo lný počet obraz" vektorových a tímto zp"sobem vizualizovat vzájemné vztahy mezi vrstvami. Možné je i konstruovat na obrazovém podk l adě j edné vrstvy vrstvu novou v podobě bodlI, linií nebo polygoniJ. Při zobrazení mapové vrstvy je každé hod notě Z, případně určitém u intervalu hodnot, přiřazena jedna z barev (lDRISI 4.0 i IDRISI pod Windows pracuje se 16 nebo 256 barevnými odstíny, paletou šedých odstín II a dalšími paletami ; uživatel si také mÍlŽe definovat palety vlastn í, viz Dodatek). Povaha rastrové mapy j ako množiny prostorových jednotek, charakterizovaných numerickou proměnnou , však umožlluje provádět s mapovými vrstvami řadu dalších operací, ve kterých teprve spočívá hlavní význam rastrových GIS. Tyto operace lze sdružit do několika tématických okruhů (Eastman 1992): (a) Základní okruh Operace souvisej ící s vytvářením rastrových map z vektorových souborů a jejich "pravami. Z věcného hlediska jsou nejvýznamnějš í tyto operace (v závorce je vždy uvedeno jméno operace): reklasifikace (rec/ass) vrstvy, umožňujíc í vybrat z mapy j en určitou třídu jevů, sdružit určité jevy nebo roztřídit plynulé hodnoty do nov)'ch, uživatelsky smysluplných tříd Uako přík lad uveďme výběr a označení všech ploch o určité nadmořské výšce, svažitosti nebo typu plld) a vytvol·ení nové vrstvy s vybranými prvky; přiřazení (assign) nových hodnot, uložených v databázi, objektům mapové vrstvy; interpolace (il7fe/1Jol, infereoll) prostorově nesouvislých dat do souvislého povrchu plynule se měnících hodnot. Jednoduchou metodou interpolace je i tzv. filtrace (jiller) mapové vrstvy, během níž je každé bUJlce přiřazena hodnota prilměru hodnoty bUJlky a osmi bezprostřed ně sousedících buněk. (b) Okruh geografických analýz Operace, umožnující vizual izaci prostorových vztahil uvnitř vrstvy a vytváření vrstev nových dle požadavků uživatele. Pomocí těchto operací lze zjistit a uložit jako novou vrstvu např.: celkový počet buněk s určitou hodnotou, tedy plochu rilzných objektll mapy (area); profi l hodnot Z podél definované linie (projile); součet, rozdíl a výsledky dalších aritmetických operací mezi dvěma mapovými vrstvami (overlay); vzdálenost od vybraných objektů mapy, např. od nejbližšího vodního toku, významných na lezi šť apod. (distance); dostupnost různých míst prostoru na zák ladě jejich eukleidovské vzdálenosti od výchozích bodlI a rllzné prllchodnosti terénu, případně rllzných terénních překážek (COSf); 175 - optimální spojení bodů v prostoru S ohledem na průchodnost terénu (pathway); - areály typu Thiessenových polygonll (Ihisessen, al/ocate); sklon a orientaci svahu na základě digitálního výškopisného modelu (surface); rozsah povodí (spádového území vodního toku) a areál dohledu z vybraných míst mapy (watershed, viewshed); "zázemí" vybraných areálů na základě "poptávky", definované hodnotou polygonll jedné mapy a "nabídky", stanovené hodnotam i geografického prostředí v mapě druhé (hinter- fand). (c) Okruh grafického vyhodnocení vrstev Operace specificky zaměřené na klasifikaci satelitních snímkl!. (d) Okruh statistických analýz Soubor operací, spojených s celkovým vyhodilOcením mapové vrstvy. K základím operacím patří: vytvoření histogramu četností hodnot buněk ve zkoumaném obraze (histo); extrahování (exlracl) celkového součtu hodnot, průměru, směrodatné odchylky atd. buněk jedné mapy, spadajících do rllzných polygonů mapy jiné (např. počet nalezišť na jednotlivých druzích geologického podloží); výpočet trendu v prostorovém uspořádání hodnot v mapě (trend), generování náhodného vzorku z buněk mapy (random, sampfe), stanovení některých parametr" uspořádání hodnot mapy (pal/em, al/locorr, regress); výpočet korelací a map faktorových skóre ze série mapových podklad" pomocí analýzy hlavních komponent (principal component analysis, time series analysis) a další analýzy. 11.4 Vytvoření a úpravy archeologické mapy Rastrový GIS převádí prostorové objekty, v běžné mapě zobrazené pomocí bodů, linií a ploch do pravidelné sítě buněk, tzv. rastru. Převodem do rastrové mapy se v závislosti na velikosti rastru mění tvar zobrazovaných objekt'l (bodové objekty se mění na čtverec O ploše jedné buňky, linie se mění na řady buněk a plochy na skupiny buněk). Do rastrového obrazu jsou objekty archeologické mapy (právě tak jako jakékol i jiné objekty) převedeny z vektorového tvaru, který je možno vytvořit bud' úpravou běžné databáze nebo digitalizací mapy na digitizéru (podrobnější údaje viz Dodatek). Z věcného hlediskaje možné mapu archeologických objektů pojmout několika způsoby: (a) Hodnoty buněk rastrové mapy reprezentují výskyt (přítomnost) určitých objektů mapy; všem "obsazeným" buňkám je přiřazena stejná hodnota. (b) Hodnoty buněk reprezentují označení jednotlivých objektů (např. pořadová č ísl a nalezišť). Tímto způsobem lze i v rastrovém tvaru mapy podržet informaci O vzájemné souvislosti buněk patřících týmž prostorovým objektlnn (stejné číslo označuje všechny builky, patřící k polygonu určitého archeologického naleziště). (c) Hodnoty buněk mapy reprezentují nějakou vlastnost mapovaných objektil. Objektem zde mllže být jak bod nebo polygon, vymezl/jíci určité naleziště, tak prostorový celek, který zahrnl/je nějaké archeologické fakty (např. čtverec povrchového sběru ; rozlišení pojmů vymezující a zahrnující polygon viz Neustupný 1996b; Neustupný a Venclová 1996). Hodnota buňky mllže vyjadřovat např. počet nálezů ve čtvercích povrchového sběru apod. Obsahově r"zné typy rastrové mapy jsou vzájemně transformovatelné. Připojením hodnot určitých proměnných, uložených v databázi, k identifikátorům mapy typu (b) mllžeme získat digitální mapu typu (a) nebo (c). Naopak z těchto map můžeme procedurami GIS automaticky generovat mapu typu (b), v níž každé prostorově souvislé skupině buněk o stejné hodnotě (označuj ící např. přítomnost nálezů určitého stáří, určitý počet nálezů atd.) je přiřazen vlastní identifikátor a tím je tato skupina označena jako samostatný objekt mapy. 176 Tyto procedury představují jeden z významných přínosll GIS v prostorové analýze archeologických dat, neboť umožňují podle potřeby analyzovat uspořádání rúzných proměnných v prostoru a na tomto základě vytvái-et nové prostorové celky. Ilustraci některých možností GIS provedeme na nálezech z oblasti Brandýska, která byla v letech 1986-1990 i ntenzívně sledována z pracov i ště OM v Brandýse n.L. Rozsah studovaného území je 16x l0 km a tvoří jej povodí Vi nořského a Mratínského potoka a někol ika dalších menších potokll, levobřežních přítoků Labe. Nálezový fond tvoří informace o starších nálezech na daném území, výsledky záchranných výzkum ů 80. let a souběžně prováděných povrchových sběrl'- Rozš íření nálezového fondu systematickými povrchovými sběly v projektu ALRNB v letech 199 1- 1995 nebylo podstatné; i tyto nálezy však byly do databáze zač leněny. Zejména povrchové sběry 80. let pokryly velkou část daného území (obr. I nahoře), takže pro ta archeologická období, která se vyznačují re lativně větší archeologickou výrazností, m ůžeme získaný materiál považovat za poměrně reprezentativn í vzorek někdejš ího osídlení v ohledu celkového počtu a rozm ístění pravěkýc h areá lů . Archeologické mapy jsme konstruovali pro pět pravěkých období (mladší doba bronzová, pozdní doba bronzová, doba halštatská, doba laténská a doba římská). Vytvoření a zpracování rastrových map proběhlo v těchto krocích: ( I) Sestavení databáze I/álezov)íchjedn%~~k, tj. chronologických a prostorových cel kl" zji štěných jednou archeologickou akcí. Záznamy databáze odpovídaly jednotlivým nálezovým jednotkám, sloupce (pole) databáze pak jednotlivým archeologickým obdobím. V úvahu byly brány všechny nálezy sídlištního charakteru a nálezy z povrchových sběrú, u nichž předpok ládáme souvislost se síd lištnimi aktivitami; poh r'ebiště byla v této fázi ponechána stranou. Při popisu nálezových jednotek jsme se rozhodli rozlišovat pouze přítomnost a nepřítomnost nálezll u rč itého období, neboť heterogenní charakter dat neulnož,íoval vzájemné kvantitativní srovnání nálezll v jednotné škále. Pole databáze tedy obsahovala hodnoty Oa I podle toho, zda dané období bylo či nebylo danou archeologickou akcí zachy- ceno. (2) Převod databáze nálezovÝ'ch jednotek na da/abázi nalezišť. Větš ina nálezových jednotek byla prostorově definována jako bod. Řada jednotek však byla vymezena týmž bodem (jednotky t)'chž akcí), případně body natolik blízkými. že tyto jednotky lze považovat za so učásti jednoho a téhož prostorového celku, nalezišt ě. Tyto jednotky se v GIS promítnou do téže bllllky raSlru a budou tedy označeny stejným identifikátorem; pro zachování kompatibility databáze a rastrového obrazu bylo proto U'eba s l ouč it dané záznamy již v databázi. a to s ohledem na ve li kost zvoleného rastru digitální mapy. V daném případě jsme postupovali tak, Že rozsah sledovaného lIzemí jsme v databázi rozdě lili do myšlených čtvercll 50x50m (plánovaná velikost rastru) a záznamy spadajicí do týchž čtverců jsme s l ouč i li a označi li novými identifikátory (čís ly na lezi šť). S ložitěj š í postup vyžadovaly ty jednotky, které byly definovány nikoliv jedním bodem, ale jako plocha, kterou nelze, bez podstatné ztráty informace, redukovat do jediného bodu. Tento problém lze řeš it rllzně, např. tím, že sestavíme samostatné databáze těchto jednotek pro každé sledované období, z nich vytvoříme samostatné mapové vrstvy a ty posléze kombinujeme s mapami ostatních nalezi šť. V našem případě jsme problém obešli tím, že větší (plošná) 2;ji štění byla rozdělena do urč itého počtu čtverc" v síti 50x50m, tyto čtverce byly připoj eny jako samostatné jednotky k databázi jako další nalezi ště. (3) Vytvoření rastrové mapy nalezi.fť, v níž jsou jednotlivá na lezi ště zobrazena jako bUllky s vlastními identifikátory, odpovídajícími pořadovým č íslllm na lezišť v databázi. Naleziště jsou zde chápána jako diskrétní prostorové celky, sdružující na empirickém základě nálezy z rllzných terénních akcí podle jejich prostorové souvislosti (v daném případě odpovídala nalezi ště jednotlivým bllll kám mapy, tj. čtverclII" 50x50m). (4) V)'běr (dbidris) proměnných, tj . jednotlivých období, z databáze a při řazen í (assign) jejich hodnot přísl ušným bodlll" mapy na lezišť. Výsledkem jsou mapy >ýskY/lI nálezlÍ jednotl ivých období. Hodnoty buněk (O nebo I) v našem případě rozlišovaly pouze přítomnost a nepřítomnost (sídlištních) nálezll urč itého stáří v daném bodě (buiíce). Rastr O velikosti 50x50m jsme zvolili na zák l adě lIvahy, že zhruba takováto plocha mMe odpovídat rozsahu obytného areálu jedné pravěké used losti a odrážel tedy jednu pravěkou sídellli událos/. 177 Obr. J nahoře: Mapa so učasného stavu výzkumu Brandýska (mikroregion Vinořského a Mratínského potoka). Rozměry území 16 x 10km; orientace S-J. Svět le šedé plochy: polygony povrchového sběru projektu ALRNB v letech 1991-199S~ tmavší šedé plochy: polygony povrchového sběru 1986-1990; černé body: starší archeologické v)'zkumy a výzkumy OM Brandýs n.L. v letech 1986-1990. Dole: Mapa výskytu nálezů a komponent mladší doby bronzové. Černé body odpovídají čtvercům 50xSOm Uednotliv)'m sídelním událostem). Linie vymezují jednotlivé komponenty tím, že k ploše s nálezy přiřazují jednu řadu sousedních prázdných čtverců . 178 Jsou-Ii archeologické nálezy určitého období vzájemně vzdáleny tak, že spadaj í do rllzných buněk rastru, s velkou pravděpodobností nejde o jednu a tutéž sídelní událost; naopak, pokud jsou nálezy téhož období vzájemně vzdáleny méně, nelze to vyloučit. Je-Ii tento přepoklad správný, pak počet obsazených buněk rastru vyjadřuje minimální počet sídelních událostí určitého období. (Tento postup by šlo ještě dále zpřesllovat, neboť je zřejmé, že do různých čtverců mohou v našem případě někdy padnout nálezové jednotky bližší než 50m a naopak v rámci téhož čtverce se mohou vyskytnout jednotky vzdálené teoreticky až 70m). Digitální rastrovou mapu m ůžeme analyzovat dvojím způsobem : jako plochu, pokrytou nalezišti s výskytem nález" určitého druhu nebo jako množinu nalezišť určité kategorie. (V našem případě bude výsledek totožný, neboť každé nalezi ště odpovídá jedné bUlke rastru, jindy však mohou nalezi ště zobrazena jako polygony s rlizným počtem buněk rastru). Tento postup ovšem nemusí být vždy dostačující, neboť počet a rozm ístění nalezi šť jsou jednak vždy poplatné charakteru výzkumu, jednak se z takového obrazu vytrácí informace o vzájemné souvislosti prostorově blízkých nálezů (nalezišť) stej ného stáří. Prostorové celky chronologicky současných nálezll obdobné funkce nazýváme kOll/ponen/ami (viz Neustupný 1993); pomocí GIS lze takové celky poměrně snadno generovat: (5) Mapy výskytu ná lezů rozdě l íme procedurou grollp do nových prostorov)'ch celkl', a to tak, že každé souvislé skup ině buněk se stej nou hodnotou je přiřazen nový identifikátor. výsledek představuje mapu komponent, tj. prostorově souvislých celk" nálezll určitého druhu a stáří. Před touto operací také můžeme mapy výskytu rlizným zplisobem upravit. Takovou úpravou mliže být např. spojení buněk, které jsou vzájemně vzdáleny méně než je mez, kterou stanovíme. Proceduroufi/ter, distance, cos/ nebo bldler mllžeme totiž ke každé bUlke s výskytem přís l ušného nálezu přiřad it buňky sousední do libovolné vzdálenosti, doplnit builky, které leží mezi dvěma bUllkam i s výskytem nálezll apod. Při těchto procedurách mllžeme také použít masku, odvozenou z map přírodního prostředí a omezit "rozrllstání" komponent geografickým i faktory. Tím se lze vyhnout např. tomu. aby automaticky generované komponenty zasahovaly na př. přes vodní toky, přes plochy prudkých svahll apod. (obr. I dole). 11.5 Interpolace dat Vytvořením mapy komponent převádíme archeologické prameny z empirických celkl', vzniklí'ch terénním ví'zkul11em, do prostorových celků, definovaných na základě analýzy jej ich formálních a prostorových vztahll. Mapa komponent však stále představuje zobrazení sídelního prostoru v podobě nespojitých jednotek (hodnot). Tím je ovšem jak do urč ité míry zkreslen jeho Pllvodní charakter geografického kontinua, tak jsou omezeny možnosti jeho analýzy vůči souvislým, plynule se měnícím vlastnostem kraj iny. Urč itá část mapy buď patří nebo nepatŤí komponentě určitého stáří, ale hodnoty jednotlivých buněk nemohou vyjádřit, jak významný z hlediska celku je daný bod prostoru a s jakou pravděpodobností I11llžeme na tom č i onom místě mimo vymezené komponenty očekávat nálezy další. Vytvoření mapy, v níž určité vlastnosti prostoru jsou vyjádřeny souvislými, plynule se měnícími hodnotam ije možné rliznými procedurami interpolace dat. Výsledky interpolace mohou být velmi rozd ílné, a proto volba konkrétního postupu musí odrážet posouzení charakteru dat, jejich reprezentativnosti a úkolll, kjejichž řešení má upravená mapa sloužit. V našem případě jsme předpokládali, že význam u rč i té části prostoru z hlediska jeho někdejšího osídlení se odráží především v množství sídelních událostí, které proběh ly v jeho rámci. významné areály se proto budou projevovat jako větší koncentrace buněk mapy, zatímco areály přechodně č i n á hod ně osíd lené budou reprezentovány oj ed inělými bUllkami mapy, vzdálenými od hlavních areálů. Dále m ůžeme předpokládat, že pravděpodobnost výskytu dalších areá l ů klesá se vzdáleností od hlavních center sídelních aktivit, které byly situovány v místech, které daná komunita považovala za optimální. Každému místu mapy tedy mllžeme připsat urči tý význam podle toho, kolik doložených sídelních událostí je situováno v jeho okolí a na zákl adě vzdálenosti, které daný bod mapy od těchto míst odděluj e. 179 Našim předpokladlull nejlépe vyhovovala jednoduchá metoda filtrace (fillcr) mapy. Procedura filtrace při suzuje každé bUlke mapy průměrnou hodnotu, vypočtenou z hodnoty dané buiíky a hodnot osm i bezprostředně sousedních buněk. Jelikož j sme pracovali v rastru 50x50m, dvojí filtrací map výskytu nálezll byly interpolovány Pllvodní hodnoty buněk v okruhu 100m. T ímto postupem (a) se podstatně sní7.ily hodnoty prostorově osamocených buněk, představujících ojed i nělé sídelní události mi- 1110 hlavní těžiště obytných areálll; (b) vytvořil se 100m široký pás plynu lého přechodu mezi polygony s hodnotou I (tj. polygony s výskytem uálezll) a okoln ím prázdným prostorem a (c) došlo k propojení buněk vzdálených až 200m do větších polygonů s nenulovými hodnotami. Po každé filtraci byly automaticky odstnulovány ty nově obsazené bUllky mapy, které překračovaly hranice, které pokládáme z hlediska archeologických areálll za omezujíci (bylo zabráněno, aby se polygony nenulových hod not rozrllstalya spojovaly pt-es vodní tok; obr. 2 nahoře). Takto upravené mapy poskytují odlišn)' obraz osídlení než pouhá mapa výskytu nálezll. Interpolovaná rnapa je sice stále závislá na reprezentati vnosti vstupních dat, j sou v ní však potlačeny ná· hodné faktory v uspořádání nálezů a je odhadován význam každého bodu v krajině na zák l adě jeho prostorového vztahu k známým areállnn v plynulé škále souvislého povrchu hodnot. 11.6 Příklady 11.6.1 Příklad]: Kontinuita obytných areál ů ledním z cílll výzkumu bylo sledovat vzájemný vztah mezi areály jednotlivých pravěkých období a vysvět l ení tohoto vztahu jako určité zákonitosti vývoje pravěkého osídlení. Interpolované (filtrované) mapy osídlení umožňují provést korelaci mezi jednotlivými mapovými vrstvami. Mapy sledovaných období byly korelovány procedurou peCI (principal component analysis), v níž je stanovení kore lačních koeficientli j edním z vedlejších výsledkll (spolehlivost této procedury byla zkontrolována i převodem buněk mapy do databáze a výpočtem kore lačních koeficientll pomoci statistického balíku SPSS). Procedura peCI určuje kore lačn í koeficíent mezi všemi dvojicemi mapových vrstev n" zák ladě porovnání hodnot v polohově korespondujích bllllkách celé mapy; výběr buněk zahrnut)'ch do analýzy však lze omezit maskou). Získané korelační koeficienty j sou obsaženy v tab. I. BR.ML BR.PO HALSTA LATEN RIM [JR_ML 1.00 0.66 0.25 0.26 0_13 BR.PO 0.66 1.00 0.35 0.43 0_ 13 HALSTi\ 0.25 0.35 1.00 0.53 0_13 LATEN 0.26 0.43 O_53 1.00 0.18 RIM 0.13 0.13 0.13 0.18 1.00 Tab. 1. ProstorovÍ'! korclflce osídlení v obdobích mladší doby bronzové nž doby fímské. Na základě kore lačnich koeficientll můžeme formu lovat něko lik závěrl!: (a) Osídlení všech sledovaných období vykazuje silnou prostorovou korelaci, neboť všechny kore lační koeficienty jsou statisticky významné, a to na hl adině významnosti 99% (hladinu významnosti zde však nelze brát jako pevný statistický "daj, neboť vstupní data byla mod ifikována interpolací). Silnou prostorovou korelaci map lze vysvětlit obdobnou polohou pravěkých obytných areálll v dlouhodobém časovém měřítku , tj. jako dlouhodobou stabi litu vyšších sídelních celkll, sídelních areálll. (b) Hodnoty korelačních koeficientll ukazují urč itou zákonitost. Patrný je zejména fakt. že nejs ilnčj ší korelace existují vždy mezi kulturami chronologicky nejbližšími, přičemž s chronologickou vzdáleností hodnota koeficientů klesá_ Tuto skutečnost lze nejlépe vysvětlit specifickým charakterem mobility obytných areálll. Obytné areály byly z1'ejmě periodicky pi-emisťovány na krátké vzdálenosti, zřejmě do bezprostřed ního sousedství areillll opouštěnýc h_ Tento proces mohl mít podobu v íceméně náhodného (nesměrova n ého) 180 pohybu, při kterém se postupně přemisťovalo i těžiště, kolem kterého posuny jednotl ivých pravěkých usedlostí oscilovaly. Příčinu, proč vzájemně korelují, byť mnohem slaběji, i chronologicky vzdálenější období, lze hledat v relativně malé ploše lIzemí, které bylo k dispozici jedné pravěké komunitě (sídelní areál). Plocha, po které se obytné areály jedné komunity mohly pohybovat, byla omezená, a proto muselo docházet i k prostorovým prllniklu11 obytných areálů vzdálenějších období; z hlediska čistě pravděpodobnostního však k těmto prúnikllln muselo docházet méně často, cožje patrné z korelačních koeficielltÍl. (c) Hodnoty korelačních koeficientll naznačují, že podle míry vzájemné korelace lze sledovaných pět období rozdělit do tří skupin. Hodnoty korelačního koeficientu nad 0.5 ukazuje dvojice mladší d. bronzová - pozdní doba bronzová a dvojíce halštat - latén. Kultury každé z těchto dvojic mají vllči kulturám Z druhé dvojice korelaci vždy poněkud slabší (0.25 - O.4J). přičemž korelační koeficienty všech těchto kultur ve vztahu k době římské jsou shodně ještě nižší. Prokázat tuto strukturu statisticky by bylo obtížné, neboť všechny korelační koeficienty jsou ještě v rozmezí statisticky významných hodnot, nicméně však na tomto základě mllžeme formulovat hypotézu, že prostorové uspořádán í pravěkých arcálll odráží tři širší fáze vývoje: (a) mladší a pozdní doba bronzová, (b) doba halštatská a laténská a (c) doba římská), jejichž vnitřní prostorové vazby jsou s ilnější než vazby vůči kulturám ostatním. 11.6.2 Příklad 2: Počet a rozsah sídelních areál ů Proceduru pca (principal component analysis) lze použít nejen k výpočtu korelačních koeficientll, ale i k provedení vektorové syntézy (faktorové analýzy) mapových vrstev. Tímto postupem lze zj istit hlavní osy variability prostorového uspořádání pravěkého osídlení a vytvořit mapyfok/orových skóre, které lze interpretovat jako mapy významnosti prostoru Z hlediska dlouhodobého vývoje sídelní struktury (základními pojmy, týkajícími se této metody, se nebudeme zabývat, nebot' jsou vysvětleny lIa jiném místě tohoto svazku; Neustupný 1996c). Jelikož procedura pca v GIS IDRISI má některá vážná omezení (neumožňuje např. omezit počet vypočítávaných faktorll a rotaci faktorll), doporučujeme k takovým úkolíll11 použít GIS v kombinaci s jiným statistickým programem (v našem případě šlo o SPSS 6.1; tuto metodu viz též Neustupný 1996b; Neustupný a Venclová 1996). Postup probíhal v následuj ícíeh krocích: (I) Sjednocením všech sledovaných mapových vrstev (overlay) byla vytvořena souborná mapa, v níž byl každé bllllce s nenulovou hodnotou přiřazen vlastní identifikátor (celkem 6218 buněk). (2) V databázovém systému dBASE IV byla vytvořena databáze, v níž počet záznamů odpovídal počtu nenulových buněk souborné mapy a počet polí počtu sledovaných map (plus jedno pole, obsahující identifikátor bllllky). (J) Procedurou dbidris byly do příslušných polí databáze přeneseny hodnoty z jednotlivých (interpolovaných) archeologických map. (4) Databáze byla podrobena analýze hlavních komponent v balíku SPSS 6.1, přičemž pro každý z významných faktorů a každou buňku mapy bylo vypočteno faktorové skóre a při"azeno k databázi jako další pole. Na základě zvážení vlastních čísel faktorů byly nakonec extrahovány tři faktory, které celkově vysvětlují přes 80% variability daného datového souboru. Faktorové koeficienty těchto tří faktorll ukazují zřetelně základní strukturu prostorových vztahÍlmezi jednotlivými kulturami a rozdělují je do tří hlavních fází, naznačených již korelačními koeficienty v předchozím příkladě: (a) mladší a pozdní doba bronzová, (b) doba halštatská a laténská a (c) doba římská. Tento výsledek souhlasí s výsledkem získaným pouhou korelací map, na rozdíl od korelace však vektorová syntéza více zdůraznila rozdíly v prostorovém uspořádání (tab. 2). 181 Faktor vlastní číslo % variabí líty kUlTIu1.% var. I 1.99 39.8 39.8 2 1.12 22.4 62.2 3 0.98 19.7 81.9 4 0.54 10.8 92.7 5 0.36 7.3 100.0 Rotovaná matice faktorů' mapa faklor I ("klol' 2 faktor 3 BR.ML 0.92 0.01 0.02 BR.PO 0.85 0.28 0.00 HALSTA 0.12 0.84 0.00 LATEN 0.11 0.85 0.05 RJM 0.01 0.04 0.99 Tab. 2. Pupis raktorů, 7.:ii ~lěnýc h vektorovou syntezou. (5) Hodnoty faktorových skóre byly pomoci dbidris a assigl/ přeneseny zpět do GIS, kde z nich vzníkly samostatné mapové vrstvy. Faktorová skóre při řazují každé blllke mapy statistickou významnost z hled iska jednoho ze tří faktorll. Ze statistického hlediska jsou za signifikantní považována faktorová skóre větší než 1.00; tyto plochy mohou být z map faktorových skóre vyjmuty jejích reklasifikaci (rec/ass). Místa s faktorovým skóre větším než 1.00 mllžeme považovat za prostorové celky, ve kterých je objektivně prokázána vysoká intenzita osídlení některého z období, charakteristického pro urč itý faktor, případně souběh osídlení několika (v případě našich faktorů něj výše dvou) charakteristickj'ch období. Nejpravidelnější strukturu ukazuje uspořádání těchto ploch v prvním faktoru, typickém pro mladší a pozdní dobu bronzovou (obr. 2 dole); na jeho zák l adě mllžeme proto nejlépe formulovat nčkolik obecn)'ch závěrů: (a) Zjištěné faktory sdružují vždy následná archeologická období, což do značné míry nezávisle potvrzuje smysluplnost výsledkll vektorové syntézy. Plochy s vysokým faktorovým skóre mlržeme považovat za dlouhodobě využívané obytné areá ly, v nichž došlo k nadprllměrné kUl11ulaci síd lištn ích pozllstatklr. Tato místa 1110hla představovat jakási těžištč sídlištních aktivit v delším časovém úseku, jádra sídelních areálll. (b) Všechna zj ištěná jádra síd leních areállr jsou vzájemně výrazně oddě l ena, a to buď prázdným prostorem nejméně 850m, ncbo vodním tokem. Z toho mllžeme usuzovat, že každé ze zj ištěných jader od povídá samostatnému sídeln ímu areálu. (c) Jelikož většina jader zahrnuje nálezy obou období, typických pro daný faktor (\j. mladší i pozdní doby bronzové), mllžeme je považovat za jádra sídelních areálů souběžně existujících pravěkých komunit (nikoli v v)'sledek posunu sídelních areálll během daného časového úseku). Zji štěný počet jader proto s vysokou pravděpodobností reprezentuje počet pravěkých komunit, obývajících dané územÍ. (d) Jádra sídelních areálů vykazují jasnou tendenci k u rč itému shlukování, a to buď ve dvoj icích na proti lehlých březích vodních tokl', nebo ve větších shlucich na soutocích. Vodní toky tedy tvořily přirozené hranice sídelních areálll, avšak umístění obytných areálll sledovalo snadnější komunikaci mezi sousedními komunitami . Zajímavé rovněž je, že podobné uspořádání mají v něktelýc h částech území i současná sídla, navazující na síť sti"edověkých vesnic. (e) Umístění jader sídelních areálů naznačuje, že obytný prostor byl v rámci teritoria kOl11unity (sídelní areál jako celek) situován excentricky a výrobní areály (pole, pastviny, využívaná část lesa) byly převážně umístěny vždy jen najedné straně vodního toku. 182 Obr. 2 na hoře: Interpo lovaná mapa nál ezů mladší doby bronzové. Svčt l e šedé po lygony: hustota 0.0 I~0 .2 : tmavošedé polygony: 0 . 2 ~0.6 ; (;erné polygony: 0.6-1.0 sídelní události na člverec (buňku) mapy. Dole: Mapa hlktorov)'ch skóre faktoru I. Bílá: skórc mcnší než ~0.5 (tj. plochy pro I"nktor I spíše atypické a velm i atypické): světl e šedá (pozadí): skóre -0.5 až 0.5; tmavošedá: skóre 0.5 až 1.0: černá: skóre včtší ncž 1.0 (plochy typické pro faktor I). 183 o ... o , o ( ( j ,/ / .--...J Obr. 3 nahoře: Mapa Thiesscnových polygonú kolem sídelních jader faktoru I (mladší a pozdní doba bronzová). Prilzdné čtverce představují pravděpodobná jádra dalších sídelních areálú. Dole: Rekonstruované sídelní areály mladší a pozdní doby bronzové. Šedé čtverce předslavují pravděpodobná jádra dalších sídelních areálú. 184 Pomoci některých procedur GIS mllžeme sídelní areá ly modelovat: ( I) Procedurou /hiessel1 nebo alloca/e vytvoříme kolem každého z jader plochu tzv. Thiessenových polygonu. Thiessenovy polygony přiřazuj í každý bod mapy tomu výchozímu prostorovému objektu, k němuž j sou nejblíže (obr. 3 na hoře) . .(2) Takto získané Thiessenovy polygony byly omezeny předpokládaným i areály dostupnosti, vypočtenými pro jádra sídelních areálll. Areály dostupnosti byly zkonstruovány j ako plochyo po lo měru 1000m, které nesměly překročit vodní toky. Předpokl ádané sídelní areály (celkem 25) j sme detinovali prllllikem obou výše zm íněných map (obr. 3 dole). Každému sídelnímu j ádru byla tedy při psána plocha buněk, které (a) j sou situovány danému júdru blíže než kterélllukoli z jiných jader; (b) jsou v okruhu 1000m od daného jádra; (c) leží na stejném břeh u vodního toku jako dané sídelní jádro. U takto definovaných sídelních areálll byly změřeny jejich plochy (area), shrnuté v tab. 3 (minimulll bylo 45 ha, maximum 202 ha). Plocha sídelních areáW (ha) Počet areál" < 50 I 5 1-100 4 10 1-1 50 12 15 1-200 6 > 200 I Tab. 3. Plocha sideln kh areMII mladší a pozdn i dohy bronzové v mikriorcgionu Vi nořského a Mratínského poloka. Z tab. 3 vyplývá především pmvidelnost v rozmístění sídelních jader mladší a pozdní doby bronzové, bez které by j ednotl ivé sídelní areály nemohly nabývat plochy O tak standardn í velikosti. Zárovel] vel ikost předpok ládaných areáltl odpovídá modelu, nedávno form ulovanému D. Dreslerovou (1995). Dreslerová předpokládá, že se prtllllěrná komunita v mladším pravěku skládala zhruba ze čtyř domácností. Taková komunita potřebovala zhruba 2 ha obytné plochy, 4 hektary polí a 20 ha lihoru, I ha pastvin a 60 ha lesa jako zdroje pal ivového a stavebního dřeva a zdroje krmiva pro zimní krmení dobytka. Dále Dreslerová uvádí, že při tomto zpÍlsobu čerpání přírodních zdrojtl nedochází k trvalému narušení ekologické rovnováhy krajiny; takto uspořádáné sídelní areály proto mohou být víceméně stabilní během dlouhého období. Naše výpočty před l ožený model jasně potvrzují. Pouze tři sídelní areály j sou menší než u váděná kritická mez (87 ha); i v těchto případech však existuje kolem sídelních areálll ještě u rč itý práz.dný prostor, který komun ita mohla využít za předpok lad n mírného zvětšení okruhu svých aktivit nad odhadnutou mez 1000m. 11.6.3 Příklad 3: Vztah obytných areálů ke krajíně Přestož.e prostor sídelních areá ltl byl poměrně omezený, poskytoval pravěkým komunitám příležitost vynžít krajinné prostředí rÍlznými zpÍlsoby. K aspekttlln variabilního využití krajiny patřilo i um ístění vlastn ího obytného areálu, které odráželo jak faktory ekonomické, tak společenské a symbolické. Základem zkoumán í těchto aspekttl byla poloha sídelníchjader, definovaných v mapách faktorových skóre jako plochy s hodnotou větší než 1.00. Tyto mapy odpovídaj í třem faktortll11, získaným vektorovou syntézou. a představuj í hlavní obytné areály tří širších období: mladší a pozdní doby bronzové (faktor I; 25 areá ltl), doby halštatské a laténské (faktor 2; 3 1 areáltl) a doby římské (faktor 3; 17 areáIÍl). Na tomto místě se budeme zabývat rozborem dvou aspektllj ej ich polohy: vzdálenosti od vodního toku a vztahem k rel iéfu kraj iny. Závislost polohy pravěk)'ch obytných areáltl na vodním zdroji není třeba zv l ášť prokazovat; v našem příkladě proto šlo pouze o stanovení přesnějš ích kvantitativních parametrů. Vodní síť byla digital izována podle souča sn ého stavu, opraveného na základě map I. vojenského mapování z konce 18. stol. Procedurou distance byla vytvořena mapa vzdáleností od nejbližšího vodního toku (obr. 5 barevná pří loha) a z této mapy byly extrahovány (ex/racI) prtllněrné hodnoty pro každé ze sídelních jader jednotlivých období (faktorů). Souhrnný výsledek ukazuje, že více než 90% sídelních j ader bylo 185 ------------------------------------------------------ situováno ve vzdálenosti nálezll jednotlivých obdo hodnoty ukazuj í, že jedn výskyt má však chal·akte byly významné. do 300m od vodního zdroje. Podobným způsobem byly zpracovány i mapy bí; celkové součty sídelních událostí zahrnuje poslední sloupec tab. 4. Tyto otlivá pravěká sídl i ště se mohla vyskytnout i ve vzdálenostech větš ích ; tento r spíše náhodný. Rozdíly mezi jednotlivými chronologickými obdobími nelá vzdá-Prúměn lenost (m) 0- 100 100- 200- 300- 400- 500- 600- 700- 800- >9 200 300 400 500 600 700 800 900 00 celkem Počet sídelních jader faktor I faktor 2 faktor 3 celkem událostí 3 9 4 337 17 14 9 654 4 3 3 245 - 2 I 92 I 3 - 49 - - - 6 - - - 2 - - - I - - - - - - 5 25 31 17 1391 Tab. 4. Vzcl{l lcnost obytn)rch arcÍllťl od vodního 7..drojc. ·ímavých geografických parametrll umístění areálll se jeví jejich vztah k ver-Jako jeden ze zaJ tikálnímu členění krajiny ostrožny, okraje teras ap Při sledování tohoto asp digitální mapou, která vz vrchu, ve kterém je každ příloha). DEM je základ funkcím G IS, např. mapy rozměrné ortogonální viz . Je známo, že některé kultury pravěku preferovaly místa vyvýšená, např. od., jiné naopak údolní dno nebo spodní partie svahů na samém okraj i nivy. ektu jsme vyšli z digitálního v);škopisného modelu krajiny (DEM). DEM je niká interpolací vrstevnicové mapy nebo bodových měření do souvislého poé blllke přiřazena vypočtená hodnota nadm ořské výšky (obr. 6 - barevnú em řady dalších mapových vrstev, jejichž vytváření patří ke standardním sklonu svahu, orientace svahu, areálu dohledu, povodí atd., a slouží i k trojualizaci vybraných úsekll krajiny (ar/ho). kopisného modelu v rastru IOx IOm jsme vytvořili mapy převýšení, které sta-Z digitálního výš novuj í výškový rozd í\ m Mapy převýšení byly získ czi každou z buněk mapy a úrovní údolního dna nejbližšího vodního tokll. ány následuj ícím zPllsobem: ořské výšky terénu (DEM) byly vyříznuty linie, polohově odpovíd'Uící vodj. nejhlubším místluH údolních den. Tyto linie byly interpolovány (intereoll) (I) Z mapy nadm ním tokllm, t do souvisléh nou proložen obr. 4 dole). o povrchu stejným zPllsobem jako vrstevnicová mapa, čímž byla celou krajia rovina, spojující místa lokálně nejmenší nadmořské výšky (vrstva BÁZE: ch tokll byla konstruována linie, spojující nejvyšší hodnoty nadmořské výšky(2) Kolem vodní v oblasti užív Tato linie by nosti 500m o vzdálenosti m pokud rozvod ané pro obytné areály, tj. v prostoru do vzdálenosti 500m od vodního tokll. la definována jako vnější okraj plochy prlllliku povodí (wa/ershed) a vzdáled vodního toku. Linie byla totožná s rozvodím potokll, pokud probíhalo ve enší než 500m od potoka, nebo s izolinií 500metrové vzdálenosti od potoka, í bylo vzdálenější (obr. 4 nahoře). yla vyříznuta mapa nadmořské výšky (DEM) a získané hodnoty byly inter-(3) Touto linií b polovány do v prostoru vh (4) Aritmetickým pa relativníh souvislého povrchu, představující rovinu nejvyšších nadmořských výšek odném pro umístění obytných areá lli (vrstva HORIZONT; obr. 4 dole). i operacemi (overlay) s těmito vrstvami byla získána mapa Pl'evý.,ení a 11/0o p1'evýšení nad nejbližším vodním tokem. Mapa převýšení zobrazuje rozdíl 186 ""I "" v nadmořské výšce mezi každou bllllkou mapy a úrovní nejbližšího údolního dna (v metrech); mapa relativního převýšení udává převýšení každé bllllky jako poměrnou část největšího možného převýšení v dané části mapy. Provedené operace jsou objasněny v následlij ících vzorcích: PŘEVÝŠENÍ = DEM-BÁZE RELATIVNÍ PŘEVÝŠENÍ = PŘEVÝŠENÍ/(HORIZONT-BÁZE)* I00 IIORi20NT -PŘEvÝŠEN/ : _ ._. -----",_._._.-::".,.. _~ >7Si- SO-1S1- 25 -SO;l. 0- 2S-1- J?ELArWN!~ 7"Ř-EVÝ.šFNI' ObL 4 nahoře: Povodí Vinořského potoka. vypočtené z digitálního v)'škopisného modelu (šedá plocha). Černou linií vyrne~ zena vzdálenost SOOm od potoka. Dole: Schéma konstrukce mapy převýšení a m 20 m - 4 Počet sídelních jader Relativní převýšen í faktor I faktor 2 faktor 3 0 - 25 % 3 10 II 25 - 50 % 6 5 5 50 - 75 % 6 7 - 75 -100 % 10 9 I celkem 25 3 1 17 Tab. 5. Absolutní a relativní převýšení sídelních jader nad ncjhližším vodním tokem. Mezi oběma částmi tabulky existuje sice základní shoda, avšak i rozdily, které dokumentují v)'še uvedené p'·edpoklady. Jedn označné preference vůč i nej níže položeným částem kraj iny pozorujeme u faktoru 3 (doba římská). Malé absolutní převýšení je v tomto případě spolehlivým indikátorem vztahu areáll, tohoto období vi,čí údolním dnům a spodním částe m svahil. Tuto závislost se dosavadní bádání často pokoušelo vysvětl it např. sušším charakterem klimatu nebo zájmem situovat obytné areály co nej blíže vodního toktl. Klimatické vysvětlení je zde však nepřesvědč ivé, neboť u ma lých vodních toki, ve sledovaném lIzemí nemohlo docházet k větš ím záplavám při j akýchkoli výkyvech klimatu a kromě toho vid íme, že ve stejných polohách jsou situovúny i areály jiných období, byť ne tak často. Sama vzdálenost od vodního zdrqje není také argumentem, neboť ta se v zlísadě u areáli, ri,zn)'ch období neliší (tab. 4). Rozptyl areáll, dalších dvou faktori, ukazuje na užitečnost měření převýšen í oběma uvedenými způsoby. Zatímco na základě absolutního převýšení by se mohlo zdát, že tendence zaujímat nejvýše položené polohy je nejsiln ěj š í u faktoru 2 (doba halštatská a laténská), vztah k re lat ivn ímu převýšení přip i suje tuto tendenci nejvýrazněji pro faktor I (mladší a pozdní doba bronzová). Zejména v mladší a pozdni době bronzové tedy mi,žeme předpokládat, že obytné areály byly záměrně situovány do míst v rámci dostupné plochy nejvýše položených; pro dobu halštatskou a laténskou je tento záměr m éně průkazný. Halštatské a laténské období (faktor 2) ovšem charakterizuje určitá dvoj značnost, neboť jejich areály jsou n ejpočetněj i zastoupeny v obou krajních polohách. Tento fakt odráží zřejmě 188 vztah halštatského období k ostrožnám (na kterých se často vyskytuj í i nálezy laténské), ale zá rovel] i k poklhám na okraj i údolní nivy, kde často předjímá areá ly laténského a římského období. rr-eslol.c rozdíly mezi jednotlivými obdobími ve vztahu k převýšení jsou nesporné, z{tvnŽI1)'1ll problémem je prokázán í intenc ioná ll1osti umístěn í areálll v každém ze sledovan)'ch období. Zámě rnost v poloze sídelních jader IBllžellle prokázat. porovnúl1lc-li j ejich pozorované rozdělen í v jednotlivých kategoriích převýšení s rozdě l ením ..očekávaným" . Za "očekávané" múžeme považovat takové rozdčlení, které by vzniklo při náhodném umístění síclelnkh jader do krajiny: četnosti výskytu sídelních jader v jednotlivých třídileh p"evýšen í by pak odpovídaly plošnému rozsahu těchto md. U rč itým probll'mem je zde ovšem vymezení celku, definujícího rozsah a vzájemný poměr jednotli \'ých tI·ícl. Za potcnc i idně osid litelný prostor m ůžeme považovat pils podél vodn ích tokll do vzdillenosti 300m ncbo 500", (tab. 4). Plochy, odpovídaj ící jednotlivým úrovním relat ivního převýšení v takto definovaných celcích, ukazuje tab. 6: K ateoori e Pás 300m (km2) Pils 300m (%) Pás 500m (km2) Pils 500",(%) 0 - 25 % 28.61 40.96 32.61 3 1.48 25 - 50 % 15.06 2 1.56 18.45 17.8 1 50 - 75 % 14.06 20.1 3 23.56 22.74 75 - 100 % 12.12 17.35 29.02 28.0 I celkem 69.85 ===r~.~10~0~.0~O____~~I O~3~.6~4____~__9~9~.9~9__~ Tab. 6. l ~o7.sah ploch s r(l zn~'rn relativním pi"ev)'šenílll nD-d nejbli7.Šíll1 vodním tokem. Na zák ladě celkového počtu sídelních jader v každém období a procentuálního zastoupen í tnd převýšení ml'lžcme stanovit "očekáva né" četnost i výskytu areú l" (např. u faktoru I je očekávané rozdělen i arcÍllli cca 10,5,5,5, zatímco pozorované rozdě l ení j e 3, 6, 6, 10). Statistickým testem ehíkvadrát milžcme vypočítat, s jakou pravděpodobností je teuto rozdíl v)'sledkem náhody, resp. u rč itého zr1 mčru v sídelním c.hován í. Rozdělení areáhol faktoru I je jasll ě lIenáhodné, vezmeme-li j ako základ plochu pásli do 300m (pravděpodobnost náhody j e I1Icnší než 0.5%); v nimci širšího pásu, v němž podstatně narlls1.á plucha s nej větším p"evýšením, j e pravděpodobnost náhody větší (10-25%). U sídelnícll jader faktoru 2 je záměrnost lIspoř?dání neprokazatelná. II faktoru 3 je naopak velmi pravdčpodobná, a to v obou případech. Z uvcdcného přík ladu mližcme uzavřít, že během sledovaného období dochází k významné 7.měně sídelního chování. Třebaže rozsah osídleného území se během celého období víceméně nemění, dochá7.í v rámci sídelních areálel k nenáhodným pOSUnell11 obytných j ader, případně i k d í lčím posun,un sídelních areá lll (např. na druh)' břeh vodního toku apod.). Na konci doby bronzové mllžeme sledovat výraznou prelerellci relativně nejvyšších poloh v dostupné krajině. Tato tendence je patrn;' i ve starších obdobích pravčk u (eneolit, starší doba bronzovil) a mMe mít n ěko lik příčin: od potřeby vizuální kontroly co největ š í čilsti sídelního areálu (polí apod.) po dllvody symbolické. Nej méně pravděpodobné se zdá vysvčtlení strategickými dllvody, neboť rak by bylo nelogické, proč právě v obdobích, kdy mobilita populací a možnost vzájemných střetli zřej mě rostou (halštat. laté.n, řím), dochází k opou št čn í takto siluOV8n)/ch areáll!. Ke změně sídelního chov"ní dochilzí postupně, v prllběllll doby halštatské a laténské, př ičemž jasně odl išné principy výběru obytného areálu zji šťuj eme až v době římské. Zdá se, že ani v tomto období nejde o pouhé vymizení jakéhokoli (ekonomického nebo symbolického) v)'znamu, který poloze obytného areálu připi sovaly p"edchozí pravěké kultury (což byla pilvodní hypotéza, srov. Kuna a Aclelsbergerová 1995; Ncustupný 1995b, 5 1), ale rov něž o určitý zámčr, jehož přesný smysl nám dosud un iká. Za zmínku ovšem stojí i to, ž.e na areály doby římské často navazují areály násled ných kultur, přinejmenším až do stl'ední doby hradištní. 189 11.7 Dodatek: Poznámky k vstupu dat do GIS a tisku map Do podoby digitálního obrazu lze geografická či archeologická data převést rllzným ZplISObem. Geografická data jsou reprezentována body (např. výškopisné kóty), liniemi (např. vodní s íť, vrstevnice) nebo polygony (sídla, lesy, typy plldy). Digitalizaci těchto dat je zpravidla nutno provést pomocí digitizéru, na němž je každý objekt mapy obtažen a uložen do paměti počítače i s přiděleným identifikátorem (hodnotou). Tento postup vyžaduje příslušné vybavení (d igitizér, software: v ARŮ Praha je k digitalizaci map používán PC ARC/INFO) a urč ité zkušenosti; pro archeologa je proto Včtšinou výhodnější, nechat si takové mapy digitalizovat na objednávku. Nejvýznamnější, ale i nejnákladněj š í geografickou mapovou vrstvou je digitální výškopisný model. Podklad pro vytvoření tohoto modelu lze nejlépe vytvořit vektorizaci tiskových podkladll Základních map (vrstevnic), které jsou k dispozici v Kartografickém úřadu v Praze (pro měřítka I:200000 až I: I0000), a to buď v tištěné podobě nebo v podobě digitálního obrazu sejmutého scannerem. Vektorizaci (~. převod ti štěného či naskenovaného obrazu do podoby vektorově zapsaných linií s příslušnými identitlkátory) může provést některá ze special izovaných firem. Vektorizace jednoho mapového listu ZM I: I0000 (s vrstevnicemi v intervalech 2m) stojí, i s poplatkem za použití mapového díla, cca 2000-4000.- Kč. Jelikož Kartografický Mad sám také provádí podobnou vektorizaci Základních map, bude zde možné v příštích letech zakoupit j iž hotový DEM (nebo vektorizované vrstevnice jako podklad k němu). Vektorizaci vrstevnic z map I:25000 (vrstevnice v intervalu 5m) pro území celé republiky parale lně provádí i Vojenský topografický ústav v Dobrušce; i zde bude v budoucnu DEM k dispozici. Z týchž institucí lze získat i tiskové podklady, případně již hotové digitální mapy jiných geografických prvkll (vodopis, komunikace, síd la, lesy apod.). Pořízení těchto mapových vrstev je méně nákladné než získání DEMu. Digitalizace archeologických dat je většinou snazší a může být bez větš ích problémll provedena archeologem. Výchozím tvarem dat je databáze archeologických nalezi šť (akcí), ve které je každému nalezišti (akci) přidělen jeden nebo někol ik párll souřadnic, definujících jeho polohu a tvar. Podobné databáze na archeologických pracovištích již běžně existuj í a mohou být tedy, po provedení obsahové revize, víceméně rovnou převáděny do GIS. Poloha archeologických nalezi šť je zpravidla vyjádřena r"znými typy souřadnic, např. v systému JTSK, S-42, ve stupních zeměpisné š ířky a délky, nebo zpllsobem zavedeným v ARÚ Praha, udávajícím vzdálenost v milimetrech od západní a j ižní sekční čáry mapového listu Základních map. V současné době existují konverzní programy, které umožllují vzájemně převádět všechna z těchto prostorových určení. Uživatel tedy mllže zvolit kterýkoli ze souřadnicových systém" a do něj převést prostorová určení všech nalezišť; pracovat však samozřejmě lze i v li bovolně jinak definované souřadnicové síti (např. při řadíme-I i rohu zkoumaného území nulové souřadnice a vzh ledem k nim určujeme polohu každého naleziště). Z hled iska napojení archeologických dat na geografické "daje je ovšem nejvýhodnější použít některou z kilometrových sítí, jej ichž užívání je v ČR běžné (S-42, JTSK). Z databáze, která obsahuje jednotné prostorové určen í na lezišť, automaticky vytvoříme textový soubor, který lze procedurou arcidris převést do vektorového souboru v GIS IDRISI a z něj pak vytvořit rastrovou mapu (polyras). Textový soubor tohoto typu musí obsahovat identifikátor nalezi ště, počet bodlI, které (v případě nalezišť definovaných jako polygony) dané nalezi ště definují, a jejich souřadnice (tab. 7). V případě malých soubor" lze takový textový soubor vytvořit i ručně. Tištěné výstupy mapových vrstev zajišťuje v GIS fDRISI procedura painl, která komunikuje s barevnými inkoustovými tiskárnam i (např. řady Hewlelt-Packard). Protože tištěné barvy neodpovídají přesně barvám obrazovky, je zpravidla nutné (zejména při záměru reprodukovat ti štěnou mapu v publikaci) barevné odstíny pro tisk pečlivě zvolit a upravit. Barvy mapy jsou definovány jako kombinace tří základních barev (červené, zelené a modré), z nichž každá mllže mít intenzitu Oaž 63 bodlI. Skladba základních barev v jednotlivých barevných třídách I6stupllové škály palety IDRISI je ukázána v tab. 8. Stanovenim j iného vzájemného poměru základních barev (I DRISI pracuje buď se 16 nebo 256 barevnými třídami) modifikujeme odstíny barev mapy. Uživatel m"že definovat řadu vlastn ích barevných "pa lel", které lze uložit v počítač i jako samostatné soubory a které mohou (na obrazovce i při tisku) podle potřeby nahradit standardn í palety GIS fDRISI. 190 NAL BODY.TXT 10 3469000 5560000 I I 3469000 5559000 12 3468000 5559000 end NAL POLY.TXT 105 3469000 5560000 3469100 5560000 3469 1005559900 3469000 5559900 3469000 5560000 end II 5 34690005559000 3469100 5559000 3469 1005558900 34690005558900 3469000 5559000 end end Tab. 7. Formát textoví'ch sOl/borÍ! pro pf"evod databáze do vektorového souboru v GIS IDRISI. Soubor NAL_BODY.TXT vymezuje na l ezi ště jako body. Prvním číslem v každém řádk u je identifikátor (číslo) nal eziště, následuji souřadnice X a Y. Souilldnice jsou udány v metrech. v síti S~42. Soubor je uzavřen řetězcem "cnd« na posledním řádk u . Soubor NA L_POLY.TXT vymezuje každé naleziště jako polygon (v daném případě čtvercc 100:\ 100m). Čísla na prvním řádku znamenají identifikátor nalezi ště ft. počet bodli, ktcr)'mi je n al ezi ště vymezeno. Následuj í řádky se souradnicemi jednotliv)/ch bodů obvodu polygonu (v daném případě rohů čtverce): první a poslední bod jsou vž.dy totožné. Každý polygon je uko n čen řetězcem "cnd": cel)' souborje u zavřen rětězcem ..end" na dvou řádc ích. Hodnota červená zelená modrá opis barvy O O O O černá I O O 23 modročerná 2 O O 47 tmavomodrá 3 O O 63 modrá 4 23 O 63 světle modrá 5 47 O 63 tmavofialová 6 63 O 63 fialová/rů žová 7 63 O 47 sv ět l e fialová 8 63 O 23 svět l e červená 9 63 O O červená 10 63 20 O hnědá I I 63 46 O okrová 12 63 63 O žlutá 13 47 63 O světle zelená 14 23 63 O zelená 15 O 47 O tmavozelená 63 63 63 bílá Tab. 8. Skladba barev 16stupňové škály v GIS IDRISI. 191 11.8 Literatura Allen K.M.S., Green S. W., Zubrow E.B. W. (eds) 1990: Interpreting space. GIS and archaeology, New York- London - Philadelphia (Taylor & Francis). Oreslerová D. 1995: A socio-economic model of a prehistoric micro-region, in: Kuna M., Venclová N. (eds), Wh ither archaeology? Papers in honour of E. Neustupný, Praha (ARÚ), 145- 160. Eastman .I.R. 1992: IDRISI, version 4.0, Worcester, Mass. (Clark University). Gaffney V.L., Stančič Z. 199 1: GIS approaches to regional analysis: a case study of the island of Hvar, Lj ubljana. Gojda M. 1993: Gafrney V. L., Stančič Z., GIS approaches to regional analysis: a case study of the island of Hvar, Ljubljana 199 1, Památky archeologické 84, 164- 165 (recenze). Kuna M. 1996: GIS v archeologickém v)'zkumu regionu: vývoj pravěké sídelní oblasti středních Čech, Archeologické rozhledy 48, v tisku. Kuna M. a Adelsbergerová D. 1995: Prehistoric location preferences: an application or GIS to the Vinořský potok project, Bohemia. In: Lock, G. a Stanč ič, Z. (ecls), Archeology and Geographical inťormat ion systems. London (Taylor & Francis), 11 7-13 1. Kvamme K.L. 1995: A view across the water: the North American experience in archaeological GIS. ln: Lock,G. and Z.Stančič (eds), Archaeology and Geographical Infonnation Systems: a European Perspective. London (Taylor & Francis), 1-1 4. Lock G. and Z.Stančič (eds), Archaeology and Geographical Infonnation Systems: a European Perspective. London (Taylor & Francis). Neustupný E. 1993: Archaeological method. Cambridge (CUP). - 1994: Předvídání minulosti Technický magazín 11 , 58-60. - 1995a: Beyond GIS. ln: Lock,G. and Z.Stanč i č (eds.), Archaeology and Geographical Information Systems: a European Perspective. London (Taylor & Francis), 133-139. - 1995b: Pravěk. Lidé v dějinách (učebnice pro 2. stupell ZŠ), Praha (Fortuna). - 1996a: Databáze nalezi šť okresu Chrudim, Archeologické rozhledy 48, 126-] 34. - 1996b: Polygons in archaelogy, Památky archaeologické 87 (v tisku). - 1996c: Syntéza struktur formalizovanými metodami (vektorová syntéza), v tisku. Neustupný, E. a Vencl, S. 1995: Formal melhods at Hostim. In: S.Vencl, Hostim. Magdalenian in Bohemia, Památky archeologické - Supplementum 4, 205-224. Neustupný E. a Venclová N. 1996: Využití prostoru v laténu: region Loděnice, Archeologické rozhledy 48, v tisku. 192 0-100 _ 100-200 _ 200-300_ 300-400_ 4()(h';()() _ 5()(H;()() 600--700 _ 70Q-800 lil 800-900 . 900-1000 l00G-l100 E] 1100-1200 0 1200-1300 0 1300-1400 _ CD Obr. 5.: Vzdálenost od vodního toku ( \' metrech). Bíle vyznačena sídelní jádra mladSi a pcmllli doby bronzo\é. Délka mč1ítka: 2 km. Obr. 6. Digitální vý§kopisný modcllizcmí (nadmořská v)'ška v mwcch). Délka mčWka: 2 km. 193 < 170 . 170-180 . 18G-190 • 190-200 • 200-210 _ 21G-22O . 220-230 II 230--240 ~ 240--2500 250-260 0 260-2700 >270 . Obr. 7. Mapa převýkn! (v metrech). BOými liniemi vyznačena jádra sídelních areálů mladší a pozdnl doby bronzové. Délka měřítka: 2 km. <>-3 •0-<3 •6-9 •9-12 •12- 15 •15--18 •18--21 •21- 24 24-27 EJ 27-30 O 3<>-33 O 33-<36 • Cl) >75% O 50-75% O 25-50% O 0-25% • Obr. 8. Mapa relativního převý~ení (v pr(l((:ntech). Černými liniemi vyznačena jádra sídelních areálů mladší a pozdní doby bronzovf!; (faktor I); čcrvenými liniemi jádra areálů doby římské (faktor 3). Délka měřítka: 3 km. 194 Statistika a archeologie 12. Statistická analýza archeologických dat (Zdeněk Weber) 12.1 Úvod Archeologická data mají značnou cenu danou jednak obvykle nákladným způsobem jejich získávání, jednak povahou potenciální informace v datech obsažené. Přirozeně tak vzniká značný tlak na kvalitu jejich analýzy. Pojem statistika říká něco jiného teoretickému matematikovi a úplně něco jiného pracovníkovi statistického úřadu. Minula doba velkých sálových počítačů, kde nad stohy skládaného papíru, potištěného výpisy programll a nepřehlednými výstupními sestavami se skláněli nejméně tři lidé. Matematik, který nerozuměl počítači, programátor, který nerozuměl statistice a odborník - zákazník, pro kterého se to všechno dělalo a který obvykle příli š nerozuměl ani jednomu ani druhému. Ten pak rozhodoval jako Werichův "pekařliv císař" - ... my mu nerozumíme, ale my mu věříme...a samozřejmě za to platil.Vznikly tak rozsáhlé knihovny matematických a statistických programll, pomocí kterých se buď ve zdrojovém nebo předkompilovaném tvaru přímo na místě sestavovaly konkrétní aplikace. S bouřlivým rozvojem malých osobních výpočetních prostředků se postupně ztrácelo výsadní postavení stati stiků a programátorll při analýze dat. Odborníci si uvědom ili, jak je pro ně samé výhodné, když si mohou zpracovat výsledky svých měření a výzkumů sami a také je graficky prezentovat. Vznikají firmy z vědeckých a výzkumn)'ch ústavů a univerzit, které vyvíjejí a prodávají statistický software nikoliv již univerzální, ale specificky oborově zaměřený. Na přelomu 70. a 80. let spolu s rllstem kvality hardware se projevuje výrazná diferenciace vlastností statistických programll, vyžadovaná trhem. Tehdy ale vzniká vážné nebezpečí, se kterým se u běžného software (např. textové editory) nesetkáme. Tímto nebezpečím je ve statistice nepoučený uživatel. Ten může snadno založit závažné rozhodnutí na základě : • volby nesprávné metody statistické analýzy, která poskytne nesmyslné výsledky, • nesprávné interpretace správných výsledkl!. Protože užívatelské manuály nebývají dostačující, je třeba věnovat pozornost základnímu statistickému vzdě l ání uživatelů. 12.2 Statistika pro archeology Pod pojmem statistika obvykle rozumíme vědu O zjišťování, zpracování a rozboru (hodnocení a výkladu) číselných údajů, shromažďovaných buď k popisu rozsáhlých souborll nebo k redukci rušiv)'ch odchylek, vyvolávaných náhodnými činiteli. Vypracovává metody založené na předpokladu, že zjišťované údaje jsou realizací náhodných veličin a že účelem je bližší určení neznámého parametru v jej ich rozdělovacím zákonu. Je založena na počtu pravděpodobnosti. Předkládaná skripta j sou předevš ím určena pos luchačllm archeologie, kteří nemají dostatečnou matematickou prllpravu, ale přesto budou potřebovat statisticky zpracovat a vyhodnotit velký objem kvalitativních i kvantitativních dat získaných excerpcí odborné literatury, z vlastních měření artefaktll , nebo z databází terénních výzkuml!. Cílem vedle pochopení podstaty statistických metod a smyslu jimi získaných výsledku, je také orientace ve výběru nejvhodnějších postupu a poznání počítačové podpory statistické analýzy dat pomocí standardního i speciálního software (viz navazuj ící stať). V současné době citelně chybí moderní počítačově orientovaná učebnice statistiky pro archeology. Ve větš ině dosavadních učebnic jde buď o • obecnou teorii statistiky aplikovanou převážně na soci á lně-ekonomické oblasti, nebo o • matematickou statistiku, tedy část matematiky, zabývající se úlohami ocenění charakteristik pravděpodobnostních rozdělení na zák ladě modelll náhodných pozorování. 197 Archeologl"n je dnes v době širokého využívání výpočetní techniky zapotřebí spíše znalostí z teorie analýzy dat - tedy speciálních částí aplikované statistiky, zabývající se • zpllsoby výběru, uspoMdání a formalizace obvykle vicerozměrných dat do datových soubonl a databázi, • metodamijeiich optimálniho zpracováni, • sprúvnou interpretaci a prezentací výsledkli. Sylaby minimálních znalostí ze statistických metod, plynoucích z těchto požadavkl': I. Základní statistická terminologie. Hlavní prostředky statistiky. Zdroje archeologických dat. Měření, stupn ice, data. 2. Jednorozměrné archeologické soubory. Základní operace s nim i. Statistické charakteristiky. Teoretická rozdělení. 3. Některá speciální rozdělení. Odhady parametrů a intervaly spolehlivosti. 4. Testování dat: testy významnosti, shody, extrémních odchylek,náhodnosti; testy parametrické a neparametrické. Vyrovnání dat. 5. Zobrazování a prezentace výsledků statistické analýzy. 6. Vícerozměrná archeologická data ajejich analýza. 7. Náhodné velič iny. Závislost funkční, statistická. Korelace. Kvalitativní data. Transfonnace kvantitativních znaků na kvalitativní. 8. Prostor znakl!. Archeologický prostor. Matice dat. Ověření nonnality. 9. Klasifikace, taxonomie, uspořádání. Transformace dat. 10. Míry vzdálenosti, podobnosti a rozptýlenosti archeologických objektů. I I. Seskupování objektl', cluste,y. Seriace. 12. Korespondenční analýza. 13. Shlukovací analýza. Dendrogramy. 14. Faktorová analýza. 15. Prezentace, věrohodnost a interpretace výsledkl' analýzy obsáhlých vícerozměrných archeologických datových souborů. Potřebné vědomosti lze získat z následujícího stručného v);běru studijní li/era/lIIY: Reisenauer, R.: Metody matematické statistiky ajejich apl ikace, SNTL - Práce, 1970 Hanousek, J., Charamza, P.: Moderní metody zpracování dat - matematická statistika pro každého (d isketa), Grada, Praha 1992 Ajvazjan, S. et al.: Metody vícerozměrné analýzy, SNTL, Praha 1981 Řehák,J., Řeháková,B.: Analýza kategorizovaných dat v sociologii, Academia, Praha, 1986 Hebák, P., Hustopecký,J.:Prl,vodce moderními statistickými metodami, SNTL, Praha, 1990 Fedorov-Davodiv, G.A.:Statističeskije metody v archeologij i, Vysšaja škola, Moskva, 1987 Rllnyon,R.P.:Nonparametric statistics. A cotemporary Approach. (ruský překlad: Spravočnik po neparametričeskoj statistike. Sovremennyj podchod), Finansy i statistika, Moskva, 1982. Ihm, P. et " I. :Statistik in der Archaologie, Archaeo-Physika, 9, Rheinland-Verlag, Koeln, 1978. Fletcher, M., Lock, G.R.: Digging for Nllmbers: Elementary Statistics for Archeologists, Oxfords University Committee for Archaeology Monograph, 33, Oxford, 1991. Baxler, M.J.: Exploratory Multivariate Analysis in Archaeology, Ed inburg University Press, Ed inburgh 1994. ČSN 010225 :Aplikovaná statistika.Testy shody empirických rozdělení s teoretickými (1981 ) ČSN OJ 0222 :Aplikovaná statistika. Testy odlehlosti výsledků pozorování ( 1980) ČSN Ol 0223 :Pravidla stanovení odhadů a konfidenčních mezí pro parametry normálního rozdělení (1985) ČSN Ol 0104 :Teorie pravděpodobnosti a apl ikovaná statistika. Termíny, definice, označení (1990) ČSN OI 0230 :Aplikovaná statistika. Analýza rozptylu ( 1988) 198 ČSN 010250 :Statistické metody v prl.myslové praxi (1973) ČSN OI 0252 :Statistické metody v prl.myslové praxi ll. Základní neparametrické metody ( 1975) ČSN OI 0253 :Statistické metody v prlllnyslové praxi III.Základní parametrické metody ( 1976) Některé poznámky k vybraným probléml.m statistické terminologie a některých postupů ve statistice používaných. 12.2.1 Prvek, znak, soubor, výběr, základní soubor Předmětem statistického zkoumání jsou hromadné jevy a to i takové, u nichž není hned patrna numerická podstata. Cí lem je pak vytvoření spoleh livých závěrů o povaze sledovaných jevl' na základě informací, obsažených v numerických údajích. Zkoumaný objekt v případě jednorozměrné analýry je zastoupen jedinou hodnotou, které obecně říkáme prvek. Skupina prvkl' tvoři soubor (statistický soubor). Ten musí mít některé vlastnosti, vyjadřující hledisko věcné, časové a prostorové, společné všem prvkí.m. Každý prvek, kterému chybí třeba jediná vlastnost, znehodnocuje statistický soubor, do kterého byl zařazen natolik, že již není vhodný pro sledování zkoumaného jevu. Vytýčení společných vlastnosti je základním požadavkem při vytvářeni statistických souborl'- Čím více je společných vlastností, tím více je sOl/bor homogennÍ. Další spo lečnou vlastností všech prvkú určitého souboru jsou vyšetřované vlastnosti. Všechny prvky musí mít aspo'l jednu sledovanou vlastnost, kterou nazýváme měřený znak Vedle toho mohou (ale nemusí) mit prvky ještě jiné vlastnosti, tzv. ostatní vlastnosti, jimiž se bliže nezabýváme, protože nejsou pro řešení našeho problému podstatné. Sledované znaky běžně dělíme na • kvantitativní, tj. znaky vyjádřené určitou hodnotou fYziká lni veličiny, zj išťované merením (tíha, rozměry, pevnost, počet střepí. jedné nádoby atd.) Předem nutno zvolit jednotky a přesnost měřeni (0,0 I mm; O, I kg). Všechny hodnoty je třeba uvádět jednotně, aby nikdo nemusel provádět další početní úpravy. • kvalitativní (např. barva nádob, druh hrobu, tvar nářadí), které seskupujeme do při rozených skupin (malované střepy, žárové hroby, kůlové jámy) a hodnotíme pomocí různých stupnic (škál): barevné spektrum, stupnice tvrdosti. • alternativní tj .znaky, které mají jen dvě možné obměny: celistvá x rozbitá nádoba, zachovalý x porušený skelet. Hodnota či kvalita sledovaného znaku se u jednotlivých prvkú souboru měnÍ. Znak je tedy veličinou proměnnou. Nelze-Ii na základě určité zákonitosti předem stranovit konkrétní hodnotu proměnné veličiny u daného prvku, je výskyt každé jednotlivé hodnoty proměnné velič iny dí.sledkem náhodného pí.sobení známých i neznámých vliv". Takovou proměnnou označujeme jako náhodnou veličinu (např. hloubka hrobu, jeho rozměry, tloušťka střepu). Pod le druhu informace, které nám znaky o zkoumaných skutečnostech poskytuj í a jaké úkony či operace 1Il11ožiíují, rozlišujeme: • nominální znaky - umožňují nám klasifikaci objekW • ordinální znaky - umožňují porovnání míry intenzity variant objektu • kard inální znaky - umož'lují číse lné vyjádření hodnoty existující varianty. Adekvátně pak dělíme i příslušné pojmy na klasifikační, komparační a metrické. Někdy se rozčleiíují znaky do tří kategorií podle toho, jak jejich varianty umož'lují používat matematické operace. Rozlišujeme pak znaky intenzivní (umožňující jejich klasifikaci) a znaky extenzivní (umožňující realizaci numerických operací). Mezi těmito krajnostmi jsou znaky inextenzivní. Ty neumožiíují numerické operace v pravém slova smyslu ( např. vysoký x nízký) , ale lze je vhodně transformovat (např. vysoký 10 cm x vysoký 5 cm) a pak realizovat vhodnou numerickou operaci. V praxi se setkáváme se smíšenými tříděními znaků na 199 • kvalitativní čili nominální: Pomocí ních lze roztříd it soubory (výběry, populace) do jednotlivých kategorií podle variant daného znaku.Varianty těchto znaki, však nevyjadřují míru přítomnosti (kvantity) znaku u jeho nositele. Neumožňují posoudit, zda nositel má daný znak ve vyšší míře či stupni než nositel jiné varianty. Uspořádání variant nominálních znakll je libovolné, neboť neznáme kriterium, dle kterého by se dal stanovit kvantitativní vztah mezi variantami, jejich vzdálenost, odstup atd. Z matematických vztahi, lze použít pouze identitu (=) a odlišnost (;"). Pro charakteristiku nominálních dat se nejčastěji používají deskriptivní statistiky (např.mod us - tj. nejpočetněj ší varianta; poměry početního zastoupení variant v souboru bud' v absolutnich hodnotách, v procentech nebo v indexových číslech) . Při vícerozlIlěmých znacích však existují postupy, kterými lze kvalitativní znaky promítnout do kvantitativní roviny. Používá se určitého hodnotícího hlediska, speciálních stupnic a pod. (Např. barvy se dají kvantitativně hodnotit pomocí frekvenčních spekter nebo vlnových délek). Nominální znaky podrobněji dělíme na: alternativní čili dichotomické - třídí znaky na dvě vzáj em ně se vylučující varianty; množné čil i polytomické - znaky s větším počtem variant. N utnou podmínkou je vyhraněnost a jednoznačnost variant (nesmí se překrývat). Každý prvek daného souboru miJže patřit jen do jediné varianty. • kvantitativní - dělené dále na : 1) pořadové č ili ordinální znaky, které se od nominálních znaků odlišují tím, že jejich varianty jsou uspořádané a to podle intenzity v nich obsaženého daného znaku. Od kardinálních znaki, se od lišuj í tím, že u jejich variant se nesleduje vzájemná vzdálenost, že velikost intervali, mezi nimi není stejná, ani známá resp. číselně vyjádřená . Ordinální znaky se dále rozdělují podle zpi,sobu, jakým se určuje pořadí jejich variant na: porovnávací (není žádná předem daná pořadová stupn ice, varianty se setřídí dle míry zastoupení (intenzity) v nich sledovaného znaku), z07'aďovací (předem se vymezí pořadí variant, tj. zadá se jej ich "stupnice"). Toto rozdělení ordinálních znaků je di,ležité pro volbu postupu při výpočtu míry statistické závislosti: pro porovnávací ord inální znaky se používá Kendalll'v koeficient~, pro zařaďovací ordinální znaky se použije Spearmanův koeficient pořadové korelace p. 2) číselné či li kardinální znaky- jsou měřitelné znaky, jejichž varianty lze uspořádat dlc pořadí, uvádět do číselně vyjádřitelných vztahi, - např. číselným vyjádřením velikosti intervali, nebo přímo číselnou hodnotou variant. Pro měření je zapotřebí měřicí soustava, která se obvykle přebírá hotová nebo se někdy musí vypracovat. Kardinální znaky se dělí na : il1tervalové a podílové. INTERVALOVÉ ZNAKY jsou takové kardinální znaky, které neoznačují jen celkové pořadí variant dle intenzity (stupně) znaku - což je typické pro pořadové znaky - ale přímo vel ikost intervalu mezi jednotlivými stupni znaku. Rozsah intervali, přitom nemusí být stejný. Umož"ují určit O kolik (o jakou číse lnou hodnotu) je jedna varianta znaku větší než jiná varianta. Neumož"ují však určit, kolikrát je tato varianta větší či menší než varianta druhá (cožje specifické právě pro podílové znaky!) Podle míry informace se tedy intervalové znaky řadí mezi znaky pořadové a podílové. Varianty intervalových znakl, dovoluj í počítat z nich aritmetické prlllněry (což není přípustné u znaki, pořadových! ) a další charakteristiky: rozložení četností, standardní 200 odchylku, variační koelicient. korelační koeficient mezi nárůstem jednoho a druhého intervalového znaku. PODÍLOVÉ ZNAKY se také někdy označují j ako ZNAKY POMĚROVÉ. Od intervalových znakll se odlišují tím, že jejich varianty se nevyjadf-ují v libovo lně stanovených stupních intervalových stupnic, ale j sou dané v číselných hodnotách soustavy, ve které j e známa přirozená nulová hodnota. Odtud název těchto znaků, protože jimi lze vyjádřit hodnotu jedué varianty jako podíl resp. násobek varianty druhé. Charakter podílových znakll m~j í i tzv. SYNTETICKÉ znaky, jej ichž hodnoty získáváme sumací znakll parciálních (např. jako součet pozitivních odpovědí na otázku přítomnosti či ne.přítomnosti (prescns - absens) jiných parciálních znaků. Zj ištěn í druhu znaku v konkrétních případech je důležité. Např. matematické vyjádření funkční závislosti y = x' je nepřípustné, nejde-Ii o podílové znaky! Vztahy podílových znakll k intervalovým j sou charakterizovány možností redukee podílových znakll na intervalové. tyto lze redukovat na pořadové a pořadové znaky pak redukovat na nominální. Tyto redukce býv1(jí někdy účelné, jestliže umožň ují jednodušší analytické postupy, úsporu času a práce. Opačný postup není možný. Nominální znaky nelze technicky transformovat na znaky pořadové, pořadové pak na číse lné. Druhy znakll nutno respektovat při výbčru metod zjišťování statistických závislostí. mezi nominálními znaky se statistická závislost určuje pomocí koeficientu kontingence. mezi pořadovým i znaky pomocí neparametrických me/od výpočtu koeJ1cielllu pořadové korelace, mezi kardinálními znaky pomocí parametrick)ích metod \~'}POčlZl koejic:;enlu korelace. 12.2,2 Indikátory a pravidla je.jich vJ'běru , Indikátorem rOl.llmíme takový znak, ježje vybraný z jiných znaků proto, že nejlépe odpovídá studovanému j evu, resp. jeho aspektu č i jedné složce, resp. vyjadřuje základní kvalitu zkoumaného jevu. Výbčr znakll a jejich volba za indikátory nesmí být jen intuitivní, ale spíše výsledkem uplatnění určit)'ch zásad: • je nutné soubor znakll přesně vymezit, zváži!jejich dllležitost a stupel] adekvátnosti, vyřadit ty znaky, jež j sou j iž obsaženy v jiných výrazněj i vymezených znacích. Z nich volíme indikátory. • Indikátory mají mít rozlišovací schopnost, tj. jejich přítomnost či nepřítomnost má vyjádřit mimo jiné i to, zda daný jev patří do kategorie zkoumaných č i nikoliv. • u s ložitěj š ích jevll, které nelze výrazně vymezit a sledovat pomocí jediného znaku jako indikátoru, volíme více tzv. parciálních indikátor", ze kterých se potom skládá tzv. syntetický indi- kátor. • pi'i vo lbě indikátorlr se dává přednost znaklrl11 s empirickým významem, tj. znakllm jež vyjadřují "nejjednodušší určení" , tedy v hierarchii "všeobecné - zvláštní - jedinečné" tomu poslednílllu POjlllU - j edinečnému. • dáváme přednost indikátorlllll, j ejichž varianty vyhovuj í požadavku kvantitativního zji šťování zm ěn a projevll - např. formou měj"cni. • dáváme přednost znaklrll1 ordinálním před nominálními, dále znakllm kard inálním pl-ed ordinúlními resp. nominálními, dále potom znakllln podílovým před intervalov)/llli. V ana lýze j ednorozměrných dat j sou dlrležité statistické charakteristiky, podavaj ící informaci o studovaném datovém souboru. Jsou to : • charakteristiky polohy - aritmetický prlrměr (bývá někdy ovl ivňován krajními naměřenými polohami) a proto se používá median, • charakteristiky rozptýlení - rozpětí, rozptyl, směr.odchylka, variační koeficicnt. 201 Nezanedbatelné jsou také lesty významnosti, kte!ými řeš íme problémy ověření určitého předpokladu např. zda zkoumaný výběr pochází ze základního souboru s určitým rozdě lením, zda od lehlá hodnota je dúsledek hrubé chyby měření atd. Obecný postup vyžaduje: • volbu hladiny významnosti, • formulaci nulové a alternativní hypotézy, • volbu testovacího kriteria a • interpretaci výsledkl!. Druhy testll: jednostranné x oboustranné, parametrické x naparametrické. Pokud nepotřebujeme detailní závěry, stač í pracovat s testem oboustranným. Test neparametrický je výhodný, neznáme-Ii přesně typ rozdělení základního souboru. 12.2.3 Studium vazeb mezi vlastnostmi (znaky) a jejich hodnotami V archeologii jsou vazby mezi j evy obvykle statistické. Statistika však pouze prokazuje existenci vazeb, určuje její sílu (těsnost). Interpretace smyslu a příčin vazeb je plně zá ležitost archeolo- gická. Obvykle se rozlišují případy vazeb: I. mezi kvantitativními znaky, 2. mezi kvalitativními znaky, jež se dají u spořádat, 3. mezi kvalitativními znaky, které se uspořádat nedají, 4. mezi kvantitativními a kvalitativními znaky. Pro tento případ je nutno bud' přiřadit kvalitativním znakllln vid (tvar) kvantitativních (tedy je uspořádat), nebo kvantitativním znakllll1 cestou rozdělení jich do intervallI jim přiřadit vid (tvar) u spořádaných znakl! kvalitativních. Mimo to je nutné rozlišovat sledování vazcb: a) mezi libovolnou hodnotou j ednoho příznaku a libovolnou hodnotou dalšího příznaku ., b) mezi všemi hodnotami jednoho příznaku a všemi hodnotami dalšího příznaku, c) jediného příznaku s několika dalšimi. Studium vazeb již souvisí s tzv. vicerozměrnou statistikou, vícel'Ozměmými soubory, vícerozměrnou analj'zou. ZiIkladním podkladem jsou dalové matice typu II x p, kde řádky odpovidaj i jednotl ivým studovaným objektlllll. sloupce potom jednotlivým zji šťovaným znaklllll. O úspěchu analýzy takové matice rozhodnje, jak se podaří vyjádřit měřitelnými statistickí'mi znaky jednotlivé vlastnosti, O které se zajímáme. Právě přechod od víceméně neurčitého komplexu vlastností k seznamu přesně vymezených měřite lných znakl! je složitý proces, pro který lze těžko předem poskytnout obecně platné návody. Pokud se v datové matici vyskytuje časový prvek, musíme uvažovat o datovém kO/llplexu , který navíc nemusi být úplný. Dostáváme potom seri i rl!zných typl! analýz včetně časových řad a stochastick)'ch procesl!. Mnohdy se množina objektl! č leni na k podmnožin, tedy datová matice se rozpadá horizontálnč . Objekty ve skupinách jsou si z urč itého hled iska podobné - např. tim, že maji shodnou hodnotu některého uvažovaného faktoru. Pokud j e takové rozčlenění do skupin dáno, je cílem porovnání skupin mezi sebou - analýza rozptylu. Někdy je nalezení vhodného rozčlenění souboru naopak cílem analýzy - shluková (cluster) analýza. V nesymetrických úlohách zkoumání závislostí mezi proměnnými nemají všechny proměnné stejný význam. Často uvažujeme Pl faktorlI, které ovliviíují nebo mohou ovlivňovat p, výsledných 202 proměnných. DatovÍ! matice se pak rozpadá vertikálně na submatici faktorl' X typu n x P. a submatiei výsledných proměnných Y typu n x p, . Velmi často se vyskytují případy: • p, = I, P, = I - jcdnofaktorová jednorozměrná analýza rozptylu, jednoduchá regrese, • Pl > I, P2 = I - vícefaktorová jednorozměrná analýza rozptylu, vícenásobná regrese, běžná diskriminační a11al)/za . Datové matice typu m x p, kele p = 2 jsou tak zvané kontingenční tabulky se dvěma vstupy. Pokud se jedná o kvantitativní znaky označujeme tabulku jako korelační. Závěrem se stručně zmíníme O některých typech tzv. multivariační analýzy: • lok/o/'()I'ó G/J({~)iza vyjadřuje vztah mezi sledovanými proměnnými jako výsledek Pl.sobení jiných prom ěnných - faktorú. Z určení lineárních korelací mezi proměnnými se matematicky konstruují faktory, kterými lze vysvětl it korelace mezi proměn nými. Předpokládá se obvykle, že tyto korelace j sou lineárními kombinacemi faktorů, jež j sou společné všem proměnným. Kromě toho se mohou určovat i Faktory specifické, ježjsouy určeny pouze jedinou proměnnou. • allalýza komponell/ní (hlavních komponent) - je druhem faktorové analýzy, kde pojem faktoru je nahrazen komponentou. Od lišuje se od ní tím, že extrahované komponenty mají vysvětl it nikoliv korelace, ale rozptyl pl.vodních proměnných. • analýza kállonická - má za cíl určit maximální lineární korelace mezi dvěma skupinami ob- jektll. • ana/vza Q- typ fakLanalýzy, kdy vSlupem je korelační matice typu n x n, jejímiž prvky j sou korelační koeficienty mezi vzorky. • allol);za I? - opět je typem fakt.analýzy, kdy vstupem je korelační matice typu p x P , jejímiž prvky j sou korelační koeficienty mezi proměnnými. Všechny typy těchto analýz j sou početně náročné operace a jsou rozum ně real izovatelné jen pomocí vhodných statistických software pro PC. O tomto více v následuj ící kapitole. 12.3 Statistické programové vybavení počítačů Do statistického programového vybavení počítačů zahrnujeme: • statistické pakety (balíky) • tabulkové kalkulátOlY (spreadsheets) • speciúlní grafické programy • databáze. V dalším se zaměříme přednostně na ta programová vybavení pod operačním systémem Windows (jsou oproti systému DOS více propracované, lépe podporované a uživatelsky příjemné), která mají reálnou použitelnost ve specifickém vědním oboru, jakým je archeologie a jsou obecně dostupná. Podrobněji rozebereme prvé dva body přehledu s ohledem na maximální dostupnost tohoto vybavení. Speciální grafické programy se statistickými operacemi jsou používány hlavně pro analýzu elektrických signál" a v archeologii nemají zatím žádné široké uplatnění. Pomineme také podrobný rozbor program" výhradně určených pro tvorbu, správu a exploataci databází. Ty lze podstatně jednodušeji a eFektivněji vytvářet a vyhodnocovat pomocí tabulkových kalkulátor". 203 12.4 Statistické pakety Zatím nejdále je WinBASP ve verzi 5.36 (prosinec 1996). Je to Bonnský archeologický statistický (,aket pro Windows, který vznikl přepracováním praxí prověřeného programu BASP pro DOS (poslední verze 4.5.) Jsou to nekomerční specializované programy, nabízené formou shareware "" Internetu, které je možné po vyzkoušení legalizovat [I]. Program je prllběžně testován velkou skupinou odborníkll a zjištěné nedostatky jsou operativně v nejbližší následující verzi odstraněny. Je zaměřen výhrad ně na víeerozměmoll slalisliekoll al1a/)ízu arche%gick)ích dal, jako je korespondenční analýza, sh lukovací analýza, seriace, faktorová ana lýza, sociální a prostorová analýza, práce S mapami (geografické shlukováni, geografická seriace, GIS aj.) a další. Podrobněji O WINBASP pojednáme jinde. Ve grafickém vybavení pakctll je zřejmý trend návratu statistiky ke grafické analýze zpracovávaných dat. Rozhodnutí, kterou statistickou metodu nutno zvolit, je stále na odborníkovi, i když pakety se snaží toto rozhodování co nejvíce usnadnit. Proto mu nabízejí přípravu dobrých a přehledných podklad". Např. tabulka o velikosti 5 x 10 polí ve své Pllvodní podobě přehledná není. Statistik musí znát charakter zpracovávaných údajII - tedy jedná-Ii se o např. časovou řadu, o 5 časových řad, o 10 objektll s 5 měřenými vlastnostmi, O 5 krát deset mHených hodnot nebo o data k vícerozměrné regresi. Nechá si proto nejdříve údaje adekvátně zobrazit a teprve na základě získaného grafu se kvalifikovaně rozhodne O dalším postupu.. Vedle možnosti vykreslování gram, demonstruj ících zpracování dat určitou metodou (regresní křivky, korelogramy, periodogramy aj.), nabízí pakety také trojrozměrnou grafiku (3 D). Pro jednorozměrná a dvojrozměrná statistická data z oblasti archeologie je vhodný statistick)' software WINKS verse 4.2 (TexaSofl, Texas, USA). Je to nová windows verze jeho předchůdce KWIKSTATU , mnoha cenami oceněného programu pro statistickou analýzu dat a generování gram, pracujícího pod operačním systémem DOS. WINKS implementuje rllzné standardní stat istické testy a vytváří jejich vhodné grafické prezentace. Oba statistické programy lze nalézt na Internetu [2] jako shareware a po vyzkoušení legalizovat. Popíšeme dále stručně možnosti WINKSu . Hlavní přednosti tohoto paketu statistických programII pro uživatele: • možnost výběru vhodné procedllly na analýzu dat • metodicky dobře zvládnuté popisy a postupy analýzy dat • vkládilní dat nebo jejich používilní v běžných formiltech např. dBase, Lotus 1-2-3, ASCI • poskytnutí kompletní analýzy na jednom místě, takže užívatel nemusí spouštět další programy na realizaci analytických mezikrokú • interpretace výsledkll analýzy v tiskové i grafické formě, aby měl uživatel usnadněno rozhodování na jejich zák ladě. Interpretace je např. formou upozornění, že nejsou splněny předpoklady, za kterých lze zvolený výstup vykonal". Mezi klady tohoto programu patří "rllvodce analýzami a velmi podrobný asi 60 stránkový Manuál a Help. Menu WINKS se v ničem neodlišuje od struktury jiných programII pod Windows. Mezi položkami souborového menu (File) jsou submenu pro založení nové databáze dat (New database), otevření již existujících databází (Open database), smazání databáze (Delete database), dále submenu s r"zn)'mi utilitami (import, sestavy, třídění v databázi, výstup dat) a pro správu poznilmkových sešitll (Journal), nastavení tiskárny (Printer setup). Menu "Analyse" umožlluje výběr aktivního analytického modulu. V oblasti statistiky to jsou moduly popisné statistiky (Descriptive statistics), grafy a diagramy (Graph/Charts), t-testy (t-tests), neparametrické porovnávání (Non-parametric COI11parisons), lineární a nelineární regrese, korelace, frekvenční analýza, chi-kvadrát, jednocestná i dvojcestná ANOYA, analýza časových řad (Time serie ana lysis), vícenásobné porovnávací procedury atd. 204 Mezi rllznými typy gram najdeme histogramy, četnost výskytu jevu v dvourozměrné souřadné soustavě,3 D grafy, koláče a další. Pod Menu je na obrazovce umístěna nástrojová líšta, kde se nachází mimo obvyklé i tři netypické ikony: Repeat (opakuje poslední analytickou proceduru) a Journal (sešit). Ten se obvykle využívá na vytvoření kolekce výstupú analýz z WINKS procedury do jednoho souboru, který se pozděj i dá vytisknout nebo importovat do textového editoru. Třetí ikonou X se aktivuje aktuální přepočítávání dat a zobrazení histogramu. 12.4.1 Praktická demonstrace fnnkce programu WINKS Máme otevřít databázi, zobrazit popisné statistiky pro jednu proměnnou a nakonec analýzy zobrazit histogram. Podrobné statistické analýzy reprezentuje v Nástrojích (Tools) ikona X. Po kliknutí na ni se zobrazí dotaz, zda chceme databázi vytvořit, otevřít nebo tuto volbu zrušit. Otevřeme pr'íkladovou databázi Example.dbf. Otevření databáze aktivuje dialog, kde si vybereme jméno analyzované položky - např. informaci o věku(Age). Po chvilce se objeví popisné statistiky z dat v položce Age. Okno textového výstupu (View Results) předloží výsledky v textové podobě, které lze uložit do souboru přes menu Save. Vhodný graf dané ana lýzy se objeví po stisku tlačítka Oraph. Obdržíme histogram dat, která se nachází v otevřené databázi pod položkou Age. Typ grafu si můžeme změnit volbou některého tlačítka na horním okraji výstupního okna (Counls - počet výskytú, NonnDist přepínání mezi frekvenční a distribuční funkci). Kdybychom nemě li v uvedeném případě vytvořenu žádnou databázi, volili bychom položku menu File-New databasc. WINKS nám tehdy nabídne výběr z několika druhú rúznč strukturovaných databází. Pro analýzy dat se obvykle používá volba "lndepende Oroup t-test or ANOVA . Pak se zobrazí tabulkový kalkulátor se dvěma položkami Oraup (informace o č íselném kódu testu) a Obs(obsahuje položku, jež se bude zkoumat). Po napsání hodnot vybereme z menu Analyse položku t-test/ANOVA a pokračujeme jako v příkladě s existuj ící databází. Při rozpacích si mllže vždy zavolat nápovědu (HelpMenu) kliknutím na ikonu otazníku (?). Ta obsahuje velký počet rúzných instruktivních příkladú aplikaci a také podrobný seznam hesel v Obsahu. Kliknutím vyvoláme pomocné podrobné popisy vhodných poStUpll či v)'znamú voleb. 12.4.2 Doporučený postup při statistické analýze archeologických dat. (Má obecnou platnost pro vyhodnocování dat a není omezen pouze na popisovaný statistický paket Winks ) a)Vyberete si potřebnou úlohu v následující nabídce: I. Chcete použít popisnou statistiku (Descriptive Statistics)jedné proměnné 2. Chcete použít popisnou statistiku pro dvě závisle proměnné 3. Chcete porovnávat dvě proměn né - nezávislé nebo párové 4. Chcete porovnávat více než dvě proměnné - nezávislé nebo závislé 5. Chcete zkusit asociaci mezi dvěma proměnnými 6. Chcete zkusit asociaci mezi více než dvěma proměnnými 7. Definice n ěkterých v tabulkách použitých pojmů. b) Podle příslušného čísla vaší volby přejděte na dále uvedenou tabulku. Ta vám nabídne potřebný modul pro správnou realizaci zvoleného záměru: 205 Ad I) Popisná statistika a grafy. Použitelné procedury. PROMĚNNÉ DRUH DAT MODUL j edna normální statistický jedna llellormálllí statistický 'edna kate orická křížov' ch tabulek jedna časová Ad 2) Popisná statistika a grafy. Použitelné procedury. PROMĚNNE DRUH DAT MODUL dvě závislé normální statistický nebo redvě závislé nenonnální dvě závislé kvalitativní Ad 3) Srovnávací testy pro dva soubory PROMĚNNE DRUH DAT MODUL dvě závislé normální dvě závislé nenormální dvě závislé dichotomní dvě nezávislé normální dvě nezávislé nenormální dvě nezávislé kvalitativni Ad 4) Srovnávací testy pro vice souborů I'ROMĚNNE DRUH DAT MODUL normální nenonnálni dichotomní normální nenormální kval itativni 206 PROCEDURY průměr, odchylka, his interval, rámeček, Sti togram, konfidenčn í ciferná data medián, rámeček, his data togram, Sti ciferná PROCEDURY Pearsonilv kore lačn i koeficient, 2 D raf Spearmenův korelační koeficient, 2 D rať , graf PROCEDURY Mc Nemarilv test ANOVA Mann - Whitne ův U-test Chí-kvadrát (homogen ita) PROCEDURY o akovaná ANOVA NOVA Cochranův Q-test ANOVA Kruskal-Wal1is Chi-kvadrát ..,... ~ Ad 5) Asociačllí test mezi dvěma soubory PROMĚNNÉ DRUH DAT závislé normální závislé nenormální závislé kvalitativní závislé smíšená MODUL regresní PROCEDURY Pearsonova korelace, jednoduchá Iineární re rese S earmenova korelace Chi-kvadrát (nezávislost Ad 6) Asociačl1í test pro více souborll PROMĚNNÉ DRUH DAT více závislých normální více závislých nenonnální více závislých kvaIitativni Ad 7) Definice některých pojmll. MODUL re resní nelineární analýzy nelineární anal'z PROCEDURY vícenásobná re rrese Kendallova částečná pořadová kore- lace diskriminační anal'za Normální dala jsou data dobře aproximovatelná Gaussovou distribucí. i data jsou data, která nejsou normálně rozdělena.Nenormáln Kategorická data jsou nominální data např. žena-muž, hnědý-modrý-zelený. Kvantilalivni data jsou numerická data, označovaná jako kardinální proměnné. Dicholomická data jsou kategorická data, jež nabývají pouze dva stavy (ano/ne, jev existue).je/neex istuj Kvalilalivni data popisuj i obvykle přívlastky (barva předmětu, socioekonomickou třídu, sex). 12.5 Tabulkové kalkulátory označo baveny řadou s vané někdy jako tabulkové procesory (např.velmi rozšiřený MS Excell) jsou také vytalistických nástrojil a velmi bohatou grafikou. V mnoha případech mohou sloužit jako ástroj" pro tvorbu databází dat a jej ich následnou analýzu a grafickou prezentací..,víceúčelový n Tak na dat, z nichž 13 numerických cl př. MS EXCELL v, 5,0 i 7,0 obsahuje celkem 19 komplexních procedur pro analýzu je vyloženě statistických a zbývající se mohou použít pro úpravy a zkoumání převážně at. Aktivujeme je z menu Nástroje/Analýza dat. Pokud v menu Nástroje položku Anaznete, je možné si je dodatečně doinstalovat. Spustite si instalační program a instaluAnalytické nástroje. Pro naše účely si uvedeme stručný popis všech procedur každé z nich naleznete v Nápovědě): lýza dat nenale jete doplněk (podrobnosti o ANOVA - JEDEN FAKTOR. Jednoduchá analýza rozptylu s testem hypotézy, že střední hodnoty několika náhodných výběy. Hladina významnosti se uvažuje implicitně 0,05 - je možné ji upravit.Vstupní oblast málně dvě souvislé oblasti. Výsledky lze uložit na nový list nebo do nového sešitu. avuje rozšíření (estů pro střední hodnoty dvou výběrů, jako je (-test. Lze j i použít i pro fll jsou si rovl1 musí mít mini Analýza předst náhodné výběry S rozdílným počtem hodnot. 207 ANOVA -DVA FAKTORY S OPAKOVÁNÍM. Provádí jednoduchou analýzu rozptylu pro více skupin dat a pro každou skupinu je více náhodných výběrů. Hladina významnosti je implic itně 0,05 - je ji možné upravit. Vstupní oblast musí mít minimálně dvě souvislé oblasti. Výsledky lze uložit na nový list či do nového sešitu. ANOVA - DVA FAKTORY BEZ OPAKOVÁNÍ. Provede analýzu rozptylu pro dvojné třídění, kdy se v jednom vzorku nepoužívá více než jeden výběr. Testuje hypotézu, že střední hodnota dvou nebo více náhodných výběrů jsou shodné.Hladina významnosti, podmínka vstupní oblasti a uložení výsledků stejně jako v předchozím heslu. KORELACE. Měří vztah mezi dvěma množinami dat a to tak, že se neprojevuje závislost na použitých jednotkách měření.Korelační koeficient se počítá jako kovariance dvou množin dat, dělená souči nem jejich směrodatných odchylek. Vstupní oblast musí mít minimálně dvě souvislé oblasti. Výsledky se uloží na nový list nebo sešit. Korelace umožňuje zjištěn í těsnosti statistické závislosti mezi dvěma soubory dat. Korelační koeficient je kladný, je-Ii závislost přímá a záporný, je-Ii závislost nepřímá. Pokud jsou hodnoty v obou množinách nezávislé, bude hodnota korelace blízká nule. Je-Ii vzájemná závislost souborl! lineární, je korelační koeficient I nebo -I. Dva shodné soubory mají korelační koeficient roven jedné. KOVARIANCE. Slouží ke zjištění, jak na sobě závisejí dva náhodné výběry. Je citlivá najednotky měření použité ve výběrech. Vstupní oblast musí mít minimálně dvě souvislé oblasti. Výsledky lze uložit na nový list nebo do nového sešitu. Kovariance je kladná při přímé závislosti a záporná, je-Ii závislost nepřímá. Jsou-Ii hodnoty v obou výběrech na sobě nezávislé, bude hodnota kovariance blízká nule. POPISNÁ STATISTIKA. Vygeneruje soustavu univariantních statistických hodnot. Hladina významnosti se uvaZUje implicitně 0,05 a lze ji upravit. Vstupní oblast může mít viCe souvislých oblastí dat ve sloupcích. výsledky se uloží na nový list nebo do nového sešitu. Po označen í položky "Celkový přehled" se vygeneruje tabulka s těmito statistickými charakteristikami pro každý sloupec zvlášť: střední hodnota, standardní chyba stJ'ední hodnoty, medián, modlls, směrodatná odchylka, rozptyl výběru, špičatost, šikmost, rozdíl hodnot max-min, nejmenší hodno/a, největší hodnota, součet hodnot v sOl/borll, počet prvkú, k-tá největší hodnota, k-tá nejmenší hodnota, věrohodnost při zadané hladině významnosti (implicitně 95 %). Tato analýza slouží jako výchozí pro další navazující procedury. F-TEST. Dvouvýběrový test pro porovnání rozptylu dvou datových souborl\. Hladina významnosti se uvažuje implicitně 0,05 aje možnéji upravit. Na vstupu jsou dva sloupce nebo řádky pro dva soubory dat. Výsledky lze uložit na nový list nebo do nového sešitu. Výsledkem analýzy je tabulka obsahující: st7'ední hodnotu, rozptyl, počet pozorování, rozdíl, F, P (F<=l) a Fkrit pro každý soubor zv lášť. mSTOGRAM. Je v podstatě frekvenční analýzou dat. Rozdělí soubor do tříd (skupin). Umožňuje generovat nonnální histogram, tříděný histogram (tzv. pareto) a kumulativní procentní podílový histogram. Na výstupu mLIže být mimo histograml! též graf.. Výsledky lze uložit na nový list nebo do nového sešitu. Číslo se započte do skupiny, pokud je menší nebo rovno horní nranici třídy a nepatří do předchozí skupiny. poŘADOVÁ STATISTIKA. Vytvoří tabulku, která bude obsahovat pořadové číslo a procentní pořadí pro každou hodnotu v množině dat. Výsledky lze uložit na nový list nebo do nového sešitu a to volite lně do řádkl! nebo sloupel\. Pomocí tohoto nástroje je možné realizovat relativní zařazení hodnot v souboru dat. 208 VZORKOVÁNÍ. Vytvoření reprezentativního vzorku dat z rozsáhlého souboru podle zvolené vzorkovací metody (period ická nebo náhodná), vzorkovací periody a počtu vzorků. Výstupní tabulku se vzorkem dat me,žeme uložit na nový list nebo do nového sešitu. Tato analýza se použije, když vstupní soubor je příliš rozsáhlý a nelze jej celý zpracovat nebo vykreslit do grafu. Pro další práci se použije vytvořený vzorek, který má vlastnosti celého souboru, Máme-Ii podezření na periodicitu dat, pak můžeme vytvořit vzorek, který bude obsahovat údaje jen z určité části cyklu. Např. obsahují-Ii vstupní data hodnoty pozorování za člvrtl etí, pak vzorkováním s periodou 4 ve výstupní oblasti údaje za stejná čtvrtl etí. PÁROVANÝ t-TEST NA STŘEDNÍ HODNOTU. Dvouvýběrový párový Studente,v t-test pro zjištění, zda střední hodnoty dvou soubor" jsou r"zné (shodnost rozptylů obou soubore, se nepředpokládá). Na vstupu jsou dvě oblasti analyzovaných dat a obě musí být buď ve sloupcích nebo řádcích . Hladina významnosti se uvažuje implicitně 0,05 a lze ji upravit. Dále se zadává předpokládaný (hypotetický) rozdíl střed ních hodnot (O znamená, že se přepokládají shodné střední hodnoty). Na výstupu je tabulka, která obsahuje II statistických charakteristik pro oba soubory. Výsledky lze uložit na nový list nebo do nového sešitu. Tabulka obsahuje tyto charakteristiky: s/I'ední hodnota, rozplyl pozorování. Pearsollova korelace, hypotelický rozdíl středních hodnol, rozdíl, I-slol. P(T<=/) (1), I-krit (1), P(T<=/) (2), I-krit (2). Párovaný test se používá tehdy, jsou-Ii pozorování ve výběrech přirozeným způsobem spárována, např. při dvojím testování skupiny - před a po experimentu. DvouvýnÉRový t-TEST S ROVNOSTÍ ROZPTYLŮ Dvouvýběrový Studentův t-test pro testování shodnosti střed ních hodnot dvou soubore, dat za předpokladu shodnosti jejich rozptylli. Na vstupu jsou dvě oblasti analyzovaných dat a obě musí být buď ve sloupcích nebo v řádcích . Hladina významnosti se uvažuje implicitně 0,05 a je ji možné upravit. Dále se zadává předpokládaný (hypotetický) rozdíl střed ních hodnot (O znamená, že se předpokládají shodné střed ní hodnoty). Na výstupu je tabulka, která obsahuje II statistických charakteristik pro oba soubory. Výsledky lze uložit na nový list nebo do nového sešitu. DvouvýnÉROVÝ t-TEST S NEROVNOSTÍ ROZPTYLŮ Dvouvýběrový Studente,v t-test pro testování shodnosti středních hodnot dvou souborů dat za předpokladu. že jejich rozptyly nejsou shodné. Na vstupu jsou dvě oblasti analyzovaných dat a obě musí být buď ve sloupcích nebo v řádcích. Hladina významnosti se uvažuje implicitně 0,05 a je ji možné upravit. Dále se zadává předpokládaný (hypotetický) rozdíl středních hodnot (O znamená, že se pi'edpokládají shodné střední hodnoty). Na výstupu je tabulka, která obsahuje 10 statistických charakteristik pro oba soubory. Výsledky lze uložit na nový list nebo do nového sešitu. Test se používá v případě, kdy studované soubory dat jsou různé. Pokud se testuje soubor vzniklý před nějakou akcí se souborem vzniklým po akci, doporučuje se použít párovaný test. DvouvýnÉRový z-TEST NA STŘEDNÍ HODNOTU Dvouvýběrový z-test testuje hypotézu o rozdílnosti středních hodnot dvou souborl' při známých rozptylech. Na vstupu jsou dvě oblasti analyzovaných dat a obě musí být buď ve sloupcích nebo v řádcích. Dále se musí zadat rozptyl pro oba soubory (ten se zj istí např. z popisné statistiky). Hladína významnosti se uvažuje implicitně 0,05 aje možnéji upravit. Na výstupu je tabulka, která obsahuje 9 statistických charakteristik pro oba soubory. Výsledky lze uložit na nový list nebo do nového sešitu. EXPONENClÁLNÍ VYROVNÁVÁNÍ (VYHLAZOVÁNÍ) Umož'luje vyhlazení průběhu dat s možností předpovědi. Předvídá hodnotu, na základě předpovědi pro předchozí "sek, opravenou o chybu předchozí předpovědi. Vstupní oblast musí tvořit jeden sloupec nebo řádek s minimálně 4 bulíkami. Výstupní oblast musí být na stejném listu jako oblast vstupní. Implicitně je nastaven koeficient "tlumu 0,3 (prázdný rámeček). Lze zadat požadavek na vygenerování grafu a požadavek na výpočet standardní chyby. 209 FOURIÉROVA ANALÝZA Jde o rychlou Fouriérovu transformaci (FFT) pro analýzu periodických dat a lineárních systémlJ. Umožiíuje též inverzní transformaci (pro získání původních dat ze souboru dat již transformovaných). Počet vstupních hodnot musí být mocninou dvou (např. 16,32, 64,128 ... max 1024). Menší počet dat, chybějících do nutného počtu, lze nahradit nulami, nebo přebývající data ze souboru vynechat. Výsledky analýzy lze uložit na nový list nebo do nového sešitu. POHYBLIVÝ (KLOUZAVÝ) PRŮMĚR .Ie prllměr počítaný ze zadaného pohyblivého intervalu (implicitně 3 hodnoty, lze upravit). Na ' výstupu mllže být tabu lka a graf (histogram). Tabulku lze doplnit o vypočtené standardní chyby. Vstupní dat musí být uspořádána do jednoho sloupce nebo řádku s minimá lně 4 buňkami (políčky). Výstupní oblast musí být na stejném listu se vstupními daty. Klouzavý průměr poskytuje informaci o trendu s vyhlazením výkyvlJ. Při předpověd i se dává větší váha posledním hodnotám. Předpovědi odrážejí trend, ale opoždují se. Jak narllstá délka pohyblivého intervalu, stávají se předpovědi méně citlivé ke krátkodobým výkyvům a tím pomaleji odrážejí poslední trendy. Pro výpočet váženého pohyblivého prllměru Uednoho intervalu) mÍlžeme použít funkci SOUČIN.SKALÁRNí. GENERÁTOR PSEUDONÁHODNÝCH ČíSEL Vyplní oblast jednoho nebo více s loupců nezávislými náhodnými čísly, která pocházejí z některého rozdělení. Náhodné proměnné mají řadu použití ve statistických simulacích. Použitím této pr6éedury získáme soubor hodnot charakterizovaný daným pravděpodobnostním rozdělením. (Např. pro hodnocení souboru výšek jednotlivců z kosterních pozůstatkll můžeme použít normální rozdělen í, soupis pohřebišť určité kultury na lokalitách dané oblasti bude mít Bernoulliho rozdělení). Generátor umožňuje umělé vytvoření souborů pseudonáhodných čísel pro jeden ze následujících 7 typů rozdělení: Rovnoměrné Je charakterizováno dolní a horní hranicí. Čísla jsou vybírána se stejnou pravděpodobností z celého zadaného intervalu. Obvykle se používá rovnoměrné rozdělení v intervalu 0... 1. Normální .Ie charakterizováno střední hodnotou a směrodatnou odchylkou. Obvykle se používá střední hodnota rovna Oa směrodatná odchylka rovna I. Bernoulliho Je charakterizováno pravděpodobností výskytu v daném výběru. Výsledná hodnota je Onebo I. Stejného rozdělení by bylo možné dosáhnout například následujícím postupem: použijeme náhodné rovnoměrné rozdělení na intervalu 0... 1. Když hodnota náhodné proměnné bude menší nebo rovna pravděpodobnosti výskytu, přiřadíme Bernoulliho náhodné proměnné hodnotu I; j inak jí přiřadíme hodnotu O. Binomické Je charakterizováno pravděpodobností výskytu v jednom výběru a celkov)'m počtem výběrlJ. Stejného rozdělení by bylo možné dosáhnout například tak, že bychom náhodné proměnné přiřadili hodnotu získanou generováním daného počtu Bernoulliho náhodných hodnot ajejich sečtením. Poissonovo Je charakterizováno hodnotou lambda rovnou převrácené hodnotě střední hodnoty. Poissonovo rozdělení se často používá pro charakterizaci počtu nějakých událostí, které se odehrají za časový úsek. Podle vzorků .Ie charakterizováno dolní a horní hranicí, krokem, počtem opakování každého čísla a počtem sekvencí (neboli kolikrát se má opakovat celá posloupnost). Disko·étni Je charakterizováno vstupní oblastí se dvěma sloupci. V levém z nich jsou uvedeny hodnoty, v pravém jsou uvedeny odpovídající pravděpodobnosti výskytu. Součet pravděpodobností musí být roven I. Obecně pro generátor pseudonáhodných čísel platí, že pokud na vstupu zadáme stejný tzv. "základ Uádro)", vygeneruje po opětovném spuštění stejnou posloupnost pseudonáhodných čísel. výsledky lze uložit na nový list nebo do nového sešitu. Generátor umožlluje efektivní ověřování různých modelů na základě vytvořené množiny dat s pravděpodobnostním rozdělením. Pro generování pseudonáhodných čísel uvnitř intervalu O a I (tj. bez těchto hraničních hodnot) lze také použít funkci NÁHČíSLO ( ). Pro získání náhodných čísel rozložených mezi libovolně zadanými hodnotami užijeme funkci RANDBETWEEN ( ). 210 REGRESE Provádí lineární prostou nebo vícenásobnou regresi proložením přímky množinou pozorování s použitím metody nejmenších čtverc'l. Na vstupu jsou dvě množiny dat. Prvá množina obsahuje závislá data (Y) a musí být pouze v jednom sloupci. Druhá množina obsahuje data nezávislá (X) a musí mít stejný počet řádkll jako množina 7.ávislá, počet sloupců Xi je limitován (i ~ I... max 16). Lze si vybrat, zda regresní přímka má procházet počátkem (implicitně neprochází) a nastavit lIroveií věrohodnosti (imp li c itně je 95 %, což odpovídá hladině významnosti 0,05). Výstupní tabulka má nejméně 7 sloupc'l a obsahuje tabulku analýzy rozptylu (ANOVA), koeficienty, standardní chybu odhadu y, hodnoty koeficientu determinance R' , počet pozorování a standardní chybu koeficientl!. Na výstupu mohou být 3 grafy: grafs rezidui, grafregresní přímky a grafpravděpodobnosli. Výsledky lze uložit na nový list nebo do nového sešitu. Regrese se používá k analýze ovlívněn í jedné závisle proměnné hodnotami jedné nebo něko lika nezávisle proměnných . Procedura 1I1lložiíuje velmi j ednoduše spoč ítat nelineárni regresi exponenciální. Podmínkou je, že vstupní množiny dat obsahují přirozené logaritmy (In) závislých i nezávislých dat. Rovněž také výsledky jsou udány jako přirozené logaritmy vypočtených hodnot. Blíže lze nalézt v Nápověd i k funkcím LOGLlNREGRESE a LlNREGRESE. Pro úplnost je užitečné zde uvést úplný soupis statistických funkcí, které jsou ve MS EXCELL v.5 a 7 obsaženy. Tyto statistické funkce jsou obvykle používány na množinu čísel a vrací příslušné statistické hodnoty. Nejsou jimi pouze součty a odchylky, ale také některé jednoduché lineární a exponcnciální aproximace křivek. Několik z těchto funkcí vrací jako výsledek pole. Pozor na některé výrazné rozdíly v pojmenování funkcí u verzí programů lokalizovaných (p"evedených do češtiny) a originálních (anglických). Např. PRŮMĚR ~ AVERAGE, PRŮM.ODCI-IYLKA ~ AVEDEV, SMODCI-I ~ STDEVP, SMODCI-I.VÝBĚR ~ STDEV, POČET ~ COUNT atd. Tyto rozdíly se také vyskytují i v menu, submenu a nápovědě lokal izovaných programů. V této stati jsou přednostně uvažovány lokalizované verze. 12.5. t Statistické funkce EXCELLU DBETADIST DBETAINV DBINOMDIST PCORREL PCOVAR TCRITB1NOM PČETNOSTl DCHIDIST DCHIINV TCHITEST PCONFIDENCE ZLJEVSQ DEXPONDIST D FDIST DFINV PFISHERINV PFISHER A FORECAST TFTEST DGAMMADIST DGAMMAINV Vrátí hodnotu distribuční funkce rozdělení beta Vrátí inverzní hodnotu distribuční funkce rozdělení beta Vrátí distribuční funkci pro binomické rozdělení Vrátí korelačn í koeficient mezi údaji ze dvou polí Vrátí hodnotu kovariance Vrátí nejmenší přirozené číslo, pro které má pravděpodobnostní funkce binomického rozdělení hodnotu větší nebo rovnu kritické hodnotě alfa Vrátí vertikální pole, které popisuje rozdělení dat do kategorií podle veli- kosti Vrátí jednostrannou distribuční funkci chí-kvadrát Vrátí inverzní jednostrannou distribuční funkci chí-kvadrát Provede test nezávislosti Vrátí interval věrohodnosti pro střední hodnotu základního souboru Vrátí součet čtverců odchylek Vrátí distribuční funkci exponenciálního rozdělení Vrátí hodnotu distribuční funkce r rozdělení Vrátí hodnotu inverzní funkce k distribuční fun kci F rozděleni Vrátí hodnotu ínverzní funkce k Fisherově transformaci Vrátí Fisherovu transformaci čísla x Vrátí odhad hodnoty y v bodě x na základě lineární regresní přímky Vrátí výsledek F-testu Vrátí hodnotu distribuční funkce rozdělení gama Vrátí hodnotu inverzní funkce k distribuční funkc i rozdělení gama 211 DGAMMALN ZGEOMEAN ZHARMEAN D HYPGEOMDIST A INTERCEPT PKURT PLARGE A L1NTREND A L1NREGRESE DLOGINV A LOGLlNREGRESE A LOGLlNTREND D LOGNORMDIST ZMAX ZMEDIAN ZMIN PMODE D NEGBINOMDIST DNORMDIST DNORM INV DNORMSDIST DNORMSINV PPEARSON PPERCENTIL P PERCENTRAN K PPERMUTACE ZPOČET2 Z POČET D POISSON PPROB ZPRŮMĚR P PRŮMODCHYLKA PQUARTIL D RAND13ETWEEN PRANK PRKQ DSKEW PSLOPE PSMALL Z SMODCH.VÝBĚR ZSMODCH P STANDARDIZE A STEYX ]) TDIST DTlNV PTRIMMEAN TTTEST Z VAR.VÝBĚR ZVAR Vrátí přirozený logaritmus gama funkce Vrátí geometrickou středn í hodnotu Vrátí harmonický prlllllěr Vrátí hodnotu distri buční funkce hypergeometrického rozdě lení Vrátí prúseč ík lineární regresní přímky s osou x Vrátí hodnotu špičatosti rozdělení dané množiny Vrátí k-tou největší hodnotu množiny Vrátí předpověď hodnot při lineární aproximaci (trend) Vrátí nové hodnoty y po proložení Pllvodních hodnot přímkou pomocí metody nejmenších čtvercll Vrátí inverzní funkci k d istribučn í funkci logaritm icko normálního rozdělení Vrátí parametry exponenciální aproximace Vrátí předpověď hodnot funkce při exponenciální aproximaci Vrátí distribuční funkci logaritmicko normálního rozdělení Vrátí maximální hodnotu v seznamu argumentll Vrát í medián zadaných čísel Vrátí minimální hodnotu v seznamu argumentll Vrátí modus - nejčastěji se vyskytující hodnotu dané posloupnosti hodnot Vrátí di stribuční fu nkci negativního binomického rozdělení Vrátí distribuční funkci normálního rozdělení Vrátí inverzní funkci k distri buční funkci normálního rozdělení Vrátí distribučn í funkci standardního normálního rozdělení Vrátí ínverzní fun kci k distribuční funkci standardního normálního rozdělení Vrátí Pearsonllv korelační koeficient Vrátí hodnotu, která odpovídá k-tému percentílu v poli hodnot Vrátí procentní pořadí čísla x v poli hodnot Vrátí počet permutací pro zadaný počet objektll Vrátí počet neprázdných hodnot v seznam u argumentl! Vrátí počet čísel v seznamu argumentll Vrátí distribuční funkci Poissonova rozdělení Vrátí pravděpodobnost toho, že hodnoty v oblasti x leží v daném intervalu Vrátí prfllllěrnou hodnotu argumentll Vrátí prlllllěrnou absolutní odchylku bodli od střední hodnoty Vrátí hodnotu kvartilu ze zadaného pole dat Vrátí náhodné číslo ze zadaného intervalu Vrátí pořad í argumentu (podle vel ikosti) v seznamu číse l Vrátí druhou mocninu Pearsonova kore lačního koeficientu pro lineární re- gresi Vrátí šikmost rozdělení náhodné velič iny Vrátí směrnic i lineární regresní přímky proložené zadanými body Vrátí k-tou nejmenší hodnotu v poli Vrátí odhad směrodatné odchylky zák ladního souboru určený z náhodného výběru Vrátí směrodatnou odchylku základního souboru určený z náhodného výbě­ ru Vrátí normalizovanou náhodnou veličinu s normálním rozdělením Vrátí standardní chybu při výpočtu lineární regrese Vrátí hodnotu distribuční funkce Studentova t-rozdě len í Vrátí inverzní funkci k TDlST Vrátí sti·ední hodnotu datové posloupnosti Vrátí pravděpodobnost spojenou se Studentovým t-testem Vrátí odhad rozptylu základního souboru Vrátí rozptyl základního souboru 212 D WEIBULL TZTEST Vrátí hodnotu di stribuční funkce Weibullova rozdělení Vrátí dvoustrannou hodnotu P, která je výsledkem z-testu Uvedené statistické funkce se dají rozdělit do 5 skupin (viz prvý sloupec soupisu): Z Základní statistiky. P Pokročilé statistické funkce, A Aproximačllí jimkce, D Distribuční jímkce. T Tes/ovací jímkce. Statistické funkce se v EXCELU používaj í obdobně jako ve většině programLJ. Napíšeme jméno funkce (malými anebo velkými písmeny), levou závorku, argumenty funkce oddě lené čárkou a uzavírací pravou závorku. Argumenty funkcí mohou být č ís la, řetězce znakl!, odkazy na bllllky nebo jiné funkce (tzv. v nořování funkcí je možné až do sedmé "rovně). Argumenty - typ a rozsah zjistíme v Nápovědě. Jestliže argument funkce není ve správném rozsahu, pak funkce vrátí chybu IINUM! ; jestliže argument funkce není správného typu, vrací se chyba #VALUE!. Pro vkládání funkcí do bunčk lze v)'hod ně použít ikony Prllvodce funkcí na li ště nástroj ll. Poznámka k DATABÁzíM v tabu lkovém kalku látotoru. Pod DATABAzí rozumíme pravoúh lou spojitou oblast buněk v listu tabulky. Každý řádek tvoří z.1znmn, každý sloupec pole. Prvý řádek obsahuje názvy polí. Statistické zpracován í takových dat v EXCELLU, se provádí pomocí da/abázov.ýchjíll1kcí, které se používají na hodnoty vybírané z databáze s použitím výběrové podmínky. 12.5.2 Funkce pro správu seznamů a databází DMA X Vrátí maximální č íslo z vybraných položek v databázi DMIN Vrátí minimální č ís l o z vybraných položek v databázi DPOČET2 Vrátí počet neprázdných buněk, které splilují daná kritéria DPOČET Vrátí počet neprázdných buněk, které splilují daná kritéria DPRŮM ĚR Vrátí prlllněrnou hodnotu z vybraných položek v databázi DSMODCH.VÝBĚR Vrátí výběrovou směrodatnou odchylku z těch záznamII v databázi, které DSMODCH DSOUČIN DSUMA DVAR DVAR.VÝBĚR Dz íSKAT SQLREQUEST SUBTOTAL odpovídají zadaným kritériím Vrátí směrodatnou odchylku základního souboru z těch záznamll v databitzi. které odpovídají zadaným kritériím Vrátí součin určených položek z těch záznamll v databázi, které odpovídaj í zadaným kritériím Vrátí součet položek z těch záznamll v databázi, které odpovídají zadan)'m kritéri ím Vrátí výběrový rozptyl položek z těch z<ÍZnamll v databázi, které odpovídají zadaným kritéri í!ll Vrátí rozptyl základního souboru položek z těch záznamII v databázi, které odpovídají zadaným kritéri ím Vrátí tu položku databáze, která spliluje daná kritéria Při poj í vnější zdroj dat a spustí dotaz ze sešitu Vrátí souhrn dal v seznamu nebo v databázi Všechny tyto funkce mají 3 stejné argumenty: jméno databáze, jméno pole a podmínku. Databázové funkce zpracuj í pouze ty záznamy, které sphl uj í zvolenou výběrovou podmínku. Pomocí pr-íkazll DATA/FILTR/ROZŠÍŘENÝ FILTR lze vybraná data překopírovat do jiné oblasti a tam pak j e případnč dále sa mostatně statisticky zpracovat podle výše podrobně uvedených postupů. 213 12.6 Grafy dat Jestliže vygenerujeme určitá data j e nutné si je vykreslit a dále je analyzovat, třeba zj išťováním, jaký typ křivky představují. MS EXCEL nabízi dva typy grafll: grafy vložené do listu tabu lky a grafy na zvláštním listu. Prvé jsou vhodné pro bezprostřední analýzu konkrétnich tabulek, druhé slouží pro prezentaci výsledkll a jejich dokumentaci. V obou případech je proces tvorby grafu zjednodušen pomocí ikony Prlivodce grafem na 4 - 5 kroků. D,dežitá je volba typu grafu (nabídka obsahuje 15 typli). Nejuži tečnější se j eví typy grafXY a 3D povrchový graf Graf XY je jediný, který vykresluje skutečný rozsah dat na ose x; ostatní umisrují hodnoty y rovnoměrně rozložené ve směru osy x a proto neposkytují reálnou představu o rozmístěni, zvl áště jsou-Ii dala ve skutečnosti nerov noměrná. Graf typu 3D povrchový vykresluje pravo"hlou oblast dutjako povrch v troj rozměrném prostoru . Dat pro osu x a y jsou nad a vpravo mřížky pro data na ose z. Graf vykresluje pouze hodnoty na ose z rovnoměrně rozložené podél os x a y. Data x a y jsou využita pouze pro popisy. Všechny grafy lze dodatečně upravovat, dophlovat, transformovat (formátovat). Pokud vadí rovnoměrné rozdělení dat podél os x a y, lze data rozdělit posunutím a vytvořit postačující drálO1~;model použitím dvojrozměrného XY grafu. 12.7 Vícerozměrná statistická analýza Speciálním dopliíkem k MS EXCELL do Nástrojů j e program xISTAT, nabízený komerčně [3J.Vedle jednoduché a vícenásobné regrese, analýzy variační ,kovariančn í a dikriminančn í , nabízí dva programy na shlukovací (cluster) analýzu (metoda centroidní a Wardova), kore l ační analýzu (pořadovou neparametrickou korelaci podle Kendalla a Spearmana, analýzu metodou hlavních komponent), dále jednoduchou a vícenásobnou korespondenční analýzu, třídění kategorických dat a multidimensionální škálování dle Kruskala. Simuluje také XIY ploter. 12.8 Závěry Stať na zák ladě dostupného software, provozovaného pod operačním systémem Windows podává přehled o využití jejich statistického vybavení pro analýzu archeologických dat. 12.9 Literatura [I] Internet: http://www.uni-tuebingen.de/uni/aWbasp.hlllll [2]lnlernet: hllp://www.dfw.net/holllepage [3]lnlernet: hltp:!/www.kovcomp.co.uklxlsbroc.hlllll 214 13. K využití seriace při datování sídlištní keramiky (Vladimír Salač) 13.1 Úvod Pojem seriace se v české archeologii zhruba v posledním čtvrtstoletí objevoval a objevuje poměrně často. Vlastních aplikací této metody při zpracování konkrétního materiálu však pří li š ne- máme. Východiskem matematického postupu seriace je matice dat. V archeologii jde zpravidla o tabu lku, v níž řádek (sloupec) představuje archeologický objekt (hrob, sídlištní objekt, vrstvu apod .) a ve sloupcích (řádcích) jsou obsaženy jeho charakteristiky (např. druhy nálezll z objektll, hrobll apod.). Takováto tabulka se nazývá tabulkou kontingenčn í. Vlastní vzhled resp. obsah tabulky mllže být dvojí, buď tabu lka registruje pouze výskyt (I) resp. absenci (O) sledovaných jevil, nebo zaZllamenává konkrétní četnosti výskytu (např. kolikrát se v objektu vyskytne střep s rytou vlnicí). V prvním případě jde o zv láštní typ kontingenčn í tabulky. který v tomto příspěvku budeme nazývat tabulkou absence x presence (dále APT), kdežto název kontingenční tabulka (dále KT) budeme používat u tabulek obsahujících skutečné četnosti. Úkolem seriace je přerovnávat pořadí řádkll a sloupcll matice takovým způsobem, aby kOl'elace mezi řádky a sloupci byla maximální. Jestliže tabulka má odpovídající strukturu, srovnaj í se obsazená pole (popř. pole s nejvyššími četnostmi) na diagonále, popř. v její blízkosti. Úrovell uspořádání obsazených polí v tabulce vzhledem k diagonále vyjadřuje tzv. korelační koeticient, který získáme výpočtem ze všech relativních četností v jednotlivých sloupcích a řádcích. Korelační koeficient mMe mít maximální hodnotu I (jestliže je matice čtvercová a obsazená /nenulovál pole se nacházejí výhradně na diagonále. Č ím více se korelační koeficient blíží k této hodnotě, tím více spolu údf\ie v řádcích a sloupcích koreluj í, tj. obsazená polc se nacházejí blíže k diagonále, či jsou přímo na ní. Seriaci lze provádět jak "ručně", tj . např. tabulku rozstříhat a fyz icky měnit pořadí řádkll i sloupell, tak aby obsazená pole ležela poblíž diagoná ly, nebo početně, tj. měnit pořadí sloupcll a řádkll pouze teoreticky. vypočítávat hodnoty korelačních koeficientll a hledat nejvyšší z nich. Takovéto postupy lze však použít pouze u nevelkých tabu lek, jsou velmi pracné a mohou být i nepřesné. U "ručního" řazení dokážeme regi strovat pouze výskyt č i absenci sledovaného jevu, vlastní četnost výskytu zohlednit nedokážeme. U ryze početního přistupu je zase problémem prokázat, že jsme skutečně dosáhl i nejvyššího možného korelačního koeficientu, tj. zda by jiné seřazení tabulky nepřines lo koeficientještě vyšší. Dnes lze celý proces automatizovat a pomocí příslušného softwaru docílit seřazení KT tak, aby kore l ační koeficient měl maximální možnou hodnotil, tj . aby obsazená pole byla v tabulce co nejvíce diagOllalizována. Proces seriace i s užívaným počítačovým algoritmem a se základní literaturou podrobně popsal např. P. Ihm (1983; 1990), proto není nutné se mu zde dále věnovat. Podíváme se spíše na některé praktické aspekty spojené s užíváním této metody při řešení otázky chronologie sídlištního materiálu. Proč se seriace u archeologll těší velké ob l iběje zřejmé. Badatelé jsou přesvědčeni, že zadajíli do sloupdl správné vlastnosti archeologických objektll, lze pořadí objektll v tabulce získané seriací interpretovat chronologicky, tj. předpokládat, že objekty nacházející se v sousedních řádcích jsou si chronologicky blízké, kdežto objekty na jej ích opačných koncích jsou si časové vzdálené. 13.2 Problematika datové základny Mfl-li být pořadí objektú (např. řádkll) v tabulce chronologicky interpretováno, je nutné, aby byly vybrány takové vlastnosti, které jsou skutečně chronologicky relevantní. Zde se ocitáme v procesu vzniku archeologických dat. Tento proces představuje samostatnou rozsáhlou problematiku, počínaje 215 kritikou samotných pramenů , přes výběr archeologických situaci a nález!1 relevantních pro řešení daného problému, až po způsoby zaznamenávání a ukládání provedených pozorování. Pos ledně se u nás touto problematikou zabýval J. Rulf ( 1993), na jehož práci zde odkazujeme a problémem se dále ne- zabýváme. Je zřejmé, že formálně dokonalý a objektivní matematický postup prováděný automatizovaně pomoci počítače nepřinese správné výsledky, pokud pracujeme s vadnými daty. Podstatnou část chybných dat 11lllŽe a musí eliminovat sám archeolog při získávání a zpracovávání pramenll, tj. při tvorbě dat. Máme na mysli nejen klasickou kritiku pramenů, ale i teoretické úvahy, umožiíujíci správné vytváření dat ajejich zpracování, resp. pomáhajíci zjistit limity, za kterými práce s daty nemusí přinést objektivní výsledky (na příkladu síd lištní keramiky pojednal takovéto situace E. Neustupný 1996). Tím ovšem proces hodnocení a výběru pramen!1 (dat) nekončí, neboť v průběhu práce se zpravidla ukáží jej ich další nedostatky, které archeolog běžn)'mi pracovními postupy (předem) neodhalí. Kritika pra1llemi resp. dal tedy není jednorázovou počáteční pracovní etapoll, nýbrž praklicky lIekončícím prziběžllým procesem. 13,2.1 Data ze sídlišť a pohřebišť Seriace se dosud nejúspěšněji aplikuje při chronologii pohřebi šť (u nás např. E. Neustupný 1978), při zpracovávání sídlišť bývá užívána zřídka. D!lvod je zřejmě způsoben základními rozdíly v samotné pramenné resp. datové základně. Předně nálezy z hrobů lze zpravidla považovat za uzavřené nálezové celky: všechny nálezy jsou současné. U sídlištních nález!1 toto základní východisko postrádáme. Podstatný rozdíl je i v množství materiálu a sledovaných vlastností. Rozdíl je zpravidla i ve stavu bádání. Jestliže u pohřebi šť je již předem nástin chronologie více č i méně znám, u s ídlišť tomu tak vždy není, tj. jestliže u nález!1 z pohřebi šť je značná část chronologicky významných prvk!1 známa, u s ídlišť bývá nutné je teprve hledat. Významnou odlišností je i množství pramen!1 resp. nález!!. Zatímco u hrobových celk!1 lze zpravidla poměrně snadno zanést do sloupc!1 tabulky všechny nálezy (např. Mirón 1986), u sídlištního materiálu to bývá velmi obtížné (cf. zpracovávání sídlišť lengyelské kultury dle vypracovaného kódu; Podborský - Kazdová - Koštuřík - Weber 1977). Ne nepodstatnou od lišností je značně vyšší torzovitost nález!1 v případě sídlištního materiálu. U nález!1ze sídlišť je tedy kritika pramenů, tvorba dat, jejich ukládání a manipulace s nimi pod statně obtížnější, než u nález!1 z pohřebišť. Základní obtíž při přípravě dat pro seriaci sídlištního materiálu představuje nutnost výběru pramen!1 ajejich charakteristik, které hodláme sledovat. 13.2.2 Příklad - data z laténských sídlišt' v SZ Čechách Chronologie laténské sídlištní keramiky v SZ Čechách byla řešena z podstané části pOlllocí seriace. Podívejme se tedy, jak v tomto konkrétním případě probíhala práce s daty. Údaje, které jsou nezbytné pro řešení chronologie sídlištní keramiky se pochopitelně netýkají pouze tohoto materiálu. Je nutné registrovat údaje o regionu odkud soubory pocházejí, stej ně jako údaje o sídlišti a objektu, kde byly nalezeny. Proto vznikla soustava popisných systém!l, umožňujících jednotný popis a zaznamenávání potřebných pozorování. Tyto údaje byly zpravidla převedeny do numerického kódu a uloženy do systému databází. Databáze regiony (REG.DBF) registruje č íslo a název regionu a jeho kód rozsah: 5 regionů Databáze lokality (LOK.DBF) registruje přís lu šnost k regionu, čís lo lokality, název lokality a typ lokality (dvorec, oppid ulll. neopevněné sídliště apod.) rozsah: 22 lokalit Databáze objektll (OBJ.DBF) registruje příslušnost objektu k lokalitě (číslo lokality), číslo objektu (reálné číslo přidělené při výzkumu), typ objektu převedený do nUlllerického kódu (typář cf. obr. I), slovní poj menování 216 ,.., typu objektu, jeho délku, šířku a hloubku, objem zahloubeného objektu, počet nalezených střepů, hustotu střepů v objektu (ks/m'), výskyt nekeramických nálezů, předběžné datování, datování nekeramických nálezů a datování po analýze počítačem rozsah: 250 objektů Databáze nál ezů/keramiky (NAL.DBF) - registruje obecné údaje o nálezu (střepu): přísl ušnost k lokalitě a objektu, vrstvu, identifikační číslo, sektor objektu; dále vlastnosti keramického zlomku - tvar nádoby (typář obr. 2), tvar okraje (typář obr. 3), tvar dna, materiál, typ povrchu, umístění výzdoby a její druh (obojí je možné registrovat dvakrát; typář obr. 4), průměr ústí, max. délku, max. sílu, plochu, váhu, počet totožných jedinclI a odkaz na vyobrazení. rozsah: ca 50 000 střepů, uložených v 15000 záznamech V těchto čtyřech databázích propojitelných pomocí spo lečných položek, jsou uloženy informace, které byly považovány za relevatní pro řešení chronologie sídlištní keramiky (schéma cf. obr. 5; cf. též Salač 1993). Nyní je naší logickou snahou vytvořit z dat matici (KT), která se stane předmětem seriace. Vzhledem k množství dat musíme pochopitelně usilovat o automatizované vytváření kontingenčních tabulek, kde řádek bude představovat jeden objekt a ve sloupcích bude zaznamenáván výskyt určitých vlastností keramiky nalezené v objektu, 100 110 120 ilO 150 O ...."Il! !W slDUrntCH ''''!lIJv" fia1IcH II/1JiiISCG ~1JlE tu SlilK.I.IlIiSOmn; INIIV~ 600 .10 I CJ121 L J ~.122 G J 100 >-' o~ low >~ ~~ ~w "' ~~W H , ) Nw 62. 630 B ~ L J'" ~ ~ G J'" 300 O> w / , " ~ I 1 O$, ~ , , '--"- i:l ~< Oo" H 640 8 D( 1 ) L J 1ll \ ;=J 140 ~ O j lr-LJ-U 400 500 510 W )- ~ O · z ~ I (J~ ~ .;;l 15 > " . ~ ~ " > z '".~ f ~ ~ , O -u-< ~~ ~ -2~ ~ ~ ~ 65. 660 ® (~ HRNCiA.SKÉ P€CE TAVicf PECE 700 110 Z > ~ " ~.~ t3 800 720 O =KULTURN KULTUR ( VRSTVA SCHICHT == O = I995 Q J ' ilO Wc:= TORZA OBJEKTU OBJEKTRESTE I =---' TOPFEROFEN 740 m c:J CJ ~ c , lm OSTATNi (VÝJIMKY ) ANOERE (AUSNAHMENl ObL I. Numerický kód sídlišlnich objektu doby laténské v SZ Čechách. SCHMElZOFEN '60 I ) , , @TOPENfST~ FEUERSTELLE Již jen ze stručného popisu databází (cf. též obr. 1-4)je zřejmé, že množství charakteristik zachycených v datech vztahujících se kjednomu sídl ištnímu objektu je tak veliké, že nutně musíme pracovat s výběrem. Jinak řečeno, ve sloupcích zamýšlené matice není možné registrovat výskyt všech typů a variant sledovaných charakteristik, neboť práce s KT o někol ika stech sloupců by byla velmi obtížná. Mnohem dlliežitější ovšem je, že naším cílem není sledovat všechny zjištěné charakteristiky, nebot' je zřejmé, že všechny nemají stejný chronologický význam (cf. např. chronologický význam položek tvar okraje a síla střepu). Výběr jednotlivých charakteristik (např. tvar nádoby, tvar okraje 217 apod.) které se mají objevit ve sloupcích KT, lze v dnešních databázových systémech snadno zajistit příslušnými příkazy. Zásadní potíž však způsobuje archeologův požadavek, nesledovat pouze jednotlivé charakteristiky keramiky, ale především jejich kombinace, které nadále nazýváme vlas/nastmi. Např. mísa se zataženým okrajem (typy 221 , 222, 223; cf. obr. I) sama o sobě nemá chronologický význam. Je-Ii však tato mísa vyrobena na kruhu (typ povrchu 100, 110) aje-li zárovel} zevnitř (umístění výzdoby 200) zdobená vh lazovanou vlnicí (typ výzdoby 62 1 atd., viz typář na obr. 4), představuje již chronologicky citlivý nález. Snahou archeologa tedy bude, aby se výskyt mísy se zataženým okrajem vyrobené na kruhu a s vhlazovanou vlnicí na vnitřním povrchu registroval v jediném sloupci. Problém je však složitější. Jak jsme konstatovali, u sídlištniho materiálu ne vždy předem odhadneme chronologickou citlivost určité vlastnosti. Zů staneme-Ii u příkladu misy s vhlazovanou výzdobou, existují hypotézy, že vhlazovaná výzdoba se objevuje nejprve na vnitřku nádob a teprve pozděj i na vněj š ím povrchu. Existuje i předpoklad, že vhlazovaná výzdoba se vyskytuje dříve na keramice točené na kruhu než na nádobách vyráběných v ruce. Vysloven byl však i přesně opačný názor, tj. že hrubé mísy s vhlazováním jsou starší a představují vzory pro mladší keramiku točenou na kruhu. Jen u jediného tvaru, jediné výzdoby, dvou typů umístění a dvou typů povrchu, tedy potřebujeme otestovat všechny vzájemné kombinace, přičemž výsledek, tj. chronologický význam předem neznáme. Napi. je možné, že chronologicky citlivá je pouze základn í vlastnost, ~. mísa se zataženým okrajem a vhlazování, přičemž technologie výroby ani umístění nejsou vllbec důležité. Z předešlého odstavce vyplývá, že při tvorbě chronologie sídlištní keramiky je nutné definovat značné množství vlastností. Proto se ukázalo užitečné vytvořit samostatnou databázi vlastností, jejichž chronologický význam chceme testovat (cf. obr. 6). V této databázi jsou zadány pomocí interval ů čísel požadované vlastnosti, tj. kombinace různých jednotlivých charakteristik. Tím odpadá namáhavé opakované zadávání definic jednotlivých vlastností. Zadání našeho příkladu (mísa se zataženým okrajem vyrobená na kruhu s vhlazováním vně) tedy bude vypadat následovně: kód tvaru nádoby (cf. obr. I) se musí pohybovat v intervalu <221 ,223> a zárovell kód povrchu musí být v intervalu <100,199> a zároveň kód umístění výzdoby musí být v intervalu < 100,199> a zároveň kód výzdoby (cf. obr. 4) musí být v intervalu <620,639>. Pomocí takovéto definice získáváme jeden sloupec KT. Výpis zjedné dílčí databáze vlastností přináš í obr. 6, náš příklad je na posledním řádku .Takovýmto zpllsobem lze nadefinovat vlastnosti, které chceme mít zastoupené v seriaci, tj. vlastnosti, které mají být obsaženy ve sloupcích matice (KT), která bude vstupovat do seriace. ,:::I~o uf..r lZl y\P1"" "" ,,~u , onou"" Ir ~~WC( H IN ' I OILQUO " "' ~ 'YCE Uh" I OMOUI< Y O I>Cl IT[NT .... " ' Oll W"HI)"""'N ,,_ ..." , lOGEM IN on W"NOl'N " J ,o<;v< IH oU "''''''Ill''''1 I lOGl" ~~;'"~6 D(~Wo\ICll'''''' '0, t '"I' O 10·,,1.,"0 VO .~.bQ t G>O I ~ "u..o ... ~~ I pl UIT':!'" !NIOO,,,ZlNt "~DlJ:':s...u.. H~DlO... ÚHI >v I ... jil Vl.TI:5V : jil US11~~.. j6D€~ ...u..· 1~""!::S;.Y III CU NUNOI:I< :Uw..IGHlHn~ ....' s ~l(;UlnTl~t1Q7'w :CD CDI CD "..., \IICDI CD rnm:W CD I '" Ul! ...", 1 meDru '" \17 1 1 u. m WI :ww SlTULY UlUUH ...I .'0 1 \Ir(EbN IKY 800 - TY Pl NEROZLlJEHY W:$EIlIER ... TYPEH NICHI UNIUSCHIEDEN flAOOlY ~l Z"T~· !l...." O~ M)l " LAHVE FLASCIIEN 50.GU A,I)I " IT ..... : ..,'(GIN.."," ~~"'o Cl) ))'" ,', Ul ll> 2H I 1 ~ 19 I.hOIIlI(E VOUUSGUAUE 100 , ,I '91,I " 710 1 n o - : . , • b l ~i: ..UH" V" lU" fT\:1l\. , },,~ , ' I "{$$VN(; Dll '0, W ' N~rl l .. Obr. 2. Numerick)' kód Inténské sídlištní keramiky v SZ Čechách - tvary nádob. 218 100 SOUDKY' FASSCHEN . I 2 3 • 5 6 8 , -''''-' "'\ -, ~ ~ , ~ "'\ , \ ~ ~' ~ ,-, ~ ~ ~ ,~ "'7'" 1 -.200 MlSY· SCHUSSElN I 2 J • 5 6 7 8 , -''''~ --, ~ --, --, -, --., J ? ~" 1 --. 1 --., ~ J ., --. ""l 7"'7 7 --, 7 7 7 7 ~ J" ~ ~ ~ ~ -, 7 1 ~ 7 1.." 1 1 r ---r --r 7 { l J T l' -, 1'" ~ \ =J' 'J cr300 HRNCE · TOPFE I 2 J • 5 6 7 8 , ~316 1.. 1 ~ --... --... ~ --, 1..»' -. ~ -. ~ ~ ~ -.. 1 ~'" l 1 -, 1 l. --,. =t"' t ~ 1" t "1.~' ~ Obr. 3. Numericki' kód laténské sidlištní keramiky v SZ Čechách - okroje nádob (část). REGIONY.DBF LOKALlTY.DBF h lOKI.DBFl1 LOK2.DBFJ OBjEKTY.DBF NALElY.DBF J~ AU.DBF NA12.DBf 400 IEMNA VÝWOBA FEINE VERZIERUNG 1 2 3 4 S 6 7 B '" ···::1..... 1=1 .... ....f.... ." ,,"",! "'1 -"I ~( Ol' -\ -=\ ~ -'-\ =\ ." '" \ 500 KOLKOVANÁ VÝ7"n STEMPEI"VERZIERUNG 1 3 4 S 6 7 B 9 ••• C00 00~ •••• '" ••j.. 52' nn 5J8 00 00 '" IU 'tY '50 "''''' [!(J Obr. 4. Numerický kód laténské sídlišLní keram iky v SZ Čechách - výzdoba (část). SCHEMA DATABAzoVÝCH SOUBORŮ LIITI:NSKl\ SíDLITIl v SZ Q:CIlACH VLASTNOSTI .DBF Obr. 5. Systém databázových souborů registrujících data vybraná k fešení chronologie laténské síd lištní keramiky. 219 CUl. OZNAVI... CENI 1 TOl '1 T07 11 n.l 12 T12 13 T13 14 TU 1:) TU 17 T17 30 T20 26 t26 27 t27 30 T::JO 33 t3::J 41 ,,,1 ", T4' U Ut4. T01-02 50 r02-02 '1 T03-03 :t2 T04-03 154 ro:t :t, T06 156 T07 57 Toe g~ l8!0 60 T011 tJ fgU44 TOl' t= ni70 TII1-0" 71 rV2-04 72 TV3 73 01-0' 74 02-0' 83 P03 88 P08 93 PUVl '4 PUV2 95 PUY::J 96 PUV4 97 PUVS 98 PVV6 9' UV1 100 UV2 ,Ol UY3 102 UV4 1.03 UV' 112 Y09 liS VID 11' V12 116 Vl::J 117 10'14 121 Vla 1.24 V21 125 V22 g, ~~2 130 "'27 131 V2B g; ~U 140 113" 142 10'39 1419 ""6 150 \1'47 151 "'".15a V4" 1'6 V53 1"7 V:lI4 O PRlKl..AI) VI..A_TNOSTI NALEIU TVA TYA lVA TVA TVA TVA POV POV UNl UKl o_u DRU PRU PRU NAD NAD OKR OKR DNA OKA RCH RCH VVZ YV~ VYl VVI ueT uaT OD DO OD DO OD DO 00 00 DO DO OD 00 00 DO 100 1'" 210 21t mu~ mm~u in:uo 32' Ug u;330 33. 700 799 610 61' 620 629 9tO 'tO ~u ~n 233 234 2::J3 2::J4 100 tf9 100 1•• 100 199 100 19' 100 1'.100 1" 100 19" 700 7." ~gg ns ~~g j~~ ~3~ 2~~ 400 49. o o o o o o o oo o o o o o g g o o o o o o o o g 8o o o o o o o o o o o o g g o o • oo o o o o o o o o o • •• oo o o o o o o o o o %21 223 o 8 g o o o o o o o o o o 8241 2'.201 203 "OU.,,.u. U. 137 u.710 720 730 o •o •o 28. 30. •••o •o o o ••o g ••8 •o g 8 g o o o o o o o o o o o o g g 8 8 g g o o g ...207 ~u ".Ul 13' 13' 13' 137 u.7" 72' 73~ &o •28. ,..o o o o o o g o o o g o •g o o g g •g o o o o •o o o o o •g g g g g g o o go o o o •o o o g o o o o •o o o o o o g o o o o o o •o o o o o g o o g g g o o o o o o o g o o g g o o • o g g g g g g o o o o o o o o g g g g g & g g o o o o o o o o o o o o o o o o 0200 g 1~ o o g g • o o .00 o 250 o 100 o 100 o 100 o 100 O 200 g21o o o o o o o o o • g g o o o o g g g g g io o o o o o o o o o o g g g o 100 o g g o o g o o •o g •o o o g g g o o o o o 2 •• ...o •o o o 2" 2.' '"...,.....••••••o o g o o g g o o g o g o o o o •o o o ... •g •o g g ••o o o o 8o o 8 ••o •o •o o o o o o o •o •o o o '00 100 100 200 200 '00 '00 '00 '00 200 200 o o •g o o o g o o 8o •o o •o o o ••0 g 0 0 0 g o o o • o • • o & g g g g go o o g & g & g g 8 g g g g o o .g• 8o o o g g g i g go o o o • • o o o g g g o o o o 41.0 419 o 420 42' o 230 239 o • • o • o o o o o o o 29" 6:Z0 639 199 620 639 HP., 610 614 2'l'9 610 614 2.. 620 63. 1"" 620 639 1"" 620 .39 1.," 610 614 29. 600 6.,9 ~;; :n .u:o 131 131 o 140 149 o 160 169 o 170 179 g U& 5no 230 23. o 234 234 o :.UO 31. o 320 329 o 330 ::J3. o 340 349 o 410 42" o 430 439 o 450 459 o :!Joe ~.9 o 610 61. o 620 63" o 620 629 o 630 639 o 71.0 719 o 720 72. 19. 620 639 o g o o 8o g o o o g 8 g 8o g o o 8o o o g o o o o o o o o o o o o o o o o o o o o o g o o o g 8o o o o o o o o o o 8 g 8 g g •o g g o o 8o o 8o o o o o g g o o •o o o •8 •g o o •g o o o 8o o o o o o g o o o o •o o •o Obr. 6. Výpis z dílčí databáze (NAVBI LI.DBF) vlastnosti nálezů (keramiky), která registruje vlastnosti z Bílinska. 13.3 Program - Kombinační analýza archeologických nálezů (KAAN) 13.3.1 Tvorba matic Máme-Ii vytvořena data, která potřebujeme k řešení chronologie, ~. data zachycující úd~e o místech nálezů a o nálezech samotných, ale také charakteristiky a vlastnosti nálezll (tzv. deskriptory), které považujeme za relevantní, stojíme před klíčovou úlohou - vytvořit matici, kde v řádcích budou (v našem přikladě) objekty a ve sloupcích vlastnosti keramiky. Protože vlastnost (např. ve sloupci) představuje kombinaci jednotlivých charakteristik nelze v databázových systémech požadovanou matici vytvářet automatizovaně pomocí běžných příkazů, proto byl vytvořen zvláštní program, který automatizovaně vytváří z výše uvedených databází matici (KT), kterou požadujeme (schéma programu viz. obr. 7). Program, který se nazývá "Kombinační analýza archeologických nálezů - KAAN" umožlluje vytvářet z uvedených databází tři druhy kontingenčních tabulek (podrobný popis programu cf. Kubálek - Salač 1994). Typ A - v řádcích KT jsou objekty, ve sloupcích vlastnosti keramiky (nálezll), které jsou nadefinované a uložené v databázi vlastností nálezů (NAV.DBF). Typ B - v řádcích KT jsou objekty, ve sloupcích jediná vybraná charakteristika (např. pouze tvar, pouze výzdoba atd.). Program v tomto případě nepracuje S databází NAV.DBF. 220 Typ C - v řildcích KT je vybraná jedna charakteristika keramiky (nálezú) a ve sloupcích jiná vybraná charakteristika. Např. v řádcích je tvar nádoby (co řádek, to jedna varianta tvaru) a ve sloupcích průměr ústí (co sloupec, to jeden rozměr uvedený v cm). Program pracuje pouze s databází NAL.DBF. 13.3.2 Práce s maticemi KOHBINAC'Nt 1\N1\L'iZ1\ l\RCHEOLOOICKYCH N1\LEZŮ S u UPR YY II > i------~~~----~ Obr. 7. Schéma práce programu KAAN. ",.esv fXPORT Pro řešení chronologických otázek mají největší význam matice typu A, proto všechny příklady budeme uvádět na tomto typu; způsob práce s typy BaC je totožný. Program KAAN umožňuje automatizovanou tvorbu KT, což je zakladní předpoklad pro zpracovávání síd lištního materiálu, neboť oproti práci s pohřebišti je třeba vyváření matic zpravidla mnohokrát opakovat. Vytvořením dilčích účelových databází, které velké databáze omezí např. dle regionu (např. pouze Bílinsko), nebo dle typu objektů (např. pouze polozemnice) umožn í zaměřit se detai lněji na dílčí problém (např. chronologii jediného regionu apod.). Vytvořené matice je však vždy nutné dále upravit, neboť zpravidla obsahují řádky (objekty) s malým počtem obsazených polí nebo mající dokonce všech polích nulu (sledované vlastnosti se v objektech vyskytly zřídka nebo vllbec ne). Takovéto řádky nejen, že nemají pro seriaci žádný smysl, ale nulový řádek celý matematický postup zablokuje, takže jej nelze provést. Tyto řádky (sloupce) je nutné odstranit. Program KAAN umožňuje automatické odstranění nulových řádků a sloupců. V matici se mohou dále vyskytnout objekty, o kterých víme, že jsou buď superpozicemi, nebo jejich soubory byly skartovány, mají problematické nálezové okolnosti apod. I tyto objekty je nutné z matice odstranit, neboť nejen, že jejich chronologická hodnota je sporná, ale mohou ovlivnit uspořádání 221 celé matice, tj. i pořadí (datování) kvalitních souboril. Dále může KT obsahovat řádky (sloupce) pouze s jedním obsazeným polem. I tyto řádky resp. sloupce mají pro chronologii minimální význam. Podobně je tomu i u s loupců (vlastností), které mají obsazena všechna pole, neboť vlastnost vyskytující se ve všech objektech k řešení chronologie zpravidla také nepřispěje. Za určitých okolností ani vlastnost vyskytující se dvakrát, třikrát apod. nemá chronologický význam. Někdy chceme pozorovat matice v seriaci bez určité konkrétní vlastnosti či objektu. V souladu s těmito požadavky umožlluje program automatizované vyřazování řád kil a sloupcil, nesplňují-Ii určité požadavky (příkaz typu "odstraií všechny sloupce, které nemají obsazena alespoň tři pole") umožiíuje i vyřazování libovolných jednotlivých řádkil a sloupců dle požadavku uživatele ("odstrarl řádek č. 38" apod.). Někdy je výhodné určité sloupce i řádky sečíst, např. některé vlastnosti byly příliš lIzee definovány (viz náš příklad s vhlazovanou mísou - zde milže být výhodné sečíst sloupce sledující vhlazování zv l ášť zevnitř a a zv lášť vně a sledovat obecné kombinaci - misa a vhlazování). I takovouto práci s maticemi program 1Illložiíuje. Aby program splrl0val určitý uživatelský komfolt, umožlluje ukládat KT v libovolném okamžiku (v rilzném stadiu zpracování), či naopak vyvolání již uložené tabulky, dále grafické zobrazení r·ádku či sloupce, převedení KT se skutečnými četnostmi na tabu lku absence x presence (APT), možné je i převedení absolutních hodnot na relativní (100% může představovat obsah jednoho řádku či sloupce nebo obsah celé tabulky) apod . • )Ln j.~ :!!J"JI!i& Ui W42U4i blitY»"" aJi! I KOMBINACNI ANALYZA ARCHEOLOGICKYCH NALEZU uvodni menu 1 tvorba kombinacni tabulky z dat porizenych dBase 2 vstup kombinacni tabulky z pevneho disku (diskety) 3 zaznam kombinacni tabulky na paYny disk (disketu) 4 upravy kombinacni tabulky 5 ciselne zobrazeni kornbinacni tabulky 6 graficke zobrazeni kombinacni tabulky 7 seriace 8 obráceni tabulky 9 konec prace s programem LOK, OBJCH, NALOl, NAV31, help obrazovky, help programu, prehled funkci klaves. (c) Ing. T. Kubalek - PhDr . V. Salac, unorl992 Obr. 8. Základní menu programu KAAN. Na tomto místě nelze zacházet do detailil, základní možnosti programu naznacuJe ukázka hlavního menu programu. Zůstallme pouze u konstatování, že chceme-Ii se zabývat seriací sídlištního materiálu, musíme se vypořádat S vytvořením relativně značného počtu dat, dále s jeho smyslupln)'1ll uložen ím v určitém systému umožllujícím následné automatizované vytváření KT. Vytvořené tabulky je zpravidla nutné automatizovaně upravovat. Zhruba v těchto momentech se setkáváme (narozdíl od zpracovávání pohřebišť, kde většinou pracujeme s jednou či několika málo základními maticemi) při zpracování sídlištního materiálu s největšími potížemi. Máme-Ii je však vyřešeny, můžeme přistoupit k seriaci. 13_3_2_1 Poznámky k terminologii Abychom si v následujících příkladech usnadnili popisování matic, budeme užívat následující terminologii. Dlouhý sloupec (ládek) - sloupec v němž je obsazeno velké množství polí, tj. vlastnost (charakteristika) je zastoupena u velkého množství objekW (řádků) - zpravidla jde o výskyt v nadpolovičním množství polí (lIdaj v posledním řádku matice, vytvořené programem KAAN) Krá/ký sloupec (i\ídek) - sloupec, v něžje obsazeno pouze několik polí 222 Souvislý sloupec (řádek) - sloupec, který má po seriaci větši nu obsazených řádků v pořadí za sebou Nesouvisl), slol/pec (Mdek) - sloupec, který má po seriaci velké mezery mezi obsazenými řádky Těžkj' sloupec (r'ádek) - sloupec s nadprl.měrně vysokými četnostmi, cf. údaj v předpos ledním řádk u tabulky. Lehký sloupec (Mdek) - sloupec s podprl.měrnými četnostm i Těžké (lehké) pole - pole v matici s nad- resp. podprl.měrnou četností v rámci sloupce, či celé tabulky. Tyto termíny jsou analogicky uživány pro objekty či vlastnosti. Pojmenování jsou v konkrétuích případcch spojována - např. souvislý dlouhý těžký sloupec (řádek, objekt apod.), krátký lehký sloupec (objekt, řádek) atd. 13.3.3 Seriace Máme-I i již KT připravenou natolik, že chceme, aby byla provedena seriace, ml.žeme ji pomocí programu KAAN provést. Lze volit, zda má být provedena seriace registrující pouze výskyt či absenci vlastnosti (seriace absence x presence, dále SAP), nebo seriace pracující se skutečným i četnostmi, ať již absolutními či relativními (kvantitativní seriace, dále SK). Po provedení seriace se zpravidla ukazuje, že uspořádání KT nemůže být chápano jako konečné. KT je nutné dále upravovat a seriaci provádět opakovaně. Program umož"uje po každém kroku provedení výše zmíněných úprav KT, zárove" je možné pozorovat, jak se po případných úpravách mění korelačn í koeficient (dále jen Kl), tj. zda provedené úpravy ved ly k jeho zvýšení či naopak. Některé možnosti práce s programem KAAN, tj. některé aspekty využití seriace, si ukážeme na následujících přík ladech. 13.4 Příklad. Seriace laténských sídlištních keramických souborů ze SZ Čech Vzhledem k nedostatku zkušeností s nasazením seriace ve větš ím měřítku se zdálo nevhodné pracovat od počátku se všemi daty, tj. s rozsáhlými maticemi. Jako nejvýhodnější se ukázalo zpracovávat samostatně nejprve jednotlivá síd l iště, následně regiony a teprve na závěr provádět celkovou seriaci. To umožnilo nejen lépe kontrolovat a interpretovat pořadí objektl' v tabu lce po seriaci, ale postupně i poznávat význam jednotlivých vlastností keramiky pro řešen í chronologických otázek. Na počátku vznikla databáze vlastností keramiky (NAV.DBF), která obsahovala 160 definic vlastností. Jižjen prvotní vytvoření celkové matice ukáza lo, že některé vlastnosti materiál vl,bec nevykazuje, jiné se vyskytly zcela ojediněle. Z matice rovněž vyplývalo, které vlastnosti jsou vázané reg ioná lně. Na základě tohoto předběžného pozorování byly vytvořeny dílčí databáze vlastností keramiky typických pro jeden region - např. Bílinsko (NAVBIL.DBF, výpis obr. 6). Nejprve byla prováděna seriace síd liště v Břeš!'anech, analogicky tedy vznikly dílčí databáze obsahující objekty pouze z Břešťan (OBJBRE.DBF) a nálezy pouze z tohoto sídliště (NALBRE.DBF). První seriace byly prováděny na břešťanském materiálu předevš ím proto, že toto s ídliště bylo před lety zpracováno klasickým postupem (včetně "ruční seriace"). Jeho chronologický vývoj byl tedy v hrubých rysech znám, což umožnilo snáze porovnávat výsledky počítačového zpracování a běžného archeologického postupu při řešen í otázek datování. 13.4.1 Břešťany Vyhodnocení laténského síd li ště v Břešťanech bylo publikováno včetně výsledku "ruč ní seriace" a jeho interpretace (Salač 1984,266; zde obr. 9). Nej prve proto byla provedena za pomoci programu KAAN seriace již publikované tabu lky. M,.žeme tak nejen ověřit tehdejší výběr 18 sledovaných vlastností, ale i porovnat možnosti "ručního" 223 - . a počítačového vytváření matic a jejich seriace. Výsledky automatizovaného vytvoření matice se stejnými 18 vlastnostmi a její seriaci přináš í obr. 10 (tabulka S IA). I když publikovaná tabulka přináší v podstatě seriaci absence x presence (SAP), přesto byl tehdy odlišen "běžný" výskyt od výskytu "ojed i nělého". Toto elementární kvantifikační rozl išení výskytu vlastnosti bylo vedeno snahou eliminovat druhotné intruze do objektlJ. V případě použití programu KAAN jde o výsledek SAP, bez jak)'chkoliv kvantifikačních hledisek. Přesto tabulka SilA vykazuje stejné řazení objektl', jako matice publikovaná (Salač 1984, 266). Korelační koeficient matice uspořádané programem KAAN dosahuje poměrně vysoké hodnoty Kf=O,732 (možné maximum Kf= I). Výsledek nasvědčuje tomu, že Pl.vodní "ruční" SAP vybraných vlastností keramiky byla opodstatněná. A B 2 3 4 S 6 7 8 9 10 II 12 13 1<1 IS 16 17 ~ Obj.5 x x x x x x x x x 1Obj. 15 o x x x x Ohj. 17 " x x x x " 2 obi· 16 x x x x x Obj.14 x x x x x 3Ohj.9 o o x x x x Ohj. 6 " x x x x x x 4Obj:7 o x x x x x x x Kombinační tabu.lka: 1. Omfalos na dně jemné keramiky. 2. Situla s vpichy či důlky na rnui.~ mtilnl výdu'ti (T 400 + V A 05 230; k6d použitý v Kalalogu; obr. 4: 1).3. Tzv. hrauhai!lké mísy s !Úzkými odsazenými okraji (T 231 + 0237.8,9; obr. 4 : 4-6). 4. Tytéž mísy s rýhami resp. ..ubry"(T 231 + V 410; obr. 4: 6). 5. Výzdoba vrypy, vpichy (V 210. 220). 6. Kolkovaná výzdo~ ha (V 500; obr. ,,: 13). 7. Důlky prstem (V 230; obr. ~: I). 8. Plastické Ility na hruhé keramice (V 3l0; obr. 4: lOl. 9. Nečleněn6 k6nické misy (T 210; Ka,. obr. 24: I). 10. ~Hsy esovité profi.lace 5 žcbirkeul v podhnlli (T 233 + V 420; ob•. 4 ; 21).11. Čemý smolný nátěr (V 710).12. Soudkovitě tvary !I chuchvalcovitým drsněnhn (T 233 + P 2; obr. S: S). 13. Mílin se zataženým okra.jem vyrobenli na kruhu (T 233 + P 1; obr. 5: 2). 14. Pravidelné rýhov(mí (V Ul, obr. S: 16). 15. VhJazovaoá. vlnovka zevnitř (V B 620; obr. 5: 3, IQ, ll). 16. Zásobníce (T 700; obr. 5: 21). 17. Ryta vlnovka vně (V A 140; obr. 5: Ll, 21. 25). 10. VhlatOV3ná výzdoba voe (V A 600; obr . 5: 23). - Běžný výskyt v objektu tllači x, ojedinělý výskyt (intru:z:e?) oznQ~uje o. Obr. 9. Břešťany. Kombinační tabulka 7..achycující výskyt vlastností keramiky v objektech (Salač 1984.266: do p l nčno o hranice hori zontů). Kf 0,13 Kf = 0, 865 Sl. Břeštany - aerlační tabulky; A - serlace aba. x prea. (dále jen SAP) , cf. Salač 1984, 266) B - serlace beroucí v úvahu kvantitatlvni údaje (dále jen SK) Obr. 10. S 1- l3řcšťany, seriacc pomocí programu KAAN publikované kombinační tabulky (cf. obr. 9; silná (;ísla nad jednol1iv)'mi sloupci odpovídají pořadí sloupcil v púvodní kombin<1ční tabulce), A - scri<1ce ab:;. x pres. (SAP), 13 - scriacc beroucí v úvahu četnosti v)'skytu (kvantitativní seiacc - SK). 224 Při bližším zkoumáni kvantitativního obsahu však je zřejmé, že hranice mezi výskytem "běžným" a "ojedinělým" byla značně subjektivní. Ostatně je j istě sporné, zda je zdi.vodn itelné chápat výskyt I za "ojedinělý" a výskyt 2 za "běžný". Proto byla provedena kvantitativní seriace (SK), která bere při diagonalizaci matice v úvahu skutečné hodnoty v jednotlivých polích. Výsledek SK přináši tabulka S liB (obr. 10), jejíž korelační koeficient dosahuje vyšší hodnoty než u tabulky předchozí - Kf = 0,865. Při řazení objektů vznikla odchylka - na řádcích 3. a 4 a 5.a 7. řádku si objekty zaměnily místa, přičemž obj. 7 řazený do posledního (nejmladšího) břešťanského horizontu se ocitá výše než objekty z 3. horizontu. Toto zj ištěn í vzbuzuje urč ité pochybnosti o vyčlenění dvou nejmladších horizonti. na břešťanském síd lišti. Další krok představuje práce s podstatně vyšším počtem vlastností keramiky, tj. vytvoření základní matice, kde je ve sloupcích 73 vlastností z databáze NAVBlLLDBF (cf. obr.6). Tato dílčí databáze již reaguje na poznatky získané testováním vlastností a neobsahuje ty, které se na Bílinsku nevyskytují. Na druhé straně byl při jejím vytváření kladen di.raz na to, aby obsahovala co nejvíce vlastností, tj. aby byla co nejobjektivnější a zárove.!, aby zohled'10vala kvantitativní výskyt vlastností, které samy o sobě nemají přílišný chronologický význam. Za pomoci této databáze vznikla základni matice (obr. 11),jež byla následně podrobena seriačním prOCeSill11. Přitom se ukázalo, že ze 73 vlastností očekávaných na Bílinsku se jich v Břešťanech samotných vyskytuje pouze 57. Výsledkem SAP je tabulka S2/A (obr. 12) S nepříli š vysokým korelačn ím koeficientem (Kf= 0.589). Ukazuje se, že zařazen í velkého množství vlastností prakticky bez výběru, podstatně zhoršuje možnosti SA P. V řazen í objektů dochází k nemalým změná m . Objekty nejstarších dvou horizonti. si navzájem prohodily místa, podobně jako v nejmladších horizontech. Zajímavé a důležité je, že nedošlo k výměně mezi staršími (LT A-B2) a mladšími horizonty (LT C I-C2), a to ani v takto minimálně u spořádané matici. Tabulka S2/B (obr. 12) ukazuje výsledek SK; korelačni koeficient má hodnotu 0.661, tj. je vyšši než u předchozi tabulky. V tomto případě již řazení objektů spíše odpovídá původní představě, ovšem u mladších objektů opět dochází k záměně pořadí, které se odlišuje od všech předchozích seriačních výsledkil. Vzhledem k dosavadním poznatkillll o chronologii laténské keramiky se však zdá být evidentní, že se v objektech vyskytují druhotné intruze. Je možné, že právě tyto intruze zabra'lují vyčlenění dvou nejmladších horizonti., č i jiným způsobem podstatně ovl iv'lují výsledky SAP i SK. Pokusíme se tento předpoklad testovat. Vyřadíme z databáze vlastnosti zatrhnuté na tab. S2/B (obr. 12), které budeme považovat za intruze. SAP a SK takto upravené matice ukazují tab. S3/A-B (obr. 13). Výsledek SAP vykazuje nepatrně vyšší korelační koeficient Kf = 0.608, přičemž pořadí objekti. se prakticky nezměn ilo. Matice po SK má rovněž poněkud vyšší korelační koeficient Kf = 0.679, přičemž pořadí objeklil v horní polovině tabulky se nemění. Naopak ul11ladších horizontů dochází opět ke změnám. 225 SOo Břeštany. kombinační t abulka před s eriací (ve s loupcích vlastnosti z NAVBILI.DBF). Obr. II . SO- Břcšťany, n euspořádaná kontingen ční tabulka (v fádcfch objekty, ve sloupcích vlastnisti z databáze NAVBILI.DBF, cf. obr. 6). S2 . Bře š l any , A - SAP B - SK K< Kr . 0, 589 i i: 1 I I ' '" 0 , 661 : : ,' Obr. 12. S2 - Břcšťany, seriacc se všcmi vyskytujícími se vlastnostmi (A - SAr; B - SK; křížkcm označen výskyt považ,ovaný nadále za intruzc). 226 A ~;:i!~:m;WĚf::;;:, ....,.:.::::t: I : ~t·!CVMI"· B 5). Dřeětany , eer!ační tabulky po vyřazení lntruzi ( cf . 32), A - SAP , B - SK Kr .. 0 , 608 . . .ITI' ,' I' '. ' Kr • 0.673 I , I , I :II,! ' I Obr. 13. S3 -lHešťany. seriace se všemi vyskytujícími se vlastnostmi po vyřazení předpokl ádaných iJ1lruzí (A - SAP, B - SK). A Kf = 0,701 B Kf • 0,857 84. Obr. 14. S4 - Břcšťany, seriace po vyřazení krátkých objektú (ménč než 4 obsazené sloupce), krátkých (vlastnost vyskytující se pouze ujcdiného objektu) a dlouh)'ch (výskyt u více než poloviny objektů) vlastností. včetně ná l ezů považovaných za inlruze (A - SAP. B - SK). 227 A B Kr - 0,915 ~~. "'4 "'~ ....V t ~... ~ ....s5" JI~"~JNm"..!i!".r18'lfl.Jr;n K"'ŘfaiRj,,1\1 ,;,'.!b.zf'Zh",lh!c:"á"'írtíJ'e ...,,3.n~te~"'t;;'~~uZ~,;"""·· (......w ~~.. .... _-f ' A - SAF, B - SK. Obr. 15. SS - Bfcšťany, seriace po vyfazení dlouhých a krátkj'ch vlastností a objektí! (podmínky cf. obr. I), předpokládané intruze byly rovnčž vyřazeny (A - SAr, B- SK). Porovnáme-Ii výsledky před a po vyřazení předpokládaných intruzí, zjišťujeme, že intruze, které dokážeme snadno rozpoznat - tj. ojedinělé výrazné intruze, tabulku s dostatečným počtem vlastností ovlivní pouze nepatrně, jejich vliv na pořadí objektit je zanedbatelný a prakticky není nutné je eliminovat. Všechny dosud vytvořené matice jsou zatíženy tím, že se v nich vyskytují objekty (1001, 1003, 10 II ), v nichž je zastoupeno málo vlastností (krátké objekty) a zároveií obsahuj í vlastnosti, které se vyskytno't pouze u jediného objektu (krátké vlastnosti). Na druhou stranu se zde objevují i vlastnosti (dlouhé), zastoupené ve většině objekti, a mající tedy po stránce kvalitativní pro chronologii malý význam. Zadáme tedy před další seriací dvě podmínky - a) budou vyřazeny všechny objekty, které nemaj í obsazeny alespotl 4 sloupce, b) budou vyřazeny všechny vlastnosti, které se vyskytnou pouze u jediného objektu (přes fakt, že se tím může ztížit datovaní objektu 1005, který představuje sám nejstarší horizont), c) vyřazeny budou rovněž všechny vlastnosti, které se vyskytují u nadpolovičního počtu objektl' (tj, u více než šesti). Výsledky SAP a SK po těchto úpravách přinášejí tab. S4 a S5 (obr. 14-15). Tabulky S4/A-B (obr. 14) obsahují SAP a SK upravené základní matice, tj. včetně domnělých intruzí, obě mají v porovnání s maticemi S2/A-B (obr. 12) podstatně vyšší korelační koeficienty u SAP Kf= 0.70 1 u SK 0.857. Pořadí objektú u SAP vykazuje změny v horní i spodní polovině tabulky, Umístění obj. 5 na druhém řádku je zl'ejmě dáno vyřazením vlastností typických pouze pro nejstarší horizont, neboť objekt je z tohoto horizontu jediný. Pořad í ostatních objektit v tabulce je j iž tradiční - horní polovina se shoduje z již publikovaným datováním, ve spodní polovině tabu lky se opět nepodařilo odlišit dva nejmladší horizonty. Stejným způsobem byly upraveny i matice zbavené předpokládaných druhotných intruzí. Výsledek SAP je na tabulce S5/A (obr. 15) (Kf= 0.787), výsledek SKje na tabulce S5/B (obr. 15) (Kf = 0.915). Tyto tabulky dosahují již značného stupně uspořádání vzhledem k diagonále. V pořadí objekti, se však liší od předchozích dvou (S4/A-B) (obr. 14) pouze v detailech. Výsledky získané aplikací programu KAAN odpovídají vyčlenění dvou nejstarších horizonti, v původní publikaci. V případě spodní poloviny tabulky (3. a 4, horizont, Salač 1984) se prokázalo, že její materiál se od keramiky z předchozích časových úseků (horní poloviny) zřetelně od lišuje, avšak rozdělit jej na dvě skupiny, tj. do dvou časových horizontů, se seriací nepodařilo . V případě objektu 1007 je nápadné, že ve všech tabulkách vykazuje velké množství vlastností (dlouhý objekt). Což s nápadnou blízkostí objektu 1006 v terénu (cf. Salač 1984, obr. I) vzbuzuje podezření, zda tato skutečnost není zpi,sobena druhotnými intruzemi z objekti, fáze bezprostředně předcházející, či naopak navazující (blíže cf Sa lač 1995). Takovéto intruze nelze eliminovat na zákl adě empirické zkušenosti, do procesu interpretace tedy nutně musí vstupovat vztah k okolním objektllln, 228 konkrétní poloha nález,. v objektu apod. V případě Břešťan však nálezové okolnosti neumožiíují tento problém dále řešit. Výsledné pořadí objekt,. bylo zařazeno do sloupce "datování 2" záhlaví tabulky S4/B. Toto pořad í bude dále testováno v analýze bílinského regionu (cf. zkratka BR v .,datování 2" u tab. S6-8). Pořadí tabulky S4/B bylo upřednostněno proto, že tabulka nebyla poznamenána lidským Faktorem (odstr3l10vání intruzí) a zdá se být tedy objektivněj š í, byť má nižší kore lační koeficient, než tab. S5/8. 13.4.2 Bílinsko Podobným zp'.sobem jako u nález,. z Břešťan byla provedena seriace souboru z Radovesic. U matice s nejvyšším korelačním koeficientem z této lokality bylo, podobně jako u Břeš!'a n, oč íslováno pořad í objekt,. (zkratka RA v "datování 2"). Nakonec jsme přistou pili k celkové seriaci soubor,. Z Břešťan , Radovesic a ostatních lokalit na Bílinsku. Výchozí seriaci představuje tab. S6 (Kf = 0.634), která, zdá se, poskytuje očekávaný výsledek, tj. pořadí objektu z Břešťan a Radovesic v celkové seriaci v podstatě odpovídá pořadí, které bylo získáno samostatnou seriací těchto síd lišť. Výsledek takovéto seriace přináší tabulka S6 (obr. 16) (Kf = 0.642). Zde uvedené pořadí objekt,. z Břešťan a Radovesic v podstatě odpovídá pořad í z dílčích seriací těchto síd lišť. Pořadí objekt,. v KT lze mít z hled iska chronologického již za velmi relevantní, neboť tabulka je obohacena kvalitními soubory z menších loka lit tzv. dvorc" v Bí lině (č.obj. 6000 /Waldhauser - Holod"ák 1984/ a Radovesicích 2 č.obj . 3000), které jsou poměrně dobře datovány nekeramickým materiálem a navíc jsou považovány za jednorázové. Nemohou se zde tedy vyskytovat nesoučasné intruze, vyl oučit m,.žeme i možnost, že by datující (nekeramické) nálezy ke keramickým souborům časově nepatři ly. Proto poněkud překvapuje, že objekty z těchto lokalit jsou v některých případech od sebe v tabulce relati vně vzdáleny (např. 300 I a 3004, 3006; 6002 a 6004, 6008). Tato skutečnost může být zp'.sobena dlouhými vlastnostmi. Tabu lku však zřejmě ov livňují i objekty, které mají málo typických vlastností (krátké objekty) se zastoupením pouze ve dlouhých vlastnostech. Nás led ně byla tabulka zbavena dlouhých vlastností a krátkých objektů (v objektu musí být zastoupeny alespOll 4 vlastnosti). Výsledek přináší tabulka S 7 (obr. 16) (Kf = 0.843). Na takto uspořádané KT m,.žeme pozorovat, že objekty z tzv. jednofázových dvorc" jsou nyní blíže II sebe (6000 a 3000), ovšem u lokality Radovesice 2 (3000) je mezi objekty přeci jen určitá vzdálenost. Zde je několik možných vysvětlení : lokalita nepřed stav uj e jednofázové sídli ště Ude o torzo většího a déletrvající sídliště), vstupní data (tj. typáře a násl edně vytvořené vlastnost i) neumož"ují jemné rozlišení mladší laténské keramiky, výběr vlastností nebyl proveden správně - nestejná délka vlastností (sloupc") i nestejné váha jednotlivých s loupců i polí způsobuje uspořádání tabulky seriací, které nen í zcela chronologické, naopak tabulka muže náhod ně obsahovat velký počet přibl ižně stejně starých objektli, takže vzdálenost mezi objekty nemá ve všech partiích KT stejný chronologický význam atd. atd. Možností interpretace je velké množství, v neposlední řadě se ukazuje potřeba zkoumat uspořádání seriačních tabulek ij inými statistickými resp. matematickými metodami. V každém případě je velmi užitečné, jsou-Ii při řešení chronologických otázek k dispozici krátkodobá či dokonce jednofázová s ídliště. Ocitnou-Ii se totiž objekty z těchto lokalit v tabulce po seriaci v sousedství, znamenaj í nezávislou kontrolu výsledku - z terénní situace je totiž zřejmé, že musí být současné. Tabulka S7 (obr. 16) byla pokusně rozdělena do čtyř částí, které jsou v souladu s dosavadními znalostmi datování laténské keramiky interpretovány chronologicky. Druhá a třetí část tabulky byly j eště rozčleněny na podčásti. Ze samotné tabulky však vyplývá, že toto další dělení je spíše spekula- tivní. 229 S 6 Eílins\:o - seriace (SK) po vyřazení superpozic a intruzí Kf • 0.843 S 7. Bí11nsko - celková seriace (SK) pO vyřazeni superpoz1c, irelevantních vlastností a krátkýc~ objekt~. 1ntruzí a Kr ,. 0.843 Kr = 0.642 Obr. 16. S6 - Bílinsko, seriacc (SK) po vyřazen í superpozic objektů a předpokládaných intruzí; S7 - Bílinsko: seriace po vyřazení superpozic, krátkých objektů, intruzí, dlouhých a krátkých objektů. 13.4.3 SZ Čechy Další pracovní kroky představovaly dílčí seriace velkých lokalit v ostatních regionech (např. Soběsuky, cf. zkratka S v "datování 2" u tab. S8), seriace jednotlivých regionů a nakonec celková se· riace objekllI ze sídlišť v SZ Čechách. Než však byla vytvořena celková seriace, jejíž výsledek ukazuje tabulka S8 (obr. 17), bylo nutné eliminovat regionální rozdíly, tj. vlastnosti, které se nevyskytují ve všech regionech, případně se v nich vyskytují ve zcela odlišných kvantech (cf. Rulf - Sa l ač 1995). I zde byly následně prováděny úpravy ve smyslu vyřazování příliš krátkých (dlouhých) objektů a vlastností. Výsledná KT byla rovněž rozdělena do čtyř resp. šesti částí, které jsou chronologicky interpretovány. čtenář sám může posoudit, nakolik se řazení objektů liší od původního datování (datování I), datování nekeramického materiálu v objektech (dat. nm) či výsledků dílčích seriací jednotlivých lokalit (dat. 2). 230 Velmi důležité jsou i zde polohy objektů z jednofázových "dvorců" z Bíliny a Radovesic 2, které zřejmě chronologickou interpretaci uspořádání tabulky nezávisle potvrzují. Na druhou stranu je nutné přiznat, že pořadí objektů v tabulce odpovidá původnímu datování pouze v horní části . Naopak dolni část tabulky dosavadním představám o keramice stupňů LT C2 a LT D l příliš neodpovídá. Příčin, proč se pomocí seriace nedaří vytvořit jemnější chronologii laténské keramiky, může být celá řada, počínaje příliš hrubými metodami při zkoumání výplní objektlt, přes chybný výběr sledovaných vlastností, až po možnost, že objekty na déle trvajících sídlištích prostě blíže datovat pomocí této metody nelze (cf. např. Oreslerová 1995; Neustupný 1996). V každém případě můžeme konstatovat, že výsledek, který představuje např. tabulka SS je nutné dále zkoumat jak dalšími matematickými metodami (shluková, korespondenční či faktorová analýza atd.), tak i pomocí externí evidence jakou může představovat terénní situace - jednofázová sídliště, naopak vzájemně se porušující objekty apod. 13.5 Poznámky k užití seriace při datování sídlišť Při řešení chronologie laténské sídlištní keramiky bylo u nás prvně užito při zpracování většího milOžství sidlištních nálezů automatizovaného vzniku matic z databází a provádění jejich seriací. Proto je snad vhodné zde shrnout některé zkušenosti s aplikací této metody. I. Při datování nestačí vytvořit pouze jednu tabulku zachycující výskyt či absenci určitých vlastností (SAP), cožje doposud v literatuře běžný jev - jeji vznik a tudíž i výsledky mo- 231 hou být náhodné (viz příklad Břešťany, cf též pořadí objektll z Vikletic na tab. S8, VIK u "datování 2" - ObL 17). Pořadí objektll a vlastností je nlltné ověřovat dalšími seriacemi, aby se otestovala stabi lita výsledkll. ~:~:T~m;~~.::i~g_ :::::::: ~: ~~.m~·o.a..'. . . . . . . .. . . . . . 4 ... .. . n ••,n. i ! . i I: !! • • ! , • , i , • . • r, •! , • , I• • • ,• 1 :• • , i Obr. 17. S7 - SZ Čechy, celková ser;ace (SK) po úpravách. 2. Nesporným přínosem je aplikace kvantitativní seriace (SK), která umožiíuje využít pro řešení i vlastností, které mají relativně dlouhé trvání, avšak v čase se mění jejich kvantitativn í zastoupení. 3. SK pracuje se skutečnými počty střep" a je tak odol nější proti ojed ině lým jevllm (intruzím), cožje při zpracovávání sídlištního materiálu výhodou. Na druhou stranu je SK choulostivá na četnosti vyskytující se v jednotlivých polích - tj . na těžké vlastnosti, objekty i těžká pole. Bylo zj ištěno, že jediný objekt s abnormálním výskytem určitých vlastností (zpllsobený ale např. rozbitím jediné nádoby) mllže deformovat celou matici, tedy postihne pořadí všech objektll. Přitom Kf tabulky s extrémně těžkým polem, zákonitě umístěným při diagonále, je zpravidla velmi vysoký. Vysoký Kf tedy nelze přijímat ne- kriticky. 4. Čím více má tabulka vlastností (sloupců), i takových, které jinak nemají chronologický význam, tím je stabilněj ší a tím méně ji ovlivňuj í ojed iněl é jevy. S. Metoda, jak byla zde aplikována, řadí objekty za sebou, aniž by zohledllovalajejich vzájemnou "vzdálenost" (podobnost mezi nimi). Tuto "vzdálenost" je možné zj i šťovat a graficky vyjádřit pomocí tzv. korrespondenční analýzy (k tomu P. Ihm 1983, II S). 6. S týmž problémem souvisí i č l enění výsledných matic na části - časové horizonty. Z algoritmu vyplývá, že uspořádán í tabulky je vždy optimalizováno vzhledem k diagonále, proto se rozdíly mezi řádky (objekty) stíraj í, což ztěžuj e její rozčleněnÍ. Zde bude nlltné využítke členění j iné statistické metody, především shlukovou a korespondenční analýzu. Nao- 232 pak výhodou patrně je, že metoda klade dúraz na celek, zdllrazlluje návaznost a nakonec ukazuje i na problematičnost (archeologem chtěného) členění vývoje. Přesto však je, zdá se, metoda schopna základní změny ve vývoji registrovat. I 4 I 3 I 2 I 7 I 1 I 14 I 6 I s I 10 I 9 I 15 I 8 I II I 13 I 12 Vik.letice I. 26 + + + IVik.letice I, 28 + + + + Vikletice I 24- + + + + + + Vik.letice I, 102 + + + + + + + + + + +Vik1etice II, 12 + + + + + + + +Vikletice I, 23 / + + + + + +Y. Y" 3/61 Ť + + + + + + + + +Y. Y" 1/61 + + + + + +1+ + +Vikletice T, 88 ! /+ + 1 I +Y. Y" 18/62 I i ! ' + I+ I+I I I I I Kombinační tabulka prvků keramiky. Tvary: 1. Kónická mísa se svisle oasazeným okrajem (ohr. 4: 5, 14; 9:.1.12); 2. Konická mísa nečleněná (obr. 4: 4; 5 : 16, 17; 6 : 6). Plastické prvky nádob: 3. Ploché žebro na kónickém hrdle vyšších tvaru (obr. 4 : 3; 5: 1: 8: 4): 4. Úzké žebírko na hrdle (podhrdli) jemné keramiky (obr. 4: 6; 5 : 2; 6 : 1; 8 : 1); S. Ploše vytažená nožka (obr. 8: 3); 6. Oble hráněný masivní okraj zásohnice (obr. 3 : 6; 9 : 13). Úprava povrchu: 7. Chuchvalcovité zdrsnění (obr. 4: 8; 6 : ll); 8. Jemné obloukovité nebo svislé, až vlasové rytí povrchu (obr. 3: 5; Drda 1974, ohr. 5: 5); 9. Výrazné husté obloukovité rytí povrchu (obr. 3 : ll); 10. Černý smolný nátčr. Prvky výzdoby: 11. Jednotlivé ryté obloukovité pásy (Koutecký 1970, obr. ll: ll; 12: 25. 29; 15: 4; 28: 2); 12. Ryté mnohonásobné oblouky nebo vlnice v kombinaci se svislým hřebenováním (obr. 1: 1,8; KOUlecký 1970. obr. 28: I); 13. Jiná rytá ornamentální výzdoba (Koutecký 1970, obr. 12: 24; 16 : 16, 25; 28: 12). 14. Nepravidelná vhlazovaná výzdoba na užitkové keramice (obr. 3: 8; 9: 4, 5. 13); 15. Pravidelná ornamentální vhlazování výzdoba (obr. 3; 1; 7 : 4; Drda 1974, obr. 5 : 8). Obr. 18. Viklctice. kombinační tabulka sídlištních objektil (dle Drda 1977. 383, doplněno). 233 1 2 3 7. Je-Ii metoda aplikována u malých s ídlišť (Dreslerová 1995) je nutné obezřetně postupovat při interpretaci výsledků. M!.žeme sice zji šťovat matematickými metodami "odstupy" mezi sousedními objekty, avšak musíme si uvědomit, že mohl zcela uniknout chybějící horizont, tj. časový hiát mezi objekty. Jsou-Ii pro určitý časový horizont typické urč ité vlastnosti a chybí-Ii tento horizont na síd lišti (častěj i na jeho prozkoumané části ), pak v připravených sloupcích budou nulové hodnoty a tyto sloupce budou odstraněny - lhostejno zda automatizova ně v počítač i či v našich hlavách při tzv. ruční seriaci (podobně jako nálezy vyskytuj ící se pouze stopově). Na toto nebezpečí ukazují publikované chronologické závěry z Břešťan (Sa l ač 1984) a Vikletic (Drda 1977). U Vikletic byly všechny objekty na základě kombinační tabulky (obr. 18) datovány do bezprostředně navazuj ících horizontů v rámci stupJ1fJ LT CaD. Seriace prováděná v širším kontextu SZ Čech však zřej mě prokázala značný časový odstup mezi objekty (horizonty; cf. pozici objekt!. s označením VIK 1,11,111 v "datování 2" u tab. S8 - obr. 17). Ostatně příklady z Břešťan a Vikletic ukazují, že chronologické horizonty vytvořené na základě jedné malé lokal ity, nadto neúpl ně prozkoumané, maj í problematickou hodnotu. 8. Objekty z okrajových horizontů (prvního resp. posledního) by měly být v matici dostatečně zastoupeny. Vyskytnou-Ii se pouze 1x, pak budou vlastnosti typické pouze pro ně buď zcela vyřazeny nebo budou natolik krátké a lehké, že se objekty nemusí objevit na okrajích tabulky. 9. Z algoritmu seriace vyplývá, že dlouhé a těžké řádky (sloupce) se budou po SK zpravidla vyskytovat uprostřed tabulky (cf. polohu obj. 7 z Břešťanna tab. SIB - obr. 10), podobně jako těžká pole na diagonále. Vždy je tedy nutné zvážit, zda je jej ich zařazení do seriace správné. Řešení je obtížné, ale rozhodujícím kritériem by měla být velikost tabulky, čím je KT menší, tím snáze bude těmito jevy deformovaná. 10. Závažný limit při použití seriace u sídlištní keramiky představuje fakt, že sídlištní objekty mívají zpravidla podstatně odlišná množství střep!., tj . následně i sledovaných vlastností (j iná situace bývá u hrobů). Tato skutečnost může nemálo ovl ivnit pořadí objektů v tabulce. Při výběru objekti. a vlastností je nutné mít na paměti , že ideální výsledky by přinesla matice se stej ně dlouhými a těžkými řádky a sloupci. 11. Domnívám se, že na zde uvedené matice lze pohlížet i z jiného hlediska - tj. jako na relativně značnou znalostní bázi, která je schopna dávat poměrně stabilní a objektivní výsledky, byť ne natolik jemné, jak bychom snad žádali (např. ve srovnání s chronologií poh řebi šť). Je zřejmě opodstatněné, využívat typologické tabulky a databáze (předevš ím vlastností) ve spojení s programem KAAN jako tzv. expertní systém. Tj. do databáze č i přímo do matice lze doplnit nový objekt, který bude seriací automati zovaně datován. 13.6 Závěr V tomto příspěvku j sme si ukázali jeden z mnoha možných přístupů k využití seriace při zpracovávání archeologického materiálu. Snahou bylo ukázat některé momenty práce, které se zřej mě budou opakovat, lhostejno zda bude použit zde uvedený program KAAN (lze obdržet od autora), tzv. "Bonnská seriace", č i některý z komerčních statistických paketfJ (např. BMDP). Přispěvek se proto zabýval pouze elementárními možnostm i této metody. Rozsáhlejší programové pakety skýtají další možnosti při práci s maticemi č i při provádění seriace. Velice lákavá je např. možnost, že řádky č i sloupce nemají stejnou váhu, nap'·. dlouhá vlastnost vyskytující se téměř u všech objektů bude mít v seriaci nižší váhu (méně ovlivní uspořádání tabulky). Naopak krátká vlastnost, kterou považujeme za typickou pro určitý horizont, bude mít váhu vyšší, tj. ovlivní uspořádání tabulky více (cf. např. Herzog - Scollar 1987). Je možné, ba pravděpodobné, že podobným způsobem se podaří uspořádat objekty (hroby) způsobem, který bude lépe odpovídat archeologovým představám. Na druhou strallu stojíme před zásadním zásahem do jinak objektivní pracovní metody. Vzhledem ke složitosti síd lištní problematiky bude nutné stanovit taková pravidla, která by zaj istila, aby podobné zásahy nevnesly do metody značný stupeň subjektivismu, který by ji podstatně devalvoval. 234 Příspěvek ukázal, že seriace je jen jednou z pracovních metod a její aplikace j eště zdaleka nemusí vést k vyřešení problému. V žádném případě není řešením seriace jediné matice vytvořené výběrem z velkého množství dat Na druhou stranu automatizovaná tvorba matic, jejich následná seriace a stanovování korelačního koeficientu představuj í objektivní, bezchybný a opakovatelný proces umožň ující kontrolu. významné je, že tento postup umož"uje čtenáři (uživateli) nejen kontrolovat výsledky svých kolegfl. ale dále je rozpracovávat (cf. diskusi o datování pohřebiště v Horathu; Miron 1986; Brugmann 1993). Seriace je jako každá matematická metoda zcela objektivní, její výsledky jsou však zásadně ov l ivněné vstupy (daty) dodanými archeologem. Také interpretace matice uspořádané seriací je již opět ryze archeologickou záležitostí (zdaleka ne každé u spořádání matice lze interpretovat jen chronologicky!). Naší snahou musí být, aby se objektivnost a bezchybnost vstupfl a interpretací alespOll blížila objektivnosti a bezchybnosti algoritmu seriacc. 13.7 Literatura Brugmann, B. 1993: Bemerkungen zur relativen Chronologie mittel- und spatlatenezeitlicher Griiberfclder im Hunsriick-Nahe-Raum, Archaologisches Korrespondezblatt 23, 77-86. Drda, P. 1977: Laténská osada Vikletice I, Archeologické rozhledy 29, 363-393. Oreslerová, D. 1995: A late Hallstatt settlement in Bohemia. Excavation at Jenštějn, 1984. Praha. Herzog, 1. - Scallar, 1. 1987: Ein "Werkzeugkasten" fur Seriation und Clasteranalyse, Archaologisches Korrespondenz blatt 17,273-279. Kubá lek, T. - Sa lač, V. 1994: Kombinační analýza archgeologických nálezů (KAAN), poříručka k programu. Praha. Ihm, P. 1983: Korrespondenzanalyse und Seriation, Arch. Informationen 6, I8-21. - 1990: Archaologische Oatenverarbeitung mit SAS, Wiss. Zeitschrift der Humboldt-Univ. zu Berlin, Reihe Gesselschaftwiss. 39, 284-289. Miron, A. 1986: Oas Graberfeld von Horalh, Trierer Zeitschrift 49,7- 198. Neustupný, E. 1978: Mathematics at JeniŠl'v Újezd, in: Waldhauser, J. ed., Oas keltische GraberFeld bei JeniŠllv Újezd in B6hmen 11, 40-66. - 1996: Poznámky k pravěké sídlištn í keramice, Archeologické rozhledy 48,490-509. Podborský, V. - Kazdová, E. - Koštuřík, P. - Weber, Z. 1977: Numerický kód moravské malované keramiky. Brno. Rulf. J. 1993: Archeologie, archeologická data a archeologové, Archeologické rozhledy 45, 165-1 72. Rulf~ J. - Salač, v. 1995: Zpráva o laténské keram ice v severozápadních Čechách, Archeologické rozh ledy 47, 373-4 17. Sa lač, V. 1984: Laténské s ídliště u Břešťan, okr. Teplice, Archeologické rozhledy 36, 26 1-277. - 1993: Serialion of Iron Age settlement sites in NW Bohemia - system or databases, CAAF program, in: Andresen, J. - Madsen, T. - Scollar, I. eds., Computing the Past (CAA92), 343-348. ;\ar- hus. - 1995: The density or archaeological finds in settlement features of the La Tene period, in: Kuna. M. - Venclová, N.: Whither archaeology?, Papers or honour Evoen Neustupný, 263-276. Práce představuje jeden z výstup" grantu GA ČR č. 404/9410606 Za pročtení rukopisu a připomínky děkuji E. Neustupnému aJ. Rulfovi 235 o 14. Syntéza struktur formalizovanými metodamivektorová syntéza (Evžen Neustupný) Následující text pojednává o tématu, které se často označuje jako faktorová analýza. 1'010 označení je nepřesné, neboť nejde o žádnou analýzu, jestliže se snažíme struktury získat, objevit a prozkoumat (explorovat), a tedy syntetizovat, nikoliv jen ověřit (konfirmovat). Metody z rodiny "faktorové analýzy" jsou založeny na teorii vektorových prostorů a pojem vektoru je v nich klíčový; proto jsem navrh Ije souhrnně označovat jako vektorovou syntézu (Neustupný 1979). V dalším výkladu předpokládám určitou obeznámenost s archeologickou analýzou a základním rozvržením archeologické metody, ale v podstatě v rozsahu menším než v článku o archeologické metodě (Neustupný 1986). Také terminologicky navazuji na své předchozí práce o archeologické metodě (zejména Neustupný 1973, 1986 a 1993). Při studiu tohoto textu doporučuji nejdříve zběžně přečíst první, teoretickou část ("Formální aspekt archeologických struktur") a pak se obrátit přímo k příkladům; během studia příkladů je vhodné se k teoretické části opakovaně vracet. Cílem následujících odstavcli je usnadnit pochopení výsledků, které dnes automaticky generuje počítačový software. Pokud k takovému pochopení nedojde, hrozí mylné výklady počítačových výstupli. Formulace "Iohy Po lI1etodologické strállce se archeolog setkává s problémy trojího typu: I. problémy onalytick)ími spoč ívajícími v tom, jak tyzicky (v terénu) rozložit archeologické prameny, které chce studovat, ajakje popsat ve fázi deskripce, 2. problémy z oblasti syntézy struktur spočívajícími v nalezení nenáhodnosti (pravidelnosti, zákonitosti) v archeologických pramenech, tj. v mrtvé kultuře 3. problémy z oblasti interpretace spočívajícím i ve vysvětlení zjištěných pravidelností mrtvé archeologické kultury v termínech někdejší živé skutečnosti. Empirická metodologie vědy, pokud tyto problémy vůbec vyčletíovala, předpokládala, že jde o tři postupné kroky, které se aplikují jednorázově a vedou tak k víceméně konečnému, definitivnímu poznání. Domnívám se, že tyto problémy ve skutečnosti tvoří nerozetnutelný kruh, jehož jednotlivé segmenty se aplikují iterativně (v řadě kroků) a vedou tak ke stále dokonalejšímu poznání (Neustupný 1986, 1993). V následujícím textu se budeme zabývat problémem syntézy struktur, tj. tím segmentem archeologické metody, který jsem označil číslem 2. Je dliležité si uvědomit, že metody, které popíšeme, neřeší nijak problémy ani typu I ani typu 3, tedy například samy o sobě nijak nepřispívají k interpretaci. Jestliže v příkladech budeme zmitíovat také interpretaci, je to jen proto, abychom alespoň částečně vysvětlili smysl popisovaných metod v celkovém procesu archeologického poznáni. Archeologické prameny mají dva (a jen dva) druhy pozorovatelných vlastností: formálni a prostorové. Jim odpovídají dva aspekty archeologických struktur, které jsou ve skutečnosti projevem těchže pravidelností. Hlavní část tohoto textu pojednává o formálním aspektu struktur, který je z metodologického hlediska dobře prozkoumán; v závěru se zmíníme o aspektu prostorovém a jeho spojení s formálním. Faktorová analýza, první z aplikovaných metod vektorové syntézy, byla vyvinuta pro potřeby psychologie na počátku 20. století; ovšem před zavedením počitačit nebyla rozsáhleji využitelná. Pronikla do řady disciplín, ale H.Hannan v r. 1970 ještě neuváděl žádné použití v archeologii (Hannan 1970, 7). Pokud je mi známo, první opravdu stimulující použití v archeologii pochází od L. Binforda a S.Binfordové (1966). Na zák ladě inspirace touto prací realizoval autor tohoto příspěvku první faktorové analýzy v r. 1969 a v r. 1970 už o nich podal zprávu na konferenci v Southamptonu (Neustupný 1973). 237 14.1 Formální aspekt archeologických struktur Představme si některé nejběžnějš í úlohy tradiční archeologie. Stojíme před pohřebištěm, jehož jednotl ivé hroby obsahují r"zné milodary, nebo před s ídlištěm, jehož zahloubené objekty obsahují keramické zlomky. Definice toho, co je hrobem, zahloubeným objektem, rozlišen í jednotlivých typll milodarů a typll keramiky je záležitostí analýzy a nebudeme je proto v této souvislosti diskutovat. Stej ně tak záležitostí analýzy je deskripce vyjádřená tabulkou, v jejíchž řádcích jsou například jednotlivé hroby (zahloubené objekty) a ve sloupcích jsou jednotlivé typy milodarů (typy keramiky), které těmto hroblul1 (zahloubeným objektllm) odpovídají. Jinak I'ečeno, máme před sebou obvyklou popisnou tabulku (deskripci), ať už ve formě matice nebo relační databáze. Základní otázky nyní zní: I. Jsou typy milodar" rozděleny v hrobech náhodně, nebo některé z nich IvoN skl/pilly , tj. jejich společný výskyt v hrobech je typičtěj š í než u jiných (v případě laténsk)'ch hrobll mohou takovou skupinu tvořit např. meče, štíty a hroty kopí) nebo je naopak jej ich společný výskyt netypický (případ ně se vylučují, jako třebas sekerom laty a náhrdelníky ve šMrových hrobech)? 2. Lze říci, kolik takových skupin je? 3. . Lze podat seznam typ" milodar", které se spolu vyskytují v uvedených skupinách, pI'ípadně lze uvést nějaká číslo charakterizující příslušnost typů do uvedených skupin? 4. Lze zpětně určit, které ze skupin jsou typické pro jednotlivé hroby, případně nokolik jsou pro ně typické? Uvedené skupiny (typll) nazveme faktOlY: obecně jimi budeme rozumět abstraktní množiny deskriptorll seřazené pomocí určitých č íse lných charakteristik (později tato čísla nazveme faktorové koeficienty). Takové uspol'ádání (strukturování) deskriptor" je výsledkem nenáhodné variability, která je skrytě (latentně) obsažena v deskriptivní tabulce. Jak uvidíme, otázky 2 a 3 lze zodpovědět formalizovanými metodami vektorové syntézy. tedy jinak řečcno metodami z rodiny tzv. faktorové analýzy. Otázku I lze těmito metodami zodpovědět pouze tehdy, jestliže fOllllalizovan€metody pojmeme jako metody statistické, otázku 4 pouze některými z uvedených metod. Všechny čtyl"i otázky ovšem v určité formě řešila také tradiční archeologie /leformalizova/l.l'mi me/odomi, přičemž číselné charakteristiky faktorů zůstávaly vesměs neurčeny (počet faktorll, míry typičnosti druhll milodarll pro jednotlivé faktory, míry typičnosti hrobll pro jednotlivé faktory, a 1'0chopitelnč i pravděpodobnost celkového řešení). Chybění těchto číselných charakteristik sice nijak neimplikuje nesprávnost tradičního řešení, ale současně nám nedává žádné vodítko k dllvěře v jeho správnost. V určité (a to ve velmi omezené) formě lze uvedené otázky řešit pros/ledky jednoduché tradični sta/istiky nepřesahujícími analýzu rozptylu. Charakteristikou tohoto zP"sobu řešení je, že jednotlivé faktory, které ovlivllují variabilitu archeologického kontextu, musíme znát pl'edem. Tak např. mllžeme pI'edpokládat, že variabilitu milodarů na pohřebišti určuje pohlaví zem řelých. Vezmeme tudíž zvlášť hroby mužské a zvlášť hroby ženské a hledáme, které typy milodarll jsou stat isticky významně spojeny buď s jedním nebo s druhým pohlavím. Pomocí analýzy rozptylu (jde o středně náročnou statist ickou metodu) mllžeme takto posuzovat i celou skupinu typll nebo mllžeme současně zkoumat vliv pohlaví a věku. Takové postupy jsou produktivní, ale v podstatě jenom potvrzují existenci pravidelností (struktur), které předpokládáme na zák ladě jiných úvah: samy o sobě nikdy neodhalí nové, neznámé faktory. Jinak řečeno, tyto metody jsou kO/lfirm%rní (~j. potvrzující), nikoliv explora/omí (tj. vyhledávající). Stejně tak nevedou k dliležitému konstatování, že získané řešení je vzhledem k urč itémll deskriptivnímu systému optimálním řešením, které vyčerpává i/lformaci obsaženou v tomto deskriptivním systému (neobsah uje tedy další informaci, kterou je možno z tohoto systému extrahovat). 238 14.2 Postup formalizovaného řešení V následujících odstavcích popíšeme základní kroky (algoritmus) při formal izované syntéze struktur tzv. metodou hlavních komponent. Zaměříme se také na základní terminologii, kterou budeme potřebovat v dalších částech této práce. Logické dllvody, proč je takový algoritmus schopen řeš it archeologické problémy, j sou uvedeny j inde (Neustupný 1993). Hlavní komponenty jsou pouze jednou z víceméně ekvivalentních metod vektorové syntézy. Vybrali jsme je proto, že jsou nejblíže matematickému modelu a jsou proto relativně jednoduché. Někteří archeologové dávají před nost jiným podobným metodám Uako je vlastní faktorová analýza, korespondenční analýza, multidimenzionální škálování, částečně tzv. d i skriminačn í a kanonická analýza apod.), protože se domnívaji, že lépe odpovídají jej ich datům. Většinou jde o nedorozumění nebo nedostatečné pochopení algebraické nebo statistické podstaty řešení: pro běžné archeologické úlohy je větš ina metod z rodiny faktorové analýzy ekvivalentní, ale všechny nedávají stejné možnosti. Tak např. u korespondenčn í analýzy nedostáváme rotované faktorové koeficienty, a orientace ve výsledcích je závislá na grafi ckém znázornění. Na druhé straně korespondenční analýza dává možnost znázornit strukturu objektli a deskriptorů (viz dále) ve stej ném prostoru. 14.2_1 Krok O(sestavení deskríptivního systému) Je to krok, který de facto předch ází vektorovou syntézu a patří do analýzy. Zde si především všimneme základní terminologie a podmínek, které další kroky algoritmu kladou na konkrétní podobu deskriptivní matice. Řádky deskriptivní matice nazveme objekty, její sloupce označíme jako deskriplOlY. Deskriptory můžeme chápat jako sloupcové vektory, lj. sloupce nějakých hodnot (odtud název vektorová syntéza). K tomu, abychom mohli provést další výpočty, musí mít deskriptivní matice následujicí vlastnosti: I. musí obsahovat vesměs reálná čísla. Reálnými čisly se rozumí počty nebo (fyzikální) rozměly (hodnoty tzv. kardinálních proměnných); lze jimi rozumět i hodnoty tzv. dichotomických proměnných (prezence=l, absence=O). Stavy tzv. nominálních proměnných (např.: proměn ná=barva, stvavy= šedá, čemá, hnědá) nejsou reá lnými čís ly, a to ani v případě, že jsou vyjádřeny číslicemi . Tak např. pokud jsou objekty jednotlivé střepy. nelze jako deskriptOlY zvolit hodnoty "převažující barva hnědá" a "převažující barva šedočerná", protože každý střep je převážně buď hnědavý nebo čedočerný. Nuly, kterými bychom zapsali, že nějaké střepy nejsou hnědé (protože jsou šedočerné a nemohou být obojí) jsou tzv. nepravé nuly (Neustupný 1973) a v dalších krocích s nimi nelze provádět smysluplné výpočty (poučení o kardinálních a nominálních proměnných bývá součást í každé příručky statistiky). 2. Deskriptivní matice nesmí obsahovat tzv. chybějící data, tj. prázdná políčka. Jestliže objekty jsou hroby, pak deskriptor "délka hrobu" může být zahrnut do popisného systému pouze tehdy, jestliže je délka známa u všech hrobli. POklid není, je nutno příslušný hrob s neznámou délkou buď vynechat nebo délku hrobu odhadnout; všechny takto odhadnuté hodnoty jsou ovšem nějakým zpllsobem neuspokoj ivé a při jejich větším množství mohou nekontrolovatelným způsobem ovlivnit výsledky. Jinak řečeno, sloupce deskriptivní matice musí tvořit tzv. lineární vektorový prostor, tj. musí umožllovat základní operace s vektory (v matematice je lineární vektorov)' prostor definován přesněji). Nepravé nuly, chybějící hodnoty a nominální proměnné jsou nejčastěj šími příčinami nelinearity archeologických deskriptivních systéml!: do deskriptivních systémů zanášejí prvky, které nejsou čís ly a nelze s nimi provádět smysluplné výpočty. V případě, že výchozí deskriptivní matice není lineárním vektorovým prostorem, je nutno v následuj ícím kroku I použít zvláštn í koeficienty; to je vždy možné jen za cenu ztráty informace a za cenu vytvol·ení nestandardního východiska pro aplikaci dalších metod lineám i algebry, nem luvě o tom, že se obvykle zcela ztrácí možnost použití statistických kritérií. Nevýhod je tolik, že takový postup nelze doporučit. 239 14.2.2 Krok 1 (výpočet korelační matice) Prvním krokem vektorové syntézy je výpočet koeficientů, které (obecně) vyjadřují závislosl mezijedl10tlivými deskriptOly. Teoreticky (nebo zkusmo) lze odvodit velké množství různých koeficientů, které při dalším zpracování dávají rllzné výsledky. Dříve archeologové napodobovali přírodovědce v hledání "nejlepších" koeficientů, postupně se však ukázalo, že lineární korelační koeficient (který je v jednoduchém vztahu k eukleidovské vzdálenosti mezi vektory - srov. Neustupný 1973) dává nejlepší výsledky. .Je to proto, že je to pojem, který je velmi jednoduše odvoditelný z teorie lineárních vektorových prostorů. Korelační koeficienty jsou čísla od -I do +I. Koeficient -I znamená maximální nekorelovanost deskriptorů (např. situaci, že sekeromlat je ve všech hrobech, v nichž není náhrdelník a naopak), +I jejich maximální korelovanost. Korelační koeficient Oznamená zcela "nerozhodný" stav, nezávislost (statistickou nevýznamnost). V praxi se ovšem takový nerozhodný stav projevuje kolísáním hodnot v určitém rozmezí kolem O. Pokud korelační koeficienty chápeme jako statistické pojmy, můžeme určit, který interval hodnot kolem Oje statisticky nevýznamný na určité hladině významnosti. Například lze určit, že korelační koeficienty v intervalu od -0.326 do +0.326 jsou statisticky nevýznamné na hladině významnosti 5% (srov. diskusi k Tabulce 2 a 7). Korelační koeficienty lze uspořádat do čtvercové matice, jejíž políčko (3,5) ležící na průsečíku 3. řádky a 5. sloupce obsahuje korelační koeficient mezi deskriptorem číslo 3 a 5. Na hlavní diagonále této matice (tj. na spojnici levého horního a pravého dolního rohu matice) budou samé jednotky, protože každý deskriptor maximálně koreluje sám se sebou. Matice je symetrická, tj. pole (3,5) je totožné s polem (5,3); v důsledku toho se každý korelační koeficient v matici (kromě diagonálních) objevuje dvakrát (srov. Tabulku 2 a 7). POZI1. Některým odborníkúm se zdá, že korelační koeficient je výhradně statistický pojem ajeho výpočet (plus všechno, co následuje) patří proto do statistiky. Kdyby to byla pravda, dostali bychom se do nepříjemné sítuace, protože prakticky na celou vektorovou syntézu by se vztahovala omezení daná různými předpoklady o normálním rozdělení dat apod. Na štěstí lze ale korelační koeficient chápat čistě algebraícky: jako skalární součin odchylek jednotlivých hodnot od prllměrných hodnot, přičemž vektory odchylek jsou normalizovány svými eukleidovskými normami (pojem prllměru lze rovněž algebraizovat). 14.2.3 Krok 2 (výpočet faktorů) Kore lační matici z kroku I tzv. ortogonalizujeme. Jde o vyhledání takových vektorú, které jsou vzájemně (tj. každý jejich pár) nezávislé, tj. jejich skalární součín a tudíž i korelační koeficient je pro každou dvojici ortogonálních vektorll roven O(Neustupný 1979, 1993 aj.; detailní výklad pojmu ortogonalizace zde neopakuji). Pokud je korelační matice řádun (má n řádek a n sloupcll), bude takových ortogonálních vektorů maximálně 11 (proto ani faktorů nemůže být více než n). Ortogonalizace se provádí matematickým algoritmem pro výpočet tzv. vlastních vektorll a vlastních čísel matice; výpočet je značně komplikovaný, takže i pro malé korelační matice je nutno použít počítač. Většina a lgoritmů (výpočetních postupů) pro výpočet vlastních vektor" a vlastních čísel řeší oba problémy současně a nelze je oddělit. Každému vlastnímu vektoru odpovídá jedno tzv. vlastní číslo, které souvisí s variabilitou, kterou daný vlastní vektor z celkové variability korelační matice vyjadřuje. Vlastní čísla korelační matice řádu 11 nabývají hodnot maximálně n, ale zpravidla hodnot menších, protože jejich celkový součet je právě 11. Vlastní vektory jsou určitou formou ortogonálních vektorll a jsou v jednoduchém vztahu k faktorům: z vlastních vektorů dostanemefaktory jednoduše tak, že prvky vlastního vektoru postupně násobíme druhou odmocninou z příslušného vlastního čísla (moderní software to samozřejmě dělá automaticky). Takovým násobením vznikne matice faklorových koeficient,) (neboli tzv. faktorových zátěží), která má 11 řádek (odpovídajících n deskriptorům) a k sloupcII (odpovídajících k faktorúm). Faktorové koeficienty nabývají hodnot v rozmezí od -I do +1, tedy stejných hodnot jako korelační koeficienty; de facto je ml,žeme považovat za koeficienty, které udáva,jí, jak je daný deskriptor typický 240 pro daný faktor jako celek. Faktory tedy representují určité "hromadné závislosti", které se typicky opakuj í v nějaké množině objektů deskriptivního systému. Vlastní vektory jsou množiny čísel v absolutní hodnotě menších než jedna; pokud tato č ísla násobíme druhou odmocninou vlastního čísla menšího než jedna, dostaneme j eště menší absolutní hodnoty, které mohou být výsledkem "šumu" v korelační matici. Pokud se tedy nechceme dostat do závislosti na náhodě, musíme zpravidla zvol it počet faktorů menší než n, tj. vyloučit ty faktory. jimž odpovídají velmi malá vlastní čís la. Neexistuje žádná jednoduchá metoda pro rozhodnutí, kolik faktorů máme zvolit jako základ pro další řešení. V praxi se zpravidla aplikuje jedno z následujících čtyř kritérií pro počet faktorll: I. podrží se faktory s vlastními čísly větš ími než I; 2. podrží se faktory, jejichž vlastní čísla vysvětlují více než 5% celkové variability obsažené v korelační matici (srov. sloupec 3 v tabulce 3); 3. podrží se faktory, jejichž vlastní čísla vyjadřují dohromady více než p% celkové variability (kde p je je číslo, které si předem stanovíme); srov. sloupec 4 v tabulce 3; 4. sleduje se pokles hodnoty vlastních číse l od nej většího k nejmenšímu a počet faktorů se zvolí tam, kde v hodnotách dvou následných vlastních čísel dojde ke "skoku". Tato pravidla jsou vysloveně orientační a často neuspokoj ivá. Jsou případy, kdy i malé vlastní číslo (menší než I) odpovídá věcně významnému faktoru (Neustupný 1995). Vzhledem k tomu, že výpočet vlastních číse l a vlastních vektorll je na současných počítačích velmi rychlý, je možno experimentovat s řešeními pro rllzný počet faktorů. Tyto úvahy by neměly vzbuzovat dojem, že volba počtu faktorů je subjektivní záležitost. Především jsou zde určité meze: I. jestliže korelační matice má n řádek a sloupců, bude i počet faktorů maximálně n; 2. pokud řešení obsahuje 8 velmi malých vlastních čísel , bude počet faktorll maximálně n-s; 3. pokud by n-8 faktorů vysvětlovalo příli š velké procento variability korelační matice (např. 96%, srov. sloupec 4 v tabulce 3), nemůžeme ponechat poslední (\j. n-s-tý) faktor, protože musíme počítat S přítomností náhodné variabi lity v matici. Procento náhodné variability musíme nějak odhadnout, n ejčastěji podle kvality (významnosti) korelačních koefic ientů. Náhodná variabilita ve výši 5% je v mnoha případech nejmenší odhad, ale často dosahuje náhodná variabilita až 30%; 4. ve větši ně praktických případll podržíme faktory, jejichž vlastní čísla jsou větší než I. Jestl iže takových faktorů je r, bude minimální počet faktorll r. Odtud vyplývá, že zpravidla se počet faktorll bude pohybovat mezi čís ly,. a n-s. "Správné" stanovení počtu faktofll se považuje za důležité: volba příli š malého počtu faktorů múže způsobit, že něja ký dtl1ežitý faktor bude z řešení vypuštěn, volba příliš velkého počtu faktorů mtlže naopak být příč inou zahrnutí "šumu" do výsledného faktorového řešení. Praktickým prováděním vektorové syntézy ovšem často vzniká dojem, že je víceméně stej n ě oprávněno několik řešení (např. se 4, 5 nebo 6 faktory), a každé z nich lze často nějak interpretovat. Pozn. Začútečník,im v matematických metodách doporučuji, aby termíny jako je vlastní číslo, vlastní vektor, ortogonalizace apod vzali jen na vědomí do té mílY, jak jsou potT'ebné k ovládání softwaru. Detailněj.5í poučení, zpravidla nepNliš srozumitelné, lze nalézt v učebnicích lineární algeblJI, po/a'očilé statistiky a vpracech ofaktorové analýze. 14.2.4 Krok 3 (rotace faktorů) Jestliže j sme z 11 vlastních vektorů vybrali k faktoru pro další řešení, předpokládáme, že právě těchto k faktorů dostatečně vyjadřuje variabi litu obsaženou ve výchozí korelační matici. Jednotlivé faktory jsou teď lineárn ě nezávislé abstraktní objekty. Tyto faktory však mají jednu velkou nevýhodu, která znemožlluje jejich použití v numerické formě : na rozdíl od hodnot vlastních čísel nejsou jejich hodnoty dány j ednoznačně, nýbrž závisejí na pořadí sloupců a řádek ve výchozí korelační matici. Naštěstí je možno tzv. rotacellli fakton; dosáhnout jejich transformace do jednoznačného výsledku. Metod pro rotaci "hrubých" hodnot faktor" je celá řad a, nejpoužívaněj š í mezi nimi je metoda zvaná Varimax. Je založena na myšlence postupných transformací matice faktorových koefici entů do 241 tzv. jednodllché s/ruk/1IIy. Jednoduchou strukturou se rozumí taková forma faktorové matice, kde každý deskriptor má velmi vysoký koeficient pouze vzh ledem k jednomu faktoru a vzhledem k ostatním faktorilln má koeficienty blízké nu le. Je samozřejmé, že tento ideální požadavek je zřídka splněn, avšak algoritmus transformuje matici faktorových koeficientů v tomto směru jak dalece je to možné (srov. tabu lku 4 a 9). Jak už jsem uvedl, rotace metodou Varimax dává jed noznačný výsledek. Ačkoliv rotace se snaží O ,jednoduchou strukturu", přece vždy zůstanou v matici faktorových koeficientů případy, kdy jeden deskriptor má významné faktorové koeficienty ke dvěma nebo více faktorlllll. To je dllSledek polyteti čnosti deskriptorll, tedy jejich objekt ivní vlastnosti, kterou nelze žádnými manipulacemi odstranit (někdy se dá tato polytetičnost ovlivn it tzv. šikmými rotacemi). Faktorové koeficienty, seřazené podle velikosti od + 1 do - I, uspořádávají deskriptory podle jejich typičnosti pru daný faktor (každý faktor vytváří jiné uspol·ádání). Je zřejmé, že deskriptory s vysokými kladnými faktorovými koeficienty jsou pro daný faktor vysoce typické, zatímco deskriptory, k nimž patří záporné faktorové koeficienty s vysokými absolutními hodnotami (např. -0.986) jsou pro faktor vysoce /ypické pro opak deskriptorll s vysokými kladnými koeficienty. Deskriptory s koeficienty kolem nuly jsou pro faktor nevýznamné, irrelevantnÍ. I v tomto jsou faktorové koeficienty podobné korelačn ím koeficientllln. Zatímco u korelačních koeficientll lze za určitých předpokladů stanovit statistickou významnost na určité hladině významnosti (viz elementární učebnice statistiky), u faktorových koeficientll je stanovení takové významnosti velmi obtížné. Významnost faktorového koeficientu je ve vztahu k I. významnosti korelačního koeficientu korelační matice, z níž jsou faktory odvozeny (a tedy k počtu objektli v deskriptivním systému) a 2. k počtu odvozených faktorů a velikosti k nim přís lušných vlastních čísel. V té variantě faktorové analýzy, která je předmětem této příručky, je obtížné udat třebas jen orientačně nějaký vztah. Pokud ovšem faktorové koeficienty seřadíme podle velikosti, často v tomto uspořádání pozorujeme náhlý skok v hodnotách koeficientli (např. skok v řadě 0.986, 0.90 I, 0.890, 0.854, 0.218, 0.180, 0.130....); do místa takového skoku (mezi 0.854 a 0.218) se pak často klade hranice významnosti. Transformace faktorll do jednoduché struktury prostřednictvím rotací (viz výše) zpllsobuje, že takové skoky jsou u faktorll velmi častým jevem, protože rotace maj í tendenci transformovat absolutní hodnoty faktorových koeficientll buď na nulu nebo na jednotku. Vodítkem pro rozhodování o významnosti je fakt, že vysoké koeficienty (s absolutními hodnotami 0.9 a 0.8) bývají prakticky vždycky významné a koeficienty v absolutní hodnotě menší než 0.1 bývají obvykle nev)'znamné. Často se používají rllzná věcná kritéria a postupy obdobné validaci faktorli (viz krok S). Faktor jako celek je tedy objektivním produktem algoritmu vektorové syntézy, ale určení deskriptorll, které jsou pro tento faktor významně typické, je přes uvedenou "skokovitost" rotovaných faktorll jednou z málo objektivních voleb vektorové syntézy. Některé faktory jsou tzv. monopolární (tj. jejich významné faktorové koeficienty jsou buď jen kladné nebo jen zápol'llé; některé jsou bipolární (mají v)'znamné koeficienty jak s kladným tak i se zápol'llým znaménkem). DeskriptOlY, které mají významné koeficienty opačných znamének, tvoří strukturální opozice. Někdy dochází z numerických dlivodů ke změně znamének na opačná u všech faktorových koeficien!ÍI některého faktoru; v takovém případě se ale na interpretaci faktoru nic neměnÍ. Už z tohoto dllvodu nelze vyvozovat žádné závěry z toho, že "významné" koeficienty nějakého faktoru jsou kladné nebo záporné. Tato skutečnost se přenáš í í na faktorová skóre (srov. krok 4). 14.2.5 Krok 4 (faktorová skóre) Faktorové koeficienty (faktorové zátěže) udávaj í, jak je který deskriptor původního deskriptivního systému z kroku I typický pro daný faktor jako celek. Mližeme si tudíž představit každý faktor jako nějaký abstraktní objekt (ve skutečnosti je to ovšem struktura) a faktorovou zátěž jako u rč itou korelaci tohoto abstraktního objektu s vybraným deskriptorem. To je jeden aspekt problému. Druhý aspekt je typičnost každého z faktorli pro každý z objektů plivodního deskriptivního systému. Existuje čís l o, tzv. faktorové skóre, které tuto typičnost "měří". Jestliže objektiI je 171 a faktorů k, pak faktorových skóre bude m x k, tedy často velký počel'. 242 Teoreticky mohou faktorová skóre nabývat jakýchkoliv reálných hodnot (záporných i kladných), ale za určitých podmínek jich bude cca 62% v intervalu od - I do +1, 95% v intervalu od -2 do +2 atd. Prlllněr hodnot faktorových skóre pro každý faktor je Oa směrodatná odchylka je I. 14.2.6 Krok 5 (validace) Pokud faktorovou analýzu chápeme jako konfirmatorní statistickou metodu testující nějaké struktury (např. struktury získané předtím exploratorní faktorovou analýzou), lze za určitých podmínek získat zamítnutí nebo potvrzení statistické významnosti výsledků. Tento postup je v případě archeologických dat často velmi problematický. Proto jsem navrhl pro testování výsledků sledovat nikoliv statistickou významnost, nýbrž validi/u (platnost). Validita se zj i šťuje pomocí tzv. externí evidence, tj. na základě objektll nebo deskriptorů, které jsou nezávislé na těch, na nichž je postavena faktorová analýza, které ale přesto vytvářejí stejné struktury. Jestliže je totiž náhodné vytvoření něj aké struktury málo pravděpodobné, pak pravděpodobnost, že náhodou bude tatáž struktura vytvořena dvakrát na z I vyčerpávají 71.2% celkové variability ec v tabulce 3), což mllže představovat podíl nenáhodné variability; pro dalši ře­ faktory. hodnou). Oproti tom (srov. poslední sloup šeuí proto zvolíme 3 245 Faktor vlastní čís lo 0/0 variace I kumu lativní % I 1 2.03649 29. 1 29.1 2 1.88509 26.9 56.0 3 1.06155 15.2 71.2 4 0.86629 12.4 83.6 5 0.69743 10.0 93.5 6 0.44510 6.4 99.9 7 0.00805 0.1 100.0 Tab. 3. Vlastní člsl a korelační matice z Tabulky 2. Matici vlastn ích vektorů zde nereprodukujeme, ale lze si o ní učinit určitý obraz z tabulky 5, která obsahuje všech 7 faktorll (rotovaných). 14.5.1.4 Krok 3 Rotací prvních 3 faktorů dostaneme matici faktorových koeficientll na Tabulce 4. Faktor l má dominantní koefic ienty k deskriptorlllll RIM a VESS_DET, mnohem nižší koeficient k LENGTH. Urč itým opakem je BOTTOM. Fak/or 2 má relativně menší (ale stále ještě velm i vysoké) koeficienty vzhledem k LENGTH, WEIGHT, THICKN a BOTTOM. Fak/or 3 má vysoký koeficient k DECOR a slabší k LENGTH a WEIGHT. V opozici k němu (se zápornými koeficienty) stojí BOTTOM a THICKN. faktor I faktor 2 faktor 3 LENGTH 0. 11 572 0.7893 1 0.24407 THICKN -0.00590 0.62500 -0.30587 WEIGHT 0.02808 0.75709 0.18910 DECOR -0.05356 0.09498 0.84905 RIM 0.99365 0.01372 -0.00627 BOTTOM -0.1 7945 0.54717 -0.39266 VESS DET 0.99332 0.01936 -0.006 15 Tab. 4. První lfi faklory rotované metodou Varimax. Sloupce obsahují fhklorové koelicienty (neboli faktorové z..1tčže). Pro srovnání na tabulce 5 uvádíme řešení pro všech 7 faktorll. Při srovnávání s řešením ve třech faktorech budeme za číslem faktoru psát lomítko a počet extrahovaných faktorll (tedy faktor 1/3 je první faktor z tabulky 4 a faktor 1/7 je první faktor z tabulky 5). Předevš ím vidíme, žefaklor 7/7, ktelý odpovídá velmi malému vlastnímu čísl u z tabu lky 2, je skutečně zanedbatelný. Faktor 6/7 do značné míry opakuje faktor 3/7, i když s jiným dllrazem na jednotlivé deskriptory. Faktor 5/7 víceméně osamostatňuje deskriptor DECOR. Faktor 1/3 odpovídá svou strukturou faktoru 1/7, faktor 2/3 faktoru 2/7 a 317, kladný pól faktoru 3/3 (kladné koeficienty) zhruba odpovídá faktoru 517, a záporný pól faktoru 3/3 zhruba faktoru 417. Tyto korepondence jsou jen přibližné a z kvantitativního hlediska problematické. Nicméně ukazují, že řešení ve třech faktorech pravděpodobně v dostačující míře reprodukuje variabil itu souboru a to zejména v situaci, kdy nevíme, jak velké faktorové koeficienty máme ještě brát za směrodatné. Obě řešení vyzvedávají dvojice RIM-VESS_DET, BOTTOM- TH ICKN, a DECOR-LENGTH, a čtveřici LENGTH-THICKN-WEIGHT-BOTTOM. Z tohoto hlediska musíme také posuzovat význam "správné" volby počtu faktorll pro celkové řešení. Pokud se spokojíme s kvalitativním řešením, není 246 chybná volba počtu zvolených faktorů příliš rušivá; pokud nám však záleží na kvantitativních charakteristikách faktorových koefic ientll a faktorových skóre, je počet extrahovaných fa ktorll d" ležitý. faktar I faktor 2 faktor 3 fak tor 4 faktor 5 fa ktor 6 faktor 7 LENGTH 0.064 13 0.27981 0.1 3069 0.09648 0.06282 0.94194 0.00004 THlCKN 0.00534 0.09761 0.97824 0.1 3896 -0.0 I076 0.11 857 0.00003 WEIGHT 0.00781 0.9545 I 0.10284 0.07884 0.01485 0.26802 0.00002 DECOR -0.0 1116 0.0 1424 -0.01005 -0.01837 0.99820 0.05320 0.00002 RIM 0.99630 0.00565 0.00218 -0.04520 -0.00792 0.03499 -0.06345 BOTTOM -0.06845 0.07421 0.13766 0.98 128 -0.0 1936 0.08700 0.00005 VESS DET 0.99637 0.00732 0.00454 -0.04081 -0.006 14 0.03802 0.06343 Tab. 5. Matice faktorů rotovan)'ch metodou Varimax pro případ přijetí 7 faktoru. Krok 4 a 5 v souvislosti s tímto příkladem nediskutujeme. 14.5.1.5 Interpretace V následujících odstavcích velmi stručně a zjednodušeně naznačím vysvětlení získaných faktOrll; takové vysvětlení není ovšem součástí syntézy struktur, nýbrž až jejich interpretace v termínech živé kultury. Výpověď faktor" tohoto příkladu o živé kultuře je omezená, protože je to pl'edevším výpověď o zlomcích; in formace svědčí proto spíše o trans formačních procesech, jimiž se živá kultura mění na mrtvou . Ve svém kroku 3 vyčlenila faktorová analýza tři faktory, které jsou zcela formálními strukturami: tato metoda nemá vůbec žádné informace o tom, co znamenají jednotlivé deskriptory a pracuje výhradně s výchozí korelační maticí, u níž archeologický význam jednotlivých řádek a sloupcll do metody nijak nevchází. Skutečnost, že např. ve faktoru 3/3 je spojena výzdoba s délkou, vyplývá pouze z velikosti korelačních koeficientll; zda 4. řádek matice znamená výzdobu (DECOR) nebo např. plochu střepu , je faktorové analýze zcela lhostejné. Faktor 1/3 je nepochybně důs ledkem skutečnosti , že druh nádoby (VESS_DET) bylo možno určit téměř v),lučně u okrajových zlomkli (RIM). Současně tento faktor napovídá, že okrajové zlomy jsou delši než ostatní. Pro živou kulturu to znamená, že druhy nádob se v rámci použitého deskriptivního systému "strukturá lně" liší především svými okraji. Tento poznatek je triviál ně známý, ale nemusí ve stej/lé mÍl'" platit pro jiné kultury než je laténská. Fuktor 2/3 je "hmotnostní"; říká, že délka, síla a váha střepů spolu úzce souvisí a všechny nab)'vnj í vysokých hodnot u zlomkll den. Odtud vyplývá např. to, že tenké střepy se rozpadaj í na menší kusy než střepy silné, a zlomky den do značné míry sledují toto pravidlo. V oblasti živé ku ltury (při výrobě laténské keramiky) to mllže naznačovat určitou ustálenou technologii, např. to, že síla střepu odpovídala velikosti nádoby (pokud přijmeme hypotézu, že velikost střepu koreluje s jeho zakřiveností a tudíž i s velikostí nádoby). Faktor 3/3 vyč lelluje zdobené zlomky (relativně delší než ostatní) a staví je do protikladu se střepy ode dna a silnými zlomky. Znamená to, že zdobená keramika se pravděpodobně technologicky odlišovala od prlllněru keramiky (viz faktor 2/3), že byla relativně tenkostěnná. Chtěl bych upozornit, že tyto poznatky platí pouze ve spojení s použitým deskriptivn ím systémem; jeho rozš ířením nebo zúžením bychom mohli dostat poněkud jinou podobu faktorll. Pokud ovšem ZLlstaneme II použitého deskriptivního systému, ml1žeme mít relativní j istotu, že soubor našich zlomkll neobsahuje už další "hromadné" závislosti mezi deskriptory než ty, které jsme popsali. To je velmi dtlležitý závěr z každé faktorové analýzy. Mohlo by se zdát, že vyjmenované výsledky jsou triviální a proto postradatelné. To je nepochybně zpúsobeno elementárností našeho příkladu. Musíme vzít v úvahu, že faktorová analýza je 247 schopna správně "vyhmátnout" právě ty vztahy, které určují variabilitu kontextu. Závěr, že variabi litu uspokojivým způsobem vyjadřují tři faktory, jejichž konkrétní podoby lze určit, je myslím netriviálním řešením. Chtěl bych upozornit, že faktory lze zpětně porovnat se strukturou matice korelačních koeficientiJ (tab. 2). Odvodit tyto faktory z matice korelací prohlížením nebo jednoduchými manipulacemi s maticí ovšem nelze. Neexistuje totiž jednoduchá metoda, kterou by bylo možno "rozdělit" korelační koeficient do několika faktorů (srov. např. přítomnost evidentně významných faktorových koeficientú deskriptorll LENGTH nabo BOTTOM ve všech třech faktorech; pokud neznáme výsledky vektorové analýzy, není dllvodu, proč bychom takto nerozdělovali např. deskriptor RIM mezi všechny tři faktory). 14.5.2 Loděnický potok Projekt Loděnický potok spočíval ve sledování pravěkého až novověkého osídlení malého regionu západně od Prahy (asi 8 x 8 km) pomocí povrchových sběrů. Sběry a následné zpracování nálezú provedla v létech 1993-1995 N. Venclová, která také pořídila databázi nálezll včetně nálezll ze starších VÝZkUmll (Venclová 1994, 1995). Následující odstavce navazují na počítačové zpracování nálezů z doby laténské pomocí faktorové analýzy a GIS (Neustupný a Venclová 1996). 14.5.2.1 Krok O Analýza v terénu byla provedena metodikou vypracovanou M.Kunou ( 1994) s modifikacemi. Pás oploše asi 43 km2 byl rozdělen náhodným vzorkováním do velkých polygonů o rozměrech několika až mnoha hektarú, a v těch pak byly vytyčeny základní polygony (sběrové čtverce) o ploše přibližně I ha. Sběry byly provedeny na ploše asi 12 km2; počet základních polygonů byl 1361. V každém polygonu (sběrovém čtverci) byly zaznamenány všechny archeologické nálezy a jejich popis byl uložen v databázi. Pro studium laténského osídlení pak byly z uvedené databáze vybrány následující deskriptory: I. laténská keramika 2. SAPCO - středová kolečka vyříznutá ze švartny (sapropelitu) při výrobě švartnových ná- ramkú 3. SAPW - kusy švartny se stopami opracování 4. SAPN - kusy švartny beze stop opracován í 5. S_SLAG - kusy hutnické strusky Přehled o četnosti těchto deskriptorů ve 1361 objektech (sběrových čtvercích) podává tab. 6. Deskriptivní systém ve formě databáze se stal základem dalších kroků. Problémy se zařazením kategorií SAPW, SAPN a S_SLAG do doby laténské diskutuje uvedený článek E.Neustupného a N.Venclové ( 1996). Deskriptor počet kUSll max. v I čtverci průměr v I čtverci STO neprázdnýchčtvercli keramika 183 10 0.13 0.62 101 SAPCO 318 23 0.23 1.33 112 SAPW 1152 40 0.85 2.58 357 SAPN 1438 27 1.06 2.42 477 S SLAG 3358 397 2.47 20.03 282 Tab. 6. Četnosli deskriptorů laténského období v projektu Loděnice. 14.5.2.2 Krok 1 Na základě deskriptivního systému byly vypočítány korelace mezi deskriptory. Čistě formálně, z hled iska tradiční statistiky, jsou tyto korelace velmi hodnotné, tj. všechny až na jednu jsou sta- 248 I tisticky významné na hladině významnosti menší než I% (jedna na hlad ině nepatrně vyšší než 1%). Přeh led podává tab. 7. LATEN SAPCO SAPW SAPN S SLAG LATEN 1.00000 SAPCO 0.33241 1.00000 SAPW 0.38608 0.50736 1.00000 SAPN 0.07351 0.11255 0.39802 1.00000 S SLAG 0.24380 0.09584 0.18066 0.06253 1.00000 Tab. 7. Projekt Lodčnice, m 2, tmavošedé: skóre od I do 2, svět1ešedé: skóre od Odo 1, bílé: skóre < O. 252 -' .......... ...... ObL2. Loděn ický potok, rozloženi faktorových skóre faktoru 2/l Stupnice jako u obr. 1. 253 ....:-.< .•..' i, -( \, ) ~~ -..... " .. .... . ", / ... ..( .......... Obr. 3. Loděnický potok, rozložení faktorových skóre faktoru 3/3. Stupnice jako II obr. I . 14.5.3 Vikletice (šňůrové pohřebiště) "r l" .' / .J Šňllrové pohřebiště ve Vikleticích (Buchvaldek a Koutecký 1970) sestávalo z více než 150 hrobů. Za předpokladu, že hlavní variabilita je určena časem (chronologií), pohlavím a věkem zemřelých, jsem pro popis hrobů vybral 31 proměnných, které jsem pak vzhledem k malým četnostem některých z nich zredukoval na počet 28. Objekty deskriptivního systému se tudíž staly jednotlivé hroby, deskriptory byly většinou druhy hrobové výbavy. Jestliže hrob obsahoval např. (alespoií jednu) amforu, v příslušném poli deskriptivní matice bylo zapsáno číslo I, pokud amforu neobsahoval, čís lo O. V takovém případě standardní program pro výpočet korelací produkuje korelační koeficient, který je shodný s tzv. Cramerovým V. K řešení bylo vybráno 9 faktorů. K testování validity faktorů byly vybrány dvě externí evidence. Jednak to byla informace o pohlaví a věku zemřelých: pohlaví je v kultuře se š,lůrovou keramikou jednoznačně určeno polohou kostry na pravém nebo levém boku; pro dožité stáří bylo použito mínění ryzických antropologů. Pro každý faktor byly vybrány hroby s faktorovým skóre přesahujícím jednotku; počet takových hrobů pro jednotlivé faktory je udán ve druhém sloupci tabulky II. V dalších sloupcích následuje počet hrobll 254 -- I " mužských a počet hrobll ženskýclI a jednoduchý statistický test chi2 (chikvadrát) pro ověření, zda (rozdíl je statisticky významný na hladině významnosti 5%, jestliže ež 3.84 1). Totéž pak následuje pro pohřby dospělých a pohřby dětí. 9/9 je při poměru dospělí:děti (12:6) významná převaha dělí, a to ětských hrobů na pohřebišti. rozdíl v těchto počtech je náhodný testovací charakteristika je větší n Upozonluji, že v případě faktoru vzhledem k velmi malému počtu d Z tabulky je vidět, že soubory hrobových přídavků charakterizované faktory 2/9 a 6/9 jsou n a faktory 3/9 a 8/9 v hrobech mužl!. Faktor 3/9 znamená dospělé mněme si, že tento faktor je častěji charakteristický pro hroby dostatisticky významné v hrobech že osoby a faktor 9/9 spíše děti (vši spě lých, ale vzhledem k jejich naprostému převládnutí v souboru znamená i absolutně menší četnost 9/9 významnost tohoto faktoru pro děti).dětských hrobll s výbavou faktoru V popsaném případě při spívá zjištění validity současně k intepretaci. Velkou část faktorů bylo le druhů inventáře. Tak např. faktor 3/9 charakterizovaly následujíháry s úškem, těžké sekery, kulovité palice, sekeromlaty, džbánky, zřejmě o výbavu mužských hrobú mladší a pozdní fáze české kultuovšem snadné interpretovat už pod ci deskriptory: ploché sekerky, po pazourkové nástroje a amfory. Jde ry se šiíůrovou keramikou. Faktor hrobů muži žen chi dos děti chi FA 1/9 33 8 17 3.240 22 4 0.150 FA 2/9 25 I 19 16.200 21 1.354 FA 3/9 36 28 O 28.000 30 O 4.422 FA 4/9 41 22 16 0.947 31 8 2.047 FA 5/9- 35 21 12 2.455 30 2 1.244 FA 6/9 38 2 34 28.444 34 3 0.742 FA 7/9- 27 13 II 0.167 19 6 2.777 FA 8/9- 39 30 4 19.882 30 3 0.416 FA 9/9 22 5 13 3.556 12 6 6.744 Tab. 11. Vikleticc, rozdělení hrobů s faktorovými skóre charakteristickými pro jednotlivé faktory podle pohlavi a věku zemřelých. Druhou externí evidencí se stala poloha pohřbů na pohřebišti. Bylo zjištěno, že hroby s vysokjednomu faktoru se velice často prostorově shlukují. Tak např. už ntoval dospělé muže mladší až pozdní fáze, a faktor 6/9 víceméně n. Přitom prostorová rozložení těchto faktorů, měřeno faktorovými akticky vylučují (obr. 4). kými faktorovými skóre vzhledem zmíněný faktor 3/9 zřejmě represe současné hroby dospělých (77) že skóre s vysokými hodnotami, se pr To je další dllvod k důvěře ve validitu studovaného faktorového řešení. 255 ., ~ ~ group" group I group '" group Va gfOUp Vb group VII G 9fOUP VIII group IX Ohr. 4n. Vikleticc, šňúrové pohřebiště, faktor 3/9. Šedě a černě plochy s předpokládaným faktorovým skóre > O. Stupnice jako u obr. I group I ogroup II group III groupVa group Vb groupVI group VII group VIII group IX Obr. 4b. šMrovó pohřebiště, faktor 6/9. Šedě a černě plochy s předpokládan)'m faktorovým skóre> O. Stupnice jako u obr. 1. 256 14.6 Praktické provedení Dnes existuje řada "balíků" programů, které provádějí faktorovou analýzu. Všechny nejsou stej ně vhodné, starší z nich mají komplikované vstupy dat, některé z nich nepočítají faktorová skóre, u jiných je nejasný algoritmus. Autor tohoto textu dříve používal svůj vlastní program, napsaný v 60.létech (kdy prakticky neexistoval software) v jazyku Fortran IV. Adaptace tohoto programu pro přímý vstup z databáze, pro velké matice dat atd. by si však byla vyžádala nepřiměřeného programátorského úsilí; to vedlo k přechodu na komerční software. Příklady v této práci jsou vypočítány pomocí softwaru SPSS firmy SPSS, Inc., který je ve svých nových verzích velmi přátelský, není však levný. V případě SPSS je výběr mezi několika modely "faktorové analýzy". Vstup do analýzy metodou hlavních komponent je přímo z relační databáze, např. z dBASE IV, ale jsou možné i další varianty vstupu. Podle manuálu nebo "helpu" se předem zadají požadavky na postup výpočtu (který pak probíhá plně automaticky a prakticky okamžitě) a výstupy. Obvyklý výstup korelačních koeficientl', vlastních čísel a faktorových koeficientů je do textového souboru, odkud se může načíst do rukopisu; faktorová skore se automaticky zaznamenávají do databáze, z níž byl vybrán deskriptivní systém (pokud je ovšem tato volba předem vybrána). Takovou databázi pak lze použít např. jako vstup do GIS. Poděkování. Tato práce byla částečně napsána s podporou grantu 404/95/0523 Grantové agentury České republiky. Za posouzení srozumitelnosti textu děkuji D.Dreslerové, M.Kunovi, J . Macháčkovi, V.Salačovi a N.Venclové. 14.7 Literatura K seznámení s matematickými pojmy je vhodná kterákoliv moderní učebnice lineární algebry, numerické matematiky aj. Dále uvádím jen práce citované v textu, některé velmi základní příručky a archeologické aplikace vektorové syntézy na český materiál. Binford, L.R. and S.R. Binťord 1966: A preliminary analysis of functional variability in the Mousterian of Leva llois facies, American Anthropologist 68, 238-295. Buchvaldek, M. and D.Koutecký 1970: Vikletice, ein schnurkeramisches Griiberťeld. Praha Harman, H.H. 1970: Modern Factor Analysis. Ch icago and London. The University ofChicago Press. Kuna, M. 1994: Archeologický průzkum povrchovými sběry - Archaeological survey by surface collection (Zprávy České archeologické společnosti, Supplément 23). Praha Kuna, M. 1996: GIS v archeologickém výzkumu regionu: vývoj pravěké sídelní oblasti středních Čech. Archeologické rozhledy 48,580-604. Neustupný, E. 1973: Factors determining the variability ofthe Corded Ware Culture. In: C. Renfrew (ed.): The explanation ofcultllre change. London. 725-730. Nellstupný, E. 1973: Mathematische Untersllchungen zur bohmischen Schnurkeramik - Matematický výskum českej šnúrovej keramiky, Musaica (Zborník filozofickej fakulty univerzity Komenského),13 -67. Neustupný, E. 1973: Jednoduchá metoda archeologické analýzy - A simple method of archaeological analysis, Památky archeologické 64, 169-234. Neustupný, E. 1978: Mathematical analysis of an Aeneol ithic cemetery, Studia praehistorica j -2, 238- 243. Neustupný, E. 1978: Mathematics at Jenišův Újezd. In: Das keltische Griiberfeld bei JeniŠllv Újezd in Bohmen 2. Teplice. 40-66. Neustupný, E. 1979: Vektorová syntéza sídlištní keramiky - Vector synthesis of finds from settlement sites, Archeologické rozhledy 31 , 55-74. 257 Neustupný, E. 1981: K matematické analýze pravěkých pohřebišť - Zur mathematischen Analyse priihistorischer Griiberfelder. In: Současné úkoly československé archeologie (Valtice 1978). Praha. 190-193. Neustupný, E. 1986: Nástin archeologické metody - An outline of the archaeological method, Archeologické rozhledy 38, 525-549. Neustupný, E. 1993: Archaeological Method. Cambridge. CUP Neustupný, E. 1994: Role databází v archeologi i - The role of databases in archaeology, Archeologické rozhledy 46, 121-128. Neustupný, E. 1995: 8eyond GIS. In: Lock,G. and Z.Stančič (eds.), Archaeology and Geographical Information Systems a European Perspective. London. Taylor&Francis. 133-139. Neustupný, E. 1996: Polygons in archaelogy, Památky archaeologické LXXXVII, 11 2- 136. Neustupný, E. and S.Vencl 1995: Formal methods at Hostim. In: S.Vencl: Hostim - Magdalenian in Bohemia, Památky archeologické - Supplementum 4, 205-224. Neustupný, E. a N.Venclová 1996: Využití prostoru v laténu: region Loděnice, Archeologické rozhledy 48-4,615-642. Ueberla, K. 1974: Faktorová analýza. Bratislava. Alfa. Venclová, N. 1994: The field survey ofa prehistoric industrial region, Památky archeologické - Supplementa I, 239-247. Venclová, N. 1995: Specializovaná výroba: teorie a modely - Specialised production: theories and models, Archeologické rozhledy 47, 541-564. 258 Počítačová podpora v archeologii Jiří Macháček (editor) Vydala Masarykova univerzita v Brně roku 1997 I. vydání, 1997 Náklad 500 výtiskll AA - 15,88 VA - 16,2 1 Sazba Dan Šlosar, LVT FF Tisk Gloria, Rosice II Brna Pořadové čís lo 270 I/FF - 1/97 - 17/99 ISBN 80- 2 10- 1562--4