Výuka IBA Analýza genomických a proteomických dat Objevování skupin Jaro 2021 28 duben 2021 Eva Budinská (budinska@recetox.muni.cz) Společná schéma analýzy dat Biologická otázka (hypotéza) N matic základních dat (jedna pro každý z N vzorků) Kontrola kvality Normalizace Sumarizace Provedení experimentu (hybridizace mikročipů, hmotnostní spektrometrie...) Design experimentu Objevování skupin? (Shlukování) Porovnání skupin? (Testování) Predikce skupin? (Klasifikace) Analýza přežití Analýza časových řad Charakterizace nových skupin List genů se stejným profilem změn exprese v čase Interpretace Validace Publikace Matice informací o vzorcích N x P (např. klinická data v medicíně) Finální datová matice N vzorků a K genů (proteinů) Nové skupiny genů nebo vzorků List genů s odlišnou expresí mezi skupinami vzorků Klasifikační pravidlo využívající genovou expresi Seznam prognostických genů Tradiční schéma analýzy • Učení s učitelem (supervised learning) • V tomto případě zobecňujeme známou strukturu dat na nové data • Porovnávání skupin (class comparison) • hledáme rozdíly v expresi, počtu kopií genů nebo abundanci proteinů mezi již definovanými skupinami • Předpovídání skupin (class prediction) • na známých skupinách se snažíme vytvořit klasifikátor, který by dokázal zařadit nového pacienta do jedné ze skupin • Učení bez učitele (unsupervised learning) • V tomto případe struktura v datech není známá a musíme ji objevit • Objevování skupin (class discovery) • na základě informací o genech/proteinech hledáme nové skupiny • onemocnění X je velmi heterogenní a snažíme se identifikovat specifičtější podtypy, které by mohli být cílem cílené terapie Společné znaky analýzy dat • Velké množství proměnných • Malé množství vzorků • Proměnné jsou často korelované, s velmi komplexními vztahy • Data obsahují množství šumu – biologická i technická variabilita Objevování skupin • Snažíme se vytvořit závěry o datovém souboru bez (braní v potaz) jakékoliv předchozí znalostí biologických skupin • Cílem je vytvořit skupiny objektů na základě jejich vzájemné podobnosti • Objekty uvnitř skupiny mají být co nejpodobnější a objekty z různých skupin mají být tak odlišné, jak jen je to možné • Skupina metod pro objevování skupin je představovaná metodami shlukování bez učitele Co shlukujeme v molekulární biologii • Geny/proteiny • Chceme identifikovat skupiny ko-regulovaných genů/proteinů • Chceme zredukovat dimenzi dat na základě funkčních genových/proteinových skupin • Vzorky • Kontrolujeme kvalitu vzorků • Chceme najít nové skupiny vzorků (například podtypy) • Chceme vizualizovat diskriminační schopnost genů vybraných při porovnávání známých skupin Princip • Máme datovu matici X velikosti N x P • N – počet objektů (vzorky) • P – počet proměnných (geny/proteiny) • Hledáme nejlepší rozdělení dat na skupiny tak, aby nalezené skupiny byly uvnitř skupiny vysoce homogenní a mezi sebou vysoce heterogenní N vzorek P proměnných (geny, proteiny) Typy shlukovacích metod • Shlukovací metody se dělí na dvě hlavní skupiny: 1. Metody založené na vzdálenosti • neparametrické • nejčastěji používané, intuitivní • hierarchické a nehierarchické shlukování 2. Metody založené na modelování • parametrické, kladou silné předpoklady na rozložení dat • založeny na statistickém modelování – přiřazují každému objektu pravděpodobnost s jakou patří do daného shluku Metody založené na vzdálenostech I. • Princip: 1. Zvolíme metriku vzdálenosti (jak vzdálenost měříme?) 2. Vypočteme matici vzdáleností mezi objekty (každý s každým) 3. Vybereme shlukovací algoritmus 4. Stanovíme počet shluků – jen u některých metod 5. Aplikujeme shlukovací algoritmus na matici vzdálenosti získáme shluky • Shlukovací algoritmy: • Hierarchické • Aglomerativní – Single, Complete, Average, Ward linkage, … • Divizivní – DIANA,... • Nehierarchické • K-means, PAM... Metriky vzdáleností I. Máme 2 vektory hodnot x = (x1, …, xn), y = (y1, …, yn) • Euklideovská vzdálenost: • Standardizovaná Euklideovská vzdálenost: Metrika penalizuje – snižuje vzdálenost mezi objekty s velkou variabilitou, předpokládajíc, že jsou důležitější než objekty s malou variabilitou. • Manhattanovská vzdálenost: Robustnější vůči odlehlým hodnotám. Metriky vzdáleností II. • Metriky založené na korelačním koeficientu r(x,y) • Můžeme odvodit dvě různé metriky: • Ukázka rozdílu mezi metrikama d1=0.05, d2=0.19 d1=0.5, d2=1 d1=0.95, d2=0.19 Pří použití d1 budou geny s opačnými profily patřit do odlišných shluků, zatímco při použití metriky d2 budou patřit do toho stejného shluku. Pokud chceme shluky interpretovat jako množiny genů ze stejné regulační sítě, použijeme raději d2. Výběr metriky • Výběr metriky záleží na tom, jaký typ podobnosti nás zajímá • Pokud nás zajímá průměrná exprese genů (A a B jsou podobné), aplikujeme Euklidovskou vzdálenost • Pokud nás zajímá vzor exprese genů (A a C jsou podobné), aplikujeme vzdálenost založenou na korelaci A B C Gene ID Log2Ratio 0 3 2 1 4 Na co si dávat pozor I. • Mnoho shlukovacích technik najde shluky i v datech, ve kterých nejsou žádné přirozené shluky, jen proto, že byly pro tento účel zkonstruované 728197631140 35596624693082625875875903741 7732789173465395105135734315 238654392949196265211338601488 276807410082641722283129852 728619495067897944784769244 20455655719942931487016438536 1533189668 3663842582 549253524858774966840100975761 10869160322099791642681237648 9437735649756990725211776758 917708334182833314558819650 29317127162413551956544464798 239894543893781580133071266 425922643821 Na co si dávat pozor II. • Výsledek jediného shlukování by nikdy neměl být považovaný za objektivní reprezentaci informace skryté v datech, protože je závislý od použité metody a také v rámci metody od nastavení! Další problémy • Výběr shlukovacího algoritmu a metriky ovlivňuje konečné výsledky • Výsledky jsou závislé na samotných datech • Kolik shluků? • Potřebujeme odhad jistoty, že nalezené shluky jsou správné • Odhad kvality shluků je založen na metrikách z dat z kterých byli shluky vytvořené Kolik shluků? • V případě nehierarchických metod počet shluků určujeme dopředu • V případě hierarchického shlukování vytváříme strom, dendrogram, který se potom prořezává • Počet shluků je následně určený tak, aby heterogenita v rámci shluků byla co nejmenší a mezi shluky co největší • Různé metriky heterogenity shluků – variabilita, Silhouette, ... Řezání dendrogamu jeho problém • U hiararchického shlukování se stanovuje fixní výška řezu dendrogramu >cutree() • Problém: u genomických dat se často vyskytují shluky v různých výškách řezu AML AML AML AML AML AML AML AML AML AML AML ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_T-cell ALL_T-cell ALL_T-cell ALL_T-cell ALL_T-cell ALL_T-cell ALL_B-cell ALL_T-cell ALL_T-cell 0.20.40.60.81.01.2 Cluster Dendrogram hclust (*, "complete") as.dist(1 - cor(d)) Height static cutreeHybrid_5 cutreeHybrid_3 Dynamic tree cut • Metoda prořezávání dendrogramu (Langfelder et al, 2007) • Dynamické řezání dendrogramu na základě minimální velikosti shluků, maximální výšky řezu a dalších parametrů >library(dynamicTreeCut) AML AML AML AML AML AML AML AML AML AML AML ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_B-cell ALL_T-cell ALL_T-cell ALL_T-cell ALL_T-cell ALL_T-cell ALL_T-cell ALL_B-cell ALL_T-cell ALL_T-cell 0.20.40.60.81.01.2 Cluster Dendrogram hclust (*, "complete") as.dist(1 - cor(d)) Height static cutreeHybrid_5 cutreeHybrid_3 Robustní shlukování • V analýze vysokopokryvných molekulárních dat mají výše uvedené problémy větší váhu • Malý počet vzorek a vysoký počet genů/proteinů spolu s vyšším množstvím šumu v datech jsou důvodem, proč je shlukování těchto dat citlivé na přeučení (overfitting) • Shlukování je méně robustní (více ovlivněné variabilitou dat) • Variabilita dat a výsledky shlukování se dají simulovat opakovaným náhodným výběrem z dat Konsenzuální shlukování • Forma robustního shlukování (Monti et al., 2003) • Opakované vzorkování a shlukování jako způsob nalezení konsenzusu mezi jednotlivými výsledkami shlukování za účelem: • Určení počtu a stability shluků v datech • Vytvoření nové metriky vzdálenosti – konsenzusu • Základní princip: • Rozrušení struktůry originální N x P datové matice pomocí náhodného výběru podmnožiny vzorků a/nebo genů • Na novém datovém souboru aplikujeme shlukovací algoritmus se stejnou mírou similarity a počtem shluků • Oba body jsou opakované L krát pro jiný počet shluků. Základní princip konsenzuálního shlukování (i) Narušení struktury originální N x P datové matice pomocí náhodného výběru podmnožiny vzorků a/nebo proměnných (ii) Na novém datovém souboru aplikace shlukovacího algoritmu se stejnou mírou similarity a počtem shluků (i) a (ii) opakuj L-krát pro různé počty shluků (1, …, k) Algoritmus N x p Nl x p Výběr ze souboru bez opakování Matice propojení Cl ij=1 Když i,j spolu ve shluku, 0 jinak Shlukování Indikátorová matice Il ij=1 Když i,j spolu ve výběru, 0 jinak l = 1.. L opakování Matice konsenzusu å å = = = L l l ij L l l ij ij I C M 1 )( 1 )( Výběr počtu shluků k = 1 .. K shluků Konsenzuální shlukování å å = = = L l l ij L l l ij ij I C M 1 )( 1 )( Myšlenka konsenzuálního shlukování • Pokud se dva vzorky v jednotlivých výběrech nacházejí často spolu ve shluku, jsou důvěryhodnějšími členy shluku než ty, které se ve shluku nacházejí méně často Data bez struktury (náhodný výběr z normálního rozložení) Data se třemi skupinami A. B. Odhad počtu shluků I { } 2/)1( 1 - £ = å< NN xM CDF ji ij x Kumulativní distribuční funkce Konsenzus mezi dvěma vzorky golub data, k=3 Consensus measure Frequency 0.0 0.2 0.4 0.6 0.8 1.0 0204060 Histogram míry konsenzusu Odhad počtu shluků II golub data, k=3 Consensus measure Frequency 0.0 0.2 0.4 0.6 0.8 1.0 0204060 golub data, k=6 Consensus measure Frequency 0.0 0.2 0.4 0.6 0.8 1.0 050100150 { } 2/)1( 1 - £ = å< NN xM CDF ji ij x 6 shluků má podstatně míň vzorků s konsenzusem 1 a tím pádem jsou tyto shluky míň důvěryhodné Struktura se 3 shluky naopak vypadá jako optimum Jako rozhodovací pravidlo – rozdíl v plochách pod CDF křivkami Odhad počtu shluků III Delta = relativní změna plochy pod CDF křivkou mezi dvěma k Další metriky konsenzuálního shlukování Konsenzus shluku k Konsenzus vzorku si v k-tém shluku Obě míry se používají pro identifikaci odlehlých hodnot (vzorky s nízkou mírou konsenzu k jakémukoliv jinému vzorku v jinak homogenním shluku; shluky s nízkou mírou konsenzu obecně) kde je indikátorová funkce å < Î- = ji Iji ij ll k k M NN m ,2/)1( 1 { }å ¹ ÎÎ- = ij Ij ij kil k i l M IsN m 1 1 { }ki Is Î1 Konsenzuální shlukování – R balík > source(“http://bioconductor.org/biocLite.R”) > biocLite(“ConsensusClusterPlus”) Metody založené na modelech • Modely Gaussových směsí (mixture models) • Předpokládají, že naměřené hodnoty genu/proteinu g ve všech vzorcích (Xg) jsou náhodným výběrem a jejich rozložení závisí na skupině do které gen g patří • Náhodnost Xg souvisí s pozorovanou variabilitou v datech z genomických a proteomických experimentů • Na rozdíl od metod založených na vzdálenosti poskytují tyto modely: • odhad parametrů, které charakterizují každou skupinu (průměr, rozptyl, …) • pravděpodobnost příslušnosti genu ke každé ze skupin • statistické kritéria pro výběr počtu skupin Modely Gaussových směsí Pokud objekt patří do více skupin shluků • Většina shlukovacích technik vytváří disjunktní shluky: každý objekt je součástí jediného shluku • Toto zvlášť v genomice a proteomice nemusí být nejlepší přístup, protože většina proteinů/genů je součástí více biologických drah -> proto by měli patřit do více skupin • Jak zohlednit tuto informaci: • Aplikujeme speciální shlukovací metody (například fuzzy clustering) • Aplikujeme metody založené na modelech a vyvodíme závěry z přiřazených pravděpodobností • Biclustering (two-way clustering) shlukuje zaráz řádky i sloupce Jak shlukovat efektivně • V genomice a proteomice obvykle nemá význam shlukovat úplně všechny objekty (proteiny/geny) • Většina z nich není významná • Vnášejí do procesu šum, který zakryje pravou strukturu dat • Je vhodné zredukovat dimenzi dat: • PCA, gene-shaving, … - dokáží extrahovat informaci o genech/proteinech s podobnými charakteristikami, stačí potom ve shlukování reprezentovat charakteristikami těchto skupin • Redukce na základě SD anebo CV Kde hledat shluky I. • Data můžou vytvářet shluky v odlišných dimenzích from Giovanni Montana's presentation Kde hledat shluky II. • V případě, že předpokládáme shlukování v nižších dimenzích, můžeme: • Hledat v nižších dimenzích vytvořených PCA • Použijeme podprostorové shlukovací algoritmy, které jsou schopné detekovat shluky, které existují ve více podprostorech a mohou se překrývat Podprostorové shlukovaní • Hledá shluky ve všech podprostorech • Počet podprostorů je 2d, kde d je počet dimenzí (počet genů/proteinů) • Typy algoritmů: • Top-down – najde iniciální rozložení na všech dimenzích a potom se dívá na podprostory každého shluku, iterativně zlepšují výsledky • Bottom-up – najdou regiony v nižších dimenzích a potom je zkombinují a vytvoří shluky • MAFIA (Nagesh, 1999) • ENCLUS (Chen, 1999) • COSA (Damian et al., 2007) • SMART (Jing et al., 2009) > library(orclus) Vizualizace výsledků • Správná vizualizace výsledků je nejdůležitější součást analýzy! Boxploty exprese genůVizualizace korelací mezi vzorky Alizadeh et al., Nature 403:503-11, 2000 Validace ve shlukování molekulárních dat Jak validovat, když neznáme pravdu??? Validace algoritmu a parametrů modelu na testovacím souboru (Když zopakujeme celou proceduru na dalším souboru, dostaneme stejný výsledek?) Jak validovat, když neznáme pravdu??? Validace konceptu pomocí klinických, molekulárních a histologických charakteristik objevených skupin (Mají objevené skupiny biologickou podstatu / odrážejí známé vědecké poznatky?) (Je rozložení těchto charakteristik mezi podtypy srovnatelné ve validačním souboru?) Příklad shlukování – objevování skupin kolorektálního karcinomu Kolorektální karcinom - Heterogenní onemocnění s rozdílnou odpovědí na terapii Pouze několik klinicky používaných molekulárních markerů: - BRAF/KRAS mutace – pro kvalifikaci k antiEGFR terapii (u stadia s metastázemi) - MSI – mikrosatelitová nestabilita – obecně považovaná za dobrý marker Cíl: Nalézt skupiny nádorů kolorekta s podobnou expresí genů (podobným genovým profilem) ~ podtypy Charakterizovat tyto podtypy pomocí klinických a dalších molekulárních parametrů. Datové soubory: 1. Matice obsahující kvantitativní expresi genové aktivity nádorů N x p, k=1..5 2. Matice klinických a molekulárních parametrů ke každé nádorové vzorce, včetně přežití pacienta Vzorky nádorů Geny VÝBĚR PROMĚNNÝCH / Zmenšení dimenze dat Nezávislý výběr – z 25 000 genů, výběr podmnožiny 3025 genů s nejvyšší variabilitou v souboru Redukce dimenzionality - práce s genovými moduly genový modul - sada genů s podobnou genovou expresí (na základě korelace) Jedná se o jistou formu vážení efektu biologických motivů předpoklad: sada korelovaných genů ~ biologický motiv Příklad EMT • EMT - epiteliálně mesenchymální přechod • Genová exprese podobná zdravé mezenchymální tkáni • Obvykle reprezentován změnou exprese stovek genů • Identifikace modulu EMT a jeho reprezentace jedinou hodnotou (průměrem) zmenší jeho efekt v shlukování a dá šanci dalším důležitým procesem reprezentovaným menším množstvím genů 3025 genů Datový soubor 1 150 genových modulů Pearsonova korelace, Hierarchické shlukování Complete linkage řezání dendrogramu Výběr 54 modulů (625 genů) Validace jejich korelací v 4 dalších datových souborech 54 meta-genů Medián exprese genů v modulu Pearsonova korelace, Hierarchické shlukování complete linkage řezání dendrogramu 8 hlavních shluků ~ Hlavní biologické motivy Identifikace biologických motivů • Analýza genových sad Biol motiv: EMT, proliferace, Chromozomm 20q... V genomu V biol motivu V genomu a b V modulu c d Cíl: Najít skupiny nádorů kolorekta s podobnou expresí genů (podobným genovým profilem) ~ podtypy Charakterizovat tyto podtypy pomocí klinických a známých molekulárních parametrů. Motivy genové expresee v podtypech Hierarchické shlukování na matici konsensusu Analýza genových sad Expresní profily pro jednotlivé podtypy • Klasifikátor LDA (linear discriminant analysis) Minimální genová sada • Selekce genů pomocí elastic net - počítá s korelovanými geny (neodstraňuje jen jeden gen, ale všechny korelované) • Klasifikátor vytvořený na selektovaných genech (Shrunken centroids) Podtyp Minimální genová sada A CLCA1, PADI2, ADTRP, RETNLB, TIMP3, MUC2, FNDC1, NR3C2, SULF1, B3GNT7, STYK1, CHI3L1 B FARP1, ALOX5, FSCN1, HNF4A, RARRES3, MYRIP, GPSM2, TSPAN6, CCDC113, CDHR1, KCTD12, SGK1, BASP1, MT1E, GPX8, RPS6KA3, SOCS3, SLC5A6, PRR15, PLAGL2, IHH, CREB3L1, TP53RK, YAE1D1, EPB41L3, QPRT, KCNK5, RNF43, VAV3, CXCR4, ITPRIP, GRM8, GFPT2, KCNMA1, KIAA0226L,RNASE1 C TFAP2A, ATP9A, RAB27B, ANP32E, CXCL14, IDO1,RARRES3, EGLN3, KIAA0226L,C10orf99,RPL22L1, PLK2 D PRICKLE1, RBM47, TAGLN, BOC, HOOK1, C7, ANK2, DCHS1, DDR2, CRYAB, GEM E REG4, IL6, CXCL5, RAB27B, CEACAM6, PI15, MRPS31, RAP2A, UQCC, AGR3, HSD11B1, IL1B Cíl: Najít skupiny nádorů kolorekta s podobnou expresí genů (podobným genovým profilem) ~ podtypy Charakterizovat tyto podtypy pomocí klinických a známých molekulárních parametrů. Vzor exprese biologických motivů • Analýza genových sad pomocí KS testu Rozdíly v prežití • Kaplan-Meierovy křivky přežití • Coxův model proporcionálních rizik (efekt stádia vs podtypů) • Rozdíl od populační baseline u každého podtypu pomocí Fisherova exaktního testu, FDR úprava p-hodnot Charakterizace podtypů klinickými a molekulárními proměnnými Histologické rozdíy • Fisherův test, úprava na FDR Podtyp A - Surface crypt like - KRAS mutanti, papillaris a Serrated morfotyp, nejvíce diferencovaný, bez aktivní Wnt signální dráhy. Dobré OS a RFS. Podtyp B - Lower crypt like - diferencované ale bez sekrečních buněk, proliferující, a aktivní Wnt signální dráhou. Komplexní tubulární morfotyp. Časo MSS, BRAFwt, nižšího grady, dobré přežití v OS, RFS i SAR. Podtyp C – CIMP-H like - často MSI, BRAF-mutantní, hypermutované, z pravé části tlustého střeva. Histologicky - horší diferencované, solidního-trámčité s mucínovéým morfotyp. Aktivní proliferujícími a mají silnou imunitní reakci. Dobrý RFS, ale špatný OS and SAR. Podtyp D – Mesenchymal – markery kmenových buněk, mnoho mezenchymálních buněk, které se projevují expresí EMT genů. Wnt signální dráha je neaktivní a proliferace nízká. Klinické a mutační charakteristiky se neliší od populační baseline. Mají nejkratší přežití do relapsu, špatný OS a SAR. Podtyp E – Mixed – často MSS, BRAFwt, z levé strany tlustého střeva. Podobně jako podtyp D exprimuje geny kmenových buněk a EMT procesu, avšak podobně s B má vysoce aktivní kanonické Wnt dráhy a vypadá více diferenciovaný. Je podobný B komplexní tubulární, jen častěji obsahuje mutaci p53. Validace podtypů kolorektálního karcinomu Validace algoritmu a parametrů modelu na testovacím souboru Když zopakuji celou proceduru na jiném souboru, dostanu podobné skupiny? Cluster/subtype in validation set Subtypes from training set most correlated to validation subtypes First subtype Second subtype Subtype Cor P-val Subtype Cor P-val C1 / A A 0.85 p<1.0E-15 F 0.41 p<1.0E-15 C2 / B1 B 0.71 p<1.0E-15 E 0.47 p<1.0E-15 C3 / B2 B 0.91 p<1.0E-15 A 0.36 p<1.0E-15 C4 / C C 0.89 p<1.0E-15 F 0.29 p<1.0E-15 C5 / D D 0.93 p<1.0E-15 E 0.37 p<1.0E-15 C6 / E E 0.63 p<1.0E-15 D 0.58 p<1.0E-15 C7 / F F 0.61 p<1.0E-15 C 0.55 p<1.0E-15 Cluster/subtype in validation set LDA assignment SUM A B C D E C1 / A 74 4 3 3 0 84 C2 / B1 1 58 0 2 13 74 C3 / B2 12 134 1 0 1 148 C4 / C 1 2 99 4 0 106 C5 / D 0 3 12 64 7 86 C6 / E 1 17 0 17 13 48 C7 / F 23 1 22 9 1 56 Non-core 21 53 18 8 18 118 SUM 133 272 155 107 53 720 Validace konceptu pomocí klinických, molekulárních a histologických charakteristik objevených skupin Mají objevené skupiny biologickou podstatu / odrážejí známé vědecké poznatky? Je rozložení těchto charakteristik mezi podtypy srovnatelné ve validačním souboru? Mají objevené skupiny biologickou podstatu / odrážejí známé vědecké poznatky? Podtyp C – pravostranné, BRAFm, MSI nádory, které jsou známé špatným přežitím po relapsu Zvýšená exprese genů chr. 20q v podtypu B by mohla znamenat amplifikaci chr20q regionu. Podtyp D – mezenchymální – histologické vyhodnocení: v nádoru přítomna silná desmoplastická reakce (mezenchymální tkáň) Nádor Je rozložení klinických charakteristik mezi podtypy srovnatelné ve validačním souboru? Závěrem Zkoušejte více metod v rámci jedné studie Nezapomeňte na robustní shlukování Pokud je potřeba (hierarchické shlukování), použijte dynamické řezání stromu Propojte výsledky s biologickými a klinickými proměnnými, interpretuje nálezy Pokud je to možné, validujte výsledky na testovacím souboru! Pokud ne, vaše interpretace a závěry jsou pouze spekulativní.