Eduard Kejnovský & Roman Hobza Evoluční genomika jaro 2010 2 OSNOVA Kapitola I.: VZNIK ŽIVOTA Kapitola II.: RELIKTY SVĚTA RNA Kapitola III.: EVOLUCE GENOMŮ Kapitola IV.: EVOLUCE GENŮ Kapitola V.: DYNAMIKA GENOMŮ Kapitola VI.: REGULACE GENOMU Kapitola VII.: EVOLUCE SEXUALITY Kapitola VIII.: LIDSKÝ GENOM A EVOLUCE ČLOVĚKA 3 Kapitola I.: VZNIK ŽIVOTA 1.1. Kosmologická předehra 1.2. Představy o vzniku života 1.3. Moderní teorie chemické evoluce, Millerovy experimenty 1.4. Další názory na vznik života - Eigen, Wachterhauser, Martin a Russel 1.5. Panspermie 1.6. Extremofilové 1.7. Život na bázi jiných prvků a rozpouštědel 1.8. Vznik prvních živých systémů 1.8.1. Původní živé systémy byly na bázi proteinů 1.8.2. Původní živé systémy byly na bázi nukleových kyselin (genová hypotéza vzniku života) 1.8.2.1. Ribozymy 1.9. Koevoluce nukleových kyselin a proteinů, genetický kód 1.9.1. Degenerace kódu a odchylky od standardního kódu 1.9.2. Vznik genetického kódu – najednou nebo postupně? 1.9.3. Selekce in vitro a aptamery 1.9.4. Na scénu přichází transferová RNA 1.9.5. Nejstarší aminokyseliny a evoluce kodonů 1.10. První živé systémy byly založeny na jiném principu 1.11. Převzetí role média pro uchování genetické informace molekulami DNA 1.1. Kosmologická předehra Podle současné kosmologické teorie je náš Vesmír jedním z mnoha vesmírů a vznikl ze singularity – podivného stavu nekonečné hustoty, extrémních teplot, křivosti a nekonečně malého rozměru, kde neplatí přírodní zákony. V důsledku fluktuace falešného vakua došlo k Velkému třesku před 13.7 miliardami, či lépe před 10-20 miliardami podle fyzika S. Hawkinga. Prostor, čas i hmota začaly existovat současně. Obecná teorie relativity poskytla poprvé solidní rámec pro kosmologii. Již Albert Einstein si uvědomil, že pomocí rovnic teorie relativity se vědci mohou pustit do modelování vesmíru a jeho vývoje. Ruský matematik Alexander Friedman a belgický kosmolog abbé Georges Lamaitre zjistili, že rovnice teorie relativity nemají žádné statické řešení, takže ve vesmíru musí docházet ke změně rozměrů s časem. V úvahu přicházelo tedy buď smršťování nebo rozšiřování vesmíru. Einstein se zpočátku domníval, že Friedman se mýlí, až po čase uznal jeho práci. Klíčovým objevem bylo zjištění Edwina Hubbla roku 1929, který zjistil, že ve spektrech galaxií dochází k posunu čar do červené oblasti. To bylo vysvětlitelné jedině tak, že čím jsou galaxie od nás dál, tím rychleji se od nás vzdalují, tedy že vesmír se rozpíná. Poskytl tak důkaz, že Einsteinova teorie ve Friedmanově nebo Lamaitrově interpretaci je správná. Pokud se vesmír rozpíná, znamená to, že musel mít někdy začátek. Zásadní byla práce amerického fyzika ruského původu George Gamowa publikovaná 1948, která pojednávala o velmi raném žhavém vesmíru. Populárně ji pak vyložil v knize „Pan Tompkins v říši divů“. Teorie je známa jako teorie velkého třesku (big bang), jak ji hanlivě označil její oponent britský astrofyzik Sir Fred Hoyle, aby naznačil, že jde o mnoho povyku pro nic. Sám byl totiž propagátorem alternativní teorie ustáleného vesmíru (steady state universe). Název big bang se přesto ujal. Gamow také předpověděl, že pozůstatkem velkého třesku a počátečního velmi horkého a hustého stavu vesmíru by mělo být záření vesmírného pozadí. Jeho genialitu dokládá skutečnost, že v polovině 60. let bylo toto záření vesmírného pozadí objeveno americkými radioastronomy z Bellových laboratoří Arno Penziasem, a Robertem Wilsonem a bylo označeno jako reliktní záření. Jedná se o mikrovlnné záření o teplotě 2.7 stupňů kelvina a ve vesmíru homogenně rozptýleno. Vesmír, původně nepředstavitelně žhavý a hustý, dnes v rozředěném stavu skomírá kousek nad absolutní nulou. Objev reliktního záření na jedné straně přispěl k přijetí myšlenky velkého třesku, ale na druhé straně existence spojitého záření 4 vědcům znemožňuje dělat jakoukoliv pozorovací astronomii před okamžikem, kdy se reliktní záření oddělilo od látky, asi před 300 000 let po velkém třesku. Před tímto časem reliktní záření silně interagovalo s velmi žhavou látkou a neustále docházelo k rozptylu fotonů na tomto žhavém pozadí. Je vesmír konečný nebo nekonečný? Má vesmír nějaké stáří, nebo je tu věčně? Otázky, které si kladou dnes kosmologové, si kladl člověk odpradávna a odpovídal si na ně v nejrůznějších mytologických či náboženských příbězích. Stále zůstává otázkou zda se vesmír rozpíná parabolicky, hyperbolicky nebo elipticky. Také není jasné zda je otevřený nebo uzavřený. Pokud je otevřený, pak je časová budoucnost vesmíru nekonečná a bude se rozpínat věčně. Naopak, pokud je vesmír uzavřený, po nějaké době se rozpínání zastaví a začne docházet ke smršťování až vše skončí stejně jako to začalo v singularitě. Závěrečné singularitě se také někdy říká velký křach (či velký krach). V tomto případě by však podle výpočtů rozpínání mělo trvat ještě 70 miliard let a smršťování dalších minimálně 85 miliard let. 5 1.2. Představy o vzniku života Vznik živé hmoty z anorganické hmoty popisují pojmy abiogeneze a heterogeneze. Abiogenezí se označuje vznik života z anorganických látek, zatímco heterogeneze z organických látek. Heterogeneze hledá původ života v mrtvé organické hmotě (např. vznik larev z rozkládajícího se masa, žížal z bláta atd.) byla přijímána Newtonem, Descartem bez námitek. Vitalistická filosofie dělila přírodu na živou a neživou a vyloučila myšlenku abiogeneze. Křesťanský názor na vznik života vyloučila myšlenku abiogeneze. Heterogeneze byla opuštěna poté co Francesco Redi dokázal, že se v mase umístěném pod mušelínovým krytem, který zabrání mouchám naklást vajíčka, larvy nikdy nevytvoří. Poslední ránu dostala heterogeneze od L. Pasteura (1864) a dalších, kteří prokázali, že mikroorganismy jsou přítomny v různých organických materiálech. V té době byla publikována práce Darwina, který předložil stejně obtížně vysvětlitelnou představu vzniku života abiogenezí. Důležitou roli zde sehrála redukcionistická teorie odmítající rozdíl mezi anorganickou a organickou světem. Woehler syntetizoval v roce 1828 močovinu, první syntetickou organickou látku. Také bylo ukázáno, že energii lze během reakcí kvantifikovat beze zbytku a tak nezbývá prostor pro žádnou vitalistickou sílu, živá hmota žádnou vitální sílu neobsahuje. Henry Bastian prosazoval myšlenku nepřetržité abiogeneze. Roku 1880 byla teorie klasické abigeneze opuštěna. Až po objevu základní struktury hmoty se teorie abiogeneze znovu objevila v moderní podobě jako moderní teorie chemické evoluce ve spojení se jmény Oparin, Haldane, Urey a Miller. Moderní definice abiogeneze se týká tvorby nejjednodušších forem života z primordiálních chemikálií v prostředí považovaném za podobné tomu, jaké bylo na Zemi v době jejího formování. Definic je zcela odlišná od definice Aristotelovy postulující opakovanou tvorbu složitých organizmů. Rozdíl mezi klasickou a moderní teorií abiogeneze spočívá tedy ve frekvenci vzniku života a složitosti vznikajících organizmů. 1.3. Moderní teorie chemické evoluce, Urey-Millerův experiment Počátkem moderního pojetí chemické evoluční teorie bylo roku 1924 tvrzení Alexandra Ivanoviče Oparina, že složité molekulární struktury a funkce živých soustav se vyvinuly z jednodušších molekul, které existovaly již na prebiotické Zemi. Haldane 1928 věřil, že 6 z priomordiální polévky vzešel život. Podle něj hrálo rozhodující úlohu ultrafialové záření, které působilo na prebiotickou atmosféru a zvyšovalo koncentraci cukrů a aminokyselin v oceánu. Harold Urey vycházel ze zjištění, že atmosféry všech planet sluneční soustavy jsou bohaté na vodík a tedy redukující a tudíž příznivé pro tvorbu organických sloučenin. Navrhoval, že atmosféra Země se stala oxidativní až v průběhu evoluce. Laureát Nobelovy ceny Harold Urey a jeho diplomant Stanley Miller provedli v roce 1953 experiment - tzv. Urey-Millerův experiment – v němž simulovali podmínky redukující atmosféry Země a podařilo se jim tak syntetizovat z anorganických látek aminokyseliny. Modelová atmosféra obsahovala směs plynů metanu, amoniaku, vodíku a vodní páry. Aparatura z varného skla se skládala z malé varné baňky naplněné vodou, komory s wolframovými elektrodami, mezi nimiž docházelo k jiskrovému výboji, chladiče a sifonu s vodou, který sloužil ke shromažďování produktů. Na dávné Zemi sice nebyla vroucí moře, var však zajišťoval cirkulaci plynů. Sifon s vodou a také varná baňka představovaly moře a jezera. Celá aparatura byla nejprve důkladně sterilizována a až poté byl zahájen několikadenní experiment. Miller napsal: “Koncem týdne jsem odebral roztok a po drobné úpravě jsem provedl dvourozměrnou papírovou chromatografii... Tři z detegovaných aminokyselin byly dosti koncentrované ... jsem identifikoval jako glycin, alfa-alanin a beta-alanin.“ Základní prebiotický experiment byl následně proveden dalšími badateli s mnoha obměnami. Ve většině experimentů byla použita v podstatě stejná technika. Byla vytvořena atmosféra rozmanitého složení, v níž byly použity následující plyny: metan, etan, dusík, vodní pára, vodík, oxid uhelnatý, oxid uhličitý a sirovodík. Pokud byl vyloučen kyslík, vznikaly aminokyseliny a jiné organické sloučeniny. V modifikovaných experimentech bylo místo elektrod použita například pícka vytápěná na 900-1100o C (Sidney Fox). Tyto experimenty známé jako syntéza teplem nebo pyrosyntéza měly simulovat situaci, kdy docházelo k uvolňování sopečných plynů ze štěrbin a průduchů ve žhavých vyvřelých horninách. Plyny se nacházely v horké zóně jen zlomek vteřiny, pak byly rychle ochlazeny. V některých modifikacích („no-flow“) se ohřívají na 200-1000o C na 15 minut. Množství tepelné energie produkované v současnosti sopečnou činností je 7 srovnatelné s energií produkovanou blesky. Touto metodou bylo syntetizováno 12 proteinogenních amionokyselin (Harada a Fox 1964), podle jiných autorů jen 3 aminokyseliny. Modifikací je Fischer-Tropschova metoda využívající katalyzátorů na bázi kovu nebo hlíny, která se používá i v průmyslové výrobě uhlovodíků z oxidu uhelnatého a vodíku. Další modifikací Urey-Millerova experimentu používaly např. UV-záření, to je považováno za hlavní zdroj energie na prebiotické Zemi. Další pokusy využívaly tlakové vlny a ukázaly, že jsou velmi účinné při syntéza aminokyselin (glycin, alanin, valin, leucin). Tlakové vlny vznikaly při bouřkách nebo průletech meteoritů. Zdroji energie byly zajisté i kosmické záření, radioaktivita a sluneční vítr. Při výše uvedených prebiotických experimentech bylo získáno 19 ze 20 proteinogenních aminokyselin, všech 5 heterocyklických bází tvořících nukleové kyseliny a hlavní cukry včetně glukózy, ribózy a deoxyribózy. Názor vědecké veřejnosti na dávnou atmosféru se v současné době mění. Nyní je široce přijímána představa o podstatně neutrálnější prebiotické atmosféře složené z CO2, N2, H2O a snad i 1%H2. Je sporné, zda dávná Země a její atmosféra mohly být opravdu oxidující. Pokusy s prebiotickou atmosférou jsou nyní přehodnocovány ve světle těchto představ neutrální a snad dokonce oxidujíc atmosféry. Organické sloučeniny se na Zemi mohly dostat i z meziplanetárního či mezihvězdného prostoru. Bylo zjištěno, že komety a meteority obsahují organické molekuly. V roce 2004 byly detegovány stopy polycyklických aromatických uhlovodíků v mlhovině, což byl objev nejsložitější molekuly nalezené ve vzdáleném vesmíru. 1.4. Další názory na vznik života - Martin a Russel, Wachtershauser, Eigen Nejnovější poznatky, naznačující, že prebiotická atmosféra měla spíše neutrální či mírně oxidativní charakter vedla vědce k formulování nových hypotéz o vzniku života. Zejména došlo k posunu názorů na místo jeho vzniku. Ukazuje se, že kyslík mohl vznikat například fotolýzou vody anebo se uvol´novat z kyslíkatých hornin. Zdálo se tedy méně pravděpodobné, že nejprimitivnější organické molekuly vznikaly přímo na povrchu Země. Nabízela se alternativní představa – vznik života na dně dávných oceánů. Do těchto představ patří představa W. Martina a M. Russela z roku 2002, podle níž život vznikl v prostředí podmořských komínů. Podmořské komíny jsou hydrotermální prameny nacházející se na dně oceánů v hloubkách kolem 2000 metrů. Poprvé byly nalezeny roku 1977 u Galapág. Jedná se o otvory o šířce stovek metrů, z nichž vychází přehřátá voda bohatá na minerály, především pak na sulfidy, která se při styku s vodou oceánu ochlazuje a krystalizuje, což vytváří černé zbarvení, a nakonec se usazuje na dně oceánů. A právě na těchto usazeninách mohlo docházet k prvním reakcím katalyzovaných usazenými minerály, při nichž vznikaly více či méně složité biomolekuly. I dnes se okolí podmořských komínů představuje zvláštní ekosystém, vyznačující se přítomností zajímavých organizmů, např. termofilů. Uvedená představa je vlastně pokračováním teorie Guntera Wachtershausera z roku 1980 označované jako „teorie světa sulfidu železa“. Narozdíl od experimentů Millera, kde zdrojem energie byly vnější (výboje, UV záření), se zde počítá s využitím vnitřní energie sulfidů železa nebo jiných minerálů jako je pyrit. Tato energie je uvolněna redoxními reakcemi a je využita na tvorbu monomerů organických molekul i k jejich polymerizaci. Vznikly tak primitivní metabolické cykly a je možné, že takové systémy se mohou vyvinout do autokatalytických soustav samoreplikujících se a metabolicky aktivních jednotek předcházejících živým formám. Podle Wachtershausera tento časný metabolismus předcházel genetice. Zvláštní postavení přiřadil Wachtershauser kyselině octové, která je i dnes klíčovou 8 molekulou v buňce. V roce 1997 Wachtershauser a Claudie Huberová smíchali CO, H2S, NiS, FeS při 100o C a získali aminokyseliny a dokonce i peptidy. Podle další teorie - teorie „hluboké horké biosféry“, navržené Thomasem Goldem v roce 1990, se první život nevyvinul na povrchu Země, ale několik kilometrů pod zemským povrchem. Je známo, že bakterie se v současné době nacházejí až do hloubky několika kilometrů. Tato skutečnost také nastoluje otázku, zda i na jiných planetách naší sluneční soustavy se nenachází primitivní formy života. Základním problémem teorie vzniku života je otázka polymerizace monomerů tvořených jednoduchými organickými sloučeninami za vzniku složitějších struktur. Hydrolýza polymerů nebo oligomerů je zvýhodněna před kondenzací monomerů do polymerů. Polymerizace není přímočarý proces. Během abiotických experimentů se tvořily také látky fungující jako inhibitory polymerizace jednoduchých organických látek. Důležitá zde je i otázka homochirality. Významný posun v řešení otázky vzniku života představuje teorie hypercyklů Manfreda Eigena z Max Plankova institutu (1970). Aplikuje nerovnovážnou termodynamiku na evoluci biologických systémů. Systémy jsou schopné samostatné replikace, nacházejí se v rovnovážném stavu, sestávají z mnoha informaci uchovávajících jednotek, pravděpodobně již na bázi RNA, které produkují enzymy katalyzující tvorbu jiných jednotek v celé řadě, přičemž poslední jednotka katalyzuje tvorbu jednotky první a tím se cyklus uzavírá. Kaplan spočítal, že cyklus potřebuje 20-40 funkčních bílkovin (po 70-100 aminokyselinách) a podobný počet nukleových kyselin. Zabýval se také frekvencí mutací jednotlivých prvků hypercyklu, jejich selekcí, rychlostí jejich evoluce, objevováním se nových prvků cyklu. Silnou podporou teorie hypercyklů byl objev katalytických schopností RNA – ribozymů. Ve vziku hypercyklů můžeme snad také spatřovat nejprimitivnější živý systém, zde někde se nachází ona mlhavá hranice mezi živou a neživou přírodou, v okamžiku, kdy vzniká určitá sít vztahů jednotlivých replikátorů. 9 Vznik prvních genetických systémů na dně mořském má i své slabiny. Předpokládá se, že prvními replikátory byly molekuly RNA. O nich je však známo, že jsou velmi nestabilní při vysoké teplotě. A právě vysoká teplota panovala na mořském dně v blízkosti podmořských komínů. Proto vědci přišli s alternativní představou, podle níž život mohl vzniknout v mělkých lagunách a nádržkách na povrchu Země. Tam se mohly organické molekuly navíc zakoncentrovávat buď opakovaným zmražováním anebo odpařováním vody ze stále přitékajících živného roztoku. Do těchto lagun pak mohly z kosmického prostoru dopadat mnohé organické látky přinesené meteority. Dnes dopadá na Zemi 150 tun organického (!) materiálu denně. Předpokládá se, že v dřívějších dobách byla Země bombardována meteority mnohem intezivněji než dnes. Něktří badatelé jdou ještě dále. Tvrdí, že meteority mohly přinést dokonce již hotové živé organizmy. Tak se dostáváme k hypotéze panspermie. 1.5. Panspermie Podle koncepce panspermie (viz www.panspermia.com) existuje život ve vesmíru odpradávna, jeho zárodky jsou všudypřítomné, přenáší z místa na místo. Takto byl život kdysi přenesen i na Zemi, např. v podobě mikrobů, kde se uchytil a dále vyvíjel. Tato hypotéza však problém vzniku života neřeší, pouze jej přesouvá jinam. Tímto se ale rozšířil časový interval pro vznik života i rozpětí možných podmínek prostředí. Poprvé lze najít myšlenku panspermie v díle řeckého filosofa Anaxagora, v moderním pojetí se jí zabývá poprvé Hermann von Helmholz (1879), Arrhenius (1903), dále ji pak prosazovali Sir Fred Hoyle a Chandra Wickramasinghe (1915-2001). Slavný objevitel struktury DNA Francis Crick vystoupil s představou, že inteligentní bytosti z jiné planety mohly vyslat před 4 miliardami let k Zemi vesmírnou loď plnou mikrobů. Tato představa není příliš fantastická, vždyť i dnes vědci uvažují o kolonizaci jiných planet. V této souvislosti je zajímavé, že v kometách byly nalezeny organické látky. Byl prokázán meziplanetární přenos materiálu, konkrétně když na Zemi dopadl meteorit pocházející z Marsu. Mimoto existují mikroorganismy extrémně odolné vůči záření. Zajímavý je objev ohromného množství organických látek – aromatických polycyklických uhlovodíků - ve vesmíru, především v okolí mrtvých hvězd. Bylo také objeveno velké množství glycinu, 10 jednoduché aminokyseliny, v mezihvězdném prachu. Pozoruhodné je i to, že aromatické polycyklické uhlovodíky obsahují také dusík, podobně jako nukleové kyseliny. Toto značné množství organických látek jako stavebních kamenů života ve vesmírů zvýšilo pravděpodobnost vzniku života. 1.6. Extremofilové Vznik života v extrémních podmínkách podmořských sopek jakož i přenos živých organizmů z vesmíru je podporován existencí různých druhů mikroorganizmů označovaných jako extremofilové. Jedná se zejména o bakterie značně odolné vůči radioaktivnímu záření jako je Deinococcus radiodurans, žijící dokonce v jaderných reaktorech. Tato bakterie vykazuje 37% životaschopnost při dávce 10 000Gray, zatímco člověk umírá při dávce 10Gray a E. coli 60 Gray. Kuriózní je příklad bakterie Streptococcus mitis, která byla zavlečena na Měsíc roku 1967 lodi Surveyor3 a po 31 měsících na povrchu Měsíce byla lodí Appolo12 dopravena jako živá zpět na Zemi. Bakterie žijí i několik kilometrů pod ledovým pokryvem v Antarktidě, prostředí velmi podobné tomu, které se nachází v ledových kometách. Život v podobě bakterií i jiných organizmů byl objeven i v okolí podmořských sopek, kde teploty překračují 100o C a kde je vysoký tlak v hloubkách kolem 10km. Dalšími příklady extremofilů jsou bakterie žijící uvnitř skal (endolithové), v kyselém nebo naopak zásaditém pH (acidofilové resp. alkalifilové), ve vysoké koncentraci solí (halofilové), bez kyslíku (anaerobové), v prostředí těžkých kovů jako je měď, kadmium, arsen či zinek (metalotolerantní bakterie), žijící v prostředí vysokého tlaku (piezofilové či barofilové). 1.7. Život na bázi jiných prvků a rozpouštědel Existující život je založen na sloučeninách obsahujících uhlík a na vodě jako na rozpouštědle. Spekuluje se však i o možnosti, že život někde jinde by mohl být založen na jiném prvku, nejčastěji se uvažuje o křemíku, a na jiných rozpouštědlech. První, kdo spekuloval o křemíku jako o alternativním prvku, na němž by mohl stát život, byl již Julius Schneider 1891. Jeho myšlenku rozšířil Emerson Reynolds roku 1893, který dával do souvislosti především značnou tepelnou stabilitu křemíku se schopností organizmů na bázi křemíku žít při vysokých teplotách (termofilové). Křemík je ve vesmíru běžným prvkem. V periodické tabulce leží hned pod uhlíkem a má dost podobnou chemii, např. podobně jako uhlík váže čtyři vodíky za vzniku silanu SiH4, tvoří také dlouhé polymery, silikony, v nichž se střídá křemík s kyslíkem podobně jako uhlík s kyslíkem tvoří polyacetaly. Křemík má však i řadu nevýhod oproti uhlíku. Je větší a proto hůře tvoří dvojné a trojné vazby, dlouhé řetězce tvořené křemíkem jsou méně stabilní oproti stabilitě dlouhých uhlovodíků. Silany jsou velmi reaktivní s vodou a proto se dlouhé řetězce snadno rozkládají. Počet uhlíkatých látek objevených ve vesmíru byl zhruba desetkrát vyšší než počet křemíkových látek a je podobný poměru čistého uhlíku oproti křemíku (10:1). Dalšími prvky, o kterých se uvažuje, je fosfor. Ten je schopen podobně jako uhlík tvořit dlouhé polymery, je však dost reaktivní, mnohem stabilnější je v kombinaci s dusíkem. Vazby P-N mohou vytvářet nejrůznější sloučeniny včetně cyklických. Síra může rovněž tvořit dlouhé molekuly, je zde však rovněž problém s vysokou reaktivitou podobně jako u křemičitanů a fosforu. Některé bakterie využívají síru místo kyslíku. Rovněž o chlóru se uvažuje jako o biologické alternativě kyslíku. Výhodou vody jako rozpouštědla je mimo jiné značná rozsah teplot, při nichž je v kapalném stavu a velké množství látek, které se ve vodě rozpouštějí. Existují však i další látky s podobnými vlastnostmi. Nejčastěji se v této souvislosti mluví i čpavku, rozpouští se v něm většina organických látek podobně jako ve vodě a navíc také některé kovy. Je však kapalný při teplotách minus 79o C až minus 33o C při normálním atmosférickém tlaku. Pokud však tlak vzroste např. na 60 atmosfér, taje čpavek při minus 77o C a vře až při 98o C. 11 Podmínky, při nichž je čpavek kapalný, panují například na jupiterově měsíci Titanu, hluboko pod jeho povrchem. 1.8. Vznik prvních živých systémů První živé systémy se vyznačovaly schopností replikace, proměnlivostí a dědičností. Cesta od jednoduchých organických komponent po systémy vykazující výše uvedené atributy života mohla být značně složitá a i dnes je pouze předmětem spekulací. Zatímco dnešní živé organizmy jsou založeny na principu koexistence nukleových kyselin a proteinů, panují spory o to, jaký charakter mely první živé systémy, zda byly na bázi nukleových kyselin, proteinů nebo zda od počátku docházelo k jejich koexistenci, anebo byl použit zcela odlišný princip. 1.8.1. Původní živé systémy byly na bázi proteinů Jedná se o historicky starší skupinu názorů, jejímž nejstarším representantem byl A.I. Oparin se svou teorií koacervátů (1928). Novějšími zastánci byli Fox s teorií mikrosfér, Wachtershauser s teorií sulfidů železa (1980) a Christian de Duve s chemií thioesterů (1990). Tyto systémy vykazují růst (koacerváty) a metabolismus (zejména mikrosféry), nejsou však schopny reprodukce a dědičnosti. Takto primitivní metabolismus mohl představovat prostředí pro pozdější zavedení RNA a její replikaci. Koacerváty jsou primitivními modely buňky ohraničené semipermeabilní membránou, která umožňuje hromadění produktu nějaké reakce, růst a následné dělení koacervátu. Struktury typu koacervátů mohou vznikat v koloidních roztocích. Problémem je vznik a fixace enzymaticky aktivních molekul uvnitř koacervátu, které se dělením koacervátů ředí. Hypotéza mikrosfér se snaží zodpovědět otázku původu enzymatických molekul. Mikrosféry vznikají z tzv. protenoidů, což jsou polymery vzniklé kondenzací aminokyselin. Pořadí aminokyselin v těchto polymerech je ale náhodné. Některé z nich však mohou vykazovat určitou katalytickou funkci. 1.8.2. Původní živé systémy byly na bázi nukleových kyselin (genová hypotéza vzniku života) Podle této hypotézy byly původními strukturami, které vykazovaly znaky živých soustav, nukleové kyseliny nebo látky jim podobné. Nukleové kyseliny nenesly ještě žádnou informaci ani neměly metabolickou aktivitu, byly však schopny autoreplikace. Tato hypotéza, která má v současnosti nejvíce zastánců, předpokládá, že původním polymerem byla RNA, proto se také hovoří o hypotéza RNA světa (Gilbert 1986). Tuto hypotézu velmi podpořil objev katalyticky aktivních molekul RNA – ribozymů (Orgel 1986), za jejichž objev dostali Tom Cech a Sidney Altman 1989 Nobelovu cenu. Postupně se ukázalo, že ribozymy jsou schopny se replikovat, prodlužovat i spojovat jiné molekuly RNA nebo provádět syntézu peptidů. Molekuly RNA tedy mohou jak uchovávat tak i realizovat genetickou informaci. Až v průběhu evoluce převzala funkci média pro uchování genetické informace molekula DNA, která je pro tuto funkci podstatně vhodnější. Úlohu realizátora genetické informace převzaly od ribozymů proteiny, vyznačující se vyšší katalytickou flexibilitou, účinností, přesností i šíří spektra katalyzovaných reakcí. Ribozymem je vlastně i ribozóm. Je pozoruhodné, že i klíčová reakce tvorby proteinů, tvorba peptidické vazby, spojující jednotlivé aminokyseliny, je uskutečňována molekulou RNA, tedy ribozymem. Ribozymy jsou považovány za pravděpodobné relikty z období, kdy nukleové kyseliny zajišťovaly jak uchování tak i realizaci genetické informace, relikty ze světa bez proteinů. Podobnými relikty jsou zřejmě i koenzymy, neproteinové komponenty dnešních proteinů, často odvozené z nukleotidů. Jsou klíčové pro určení substrátové specificity, což bylo kritické právě v počátečních stádiích evoluce. Molekuly RNA dodnes hrají centrální 12 úlohu ve všech hlavních stupních realizace genetické informace. Molekuly mRNA nesou přepis genetické informace z místa jejího uložení v jádře do místa syntézy proteinů v ribozómech. Samotné ribozómy jsou tvořeny vedle proteinů i několika typy molekul RNA, tzv. rRNA (ribozomální RNA). Aminokyseliny jsou dopravovány na povrch ribozómů, kde probíhá syntéza proteinů, prostřednictvím molekul tRNA. 1.8.2.1. Ribozymy Introny I. typu byly poprvé objeveny v pre-rRNA u prvoka Tetrahymena. Nacházejí se v genech pro rRNA, tRNA i v pre-mRNA. Byly nalezeny u mitochodriích hub, chloroplastech řas a také u bakteriofágů. Při jejich sestřihu dochází ke dvoukrokové transesterifikaci, První je indukována ne nukleotidem ležícím uvnitř intronu, ale volným nukleosidem nebo nukleotidem jako iniciačním nukleofilem, guanosinem nebo guanosin-mono, di- nebo trifosfátem. Druhá transesterifikace je indukována 3-OH skupinou ležící na konci exonu. Uvolněný exon je lineární, ale mnohé v průběhu degradace podléhají dalším transesterifikacím vedoucím k cirkulárním produktům. Introny I. typu vytvářejí výrazné sekundární a terciární struktury. Pomocí rentgenové difrakce byla zjištěna přítomnost katalytického jádra tvořeného dvěma doménami. Někdy je stabilita intronů zvýšena nekatalytickými proteinovými faktory, které se na introny váží. Introny I. typu obsahují ORF kódující enzym maturázu účastnící se sestřihu a tzv. „homing endonukleázu“ důležitou pro mobilitu. Kromě toho se sestřihu účastní proteiny kódované hostitelem. Introny II. typu se nacházejí v genech pro rRNA, tRNA i v pre-mRNA v genomech organel hub, rostlin a prvoků v mRNA bakterií. Sestřih rovněž zahrnuje dvoukrokovou transesterifikaci, avšak iniciačním nukleofilem je adenosin. Introny kódují enzymy potřebné pro sestřih a mobilitu – RNA maturázu, reverzní transkriptázu, endonukleázu, a také se využívá enzymatický aparát hostitele. Existují dvě podskupiny, typ IIA a IIB, lišící se konsensním místem sestřihu, vzdáleností adeninu od místa sestřihu, určitými terciárními interakcemi a fylogenezí otevřených čtecích rámců. 13 Introny III. typu jsou velmi krátké introny podobné intronům II. typu, vyskytují se v premRNA plastidů krásnooček. Někdy se vyskytují jako tzv. „twintrony“ – introny uvnitř jiných intronů. Ribozymy „hammerhead“ a „hairpin“. Ribozymy typu „hammerhead“ jsou malé katalytické RNA, schopné samy se štěpit. Jedná se o nejmenší známou formu katalytické RNA. Dostaly jméno díky kladivovitému tvaru sekundární struktury, kterou vytváří. Jsou totiž tvořeny třemi vlásenkami. Účastní se replikace RNA viroidů a satelitů. Tento typ ribozymu lze připravit in vitro tak, že se nasyntetizují dva řetězce, spojí se dohromady a poté lze pozorovat samoštěpící reakci. Ten řetězec, který je štěpen je považován za substrát, štěpící řetězec je enzymem. Od ribozymů „hammerhead“ jsou odvozeny malé vlásenkové („hairpin“) ribozymy, které jsou schopny se navázat na cílovou molekulu RNA na bázi komplementarity bází a štěpit ji. Byly připraveny syntetické ribozymy tohoto typu a použity k cílenému štěpení virových molekul RNA, např. HIV-1. 1.9. Koevoluce nukleových kyselin a proteinů, genetický kód Podle této hypotézy probíhala evoluce nukleových kyselin a proteinů již od počátku společně. Klíčovou roli v životních procesech má proteosyntéza založená na existenci genetického kódu. Genetickým kódem rozumíme soubor pravidel, podle nichž se určitému pořadí nukleotidů v DNA určuje pořadí aminokyselin v proteinech. 1.9.1. Degenerace kódu a odchylky od standardního kódu Jak může být jazyk čtyř písmen, jazyk DNA, přeložen do jazyka 20 slov, řeči proteinů? Již zmiňovaný fyzik George Gamow ještě dávno před objevem genetického kódu konstatoval, že dinukleotidový kód by nestačil (kódoval by pouze 42 = 16 aminokyselin), a navrhl tudíž kód tripletový. Jeho předpověď byla správná. Vzhledem k tomu, že každý kodon je vždy tvořen tripletem bází a bází jsou čtyři druhy, kodonů je celkem 64 (=43 ). Z toho 3 kodony nekódují aminokyselinu, nýbrž určují ukončení tvorby proteinu. Označují se jako terminační kodony nebo jako stop-kodony. Na druhé straně, aminokyselin kódovaných zbývajícími 61 kodony je pouze 20. Je tedy zřejmé, že některé aminokyseliny jsou kódovány více kodony. V tom spočívá tzv. degenerace genetického kódu. Např. leucin, arginin a serin jsou kódovány každý 14 dokonce šesti kodony. Dvě aminokyseliny jsou určovány pouze jediným kodonem, jedna z nich, methionin, označuje začátek transkripce. Kodony pro stejnou aminokyselinu se liší zpravidla ve třetí pozici kodonového tripletu. Proto mnoho mutací nevede k záměně aminokyseliny, jedná se o tzv. synonymní mutace. Vědci byli fascinováni skutečností, že tentýž kód používají viry, bakterie i člověk. Hovořilo se proto zpočátku o „univerzálním“ kódu, svědčícím o jednotném organizačním principu všeho živého, v souladu s Darwinistickými představami vývoje života od jednodušších forem ke složitějším. Velkým překvapením bylo zjištění, že v buněčných organelách mitochondriích je používán kód vyznačující se odchylkami od „univerzálního“ kódu. Mitochondrie byly původně volně žijící bakterie, než se v průběhu evoluce staly součástí eukaryontních buněk. Z oněch dob si však uchovaly část původní genetické informace. Postupně byly nalezeny různé odchylky od genetického kódu u některých bičíkovců, kvasinek, bakterií i archebakterií. Ukázalo se tedy, že kód není zcela univerzální a nyní se proto označuje jako kód „standardní“. Pád představy neměnnosti kódu oslabilo také představu, že kód vznikl jednou provždy a poté se již dále nevyvíjel. 1.9.2. Vznik genetického kódu – najednou nebo postupně? Přestože genetický kód byl rozluštěn již před čtyřmi desetiletími, stále zůstává záhadou obklopenou řadou otázek. Vznikl genetický kód najednou anebo se postupně vyvíjel? Bylo na počátku všech současných 20 aminokyselin z nichž se dnes sestavují proteiny, anebo si první proteiny vystačily s menším počtem tehdy dostupných aminokyselin? Na jednom konci stojí hypotéza označovaná jako „frozen accident“ (zmražená náhoda), předpokládající, že kód vznikl jednou a náhodně a již se dále neměnil, neboť jakékoliv odchylky od něj by způsobily mutace v proteinech, které by byly pro stávající organizmus letální. Vzhledem k tomu, že existují i alternativní genetické kódy, muselo by těchto okamžiků „zamrznutí“ kódu být více, což se zdá málo pravděpodobné. V současnosti převažuje názor, že genetický kód se postupně vyvíjel. Představa evoluce genetického kódu je podporována řadou důkazů. Analýzy ukázaly, že kód je vytvořen tak, že minimalizuje dopad chyb. To znamená, že v mnoha případech záměna nukleotidu v kodonu nevede k záměně aminokyseliny. Takové optimální nastavení kódu lze vysvětlit tak, že kód prošel postupnou selekcí. Dále bylo zjištěno, že aminokyseliny syntetizované stejnými biochemickými dráhami jsou kódovány podobnými kodony. Zde se 15 nabízí představa, že časný kód byl jednodušší (dinukleotidový) a kódoval méně aminokyselin, a až postupně, jak v tehdejších podmínkách vznikaly další aminokyseliny, kód expandoval a přiřazoval podobným aminokyselinám podobné kodony. Podle některých představ původní kód obsahoval pouze báze G a C. Původní velikost kódu i počty a typy aminokyselin (viz níže), stejně jako doba a průběh evoluce kódu jsou stále záhadou. 1.9.3. Selekce in vitro a aptamery Snad nejvýznamnější podporu evoluce genetického kódu poskytly experimenty „selekce in vitro“. Při těchto pokusech se smíchají molekuly syntetických RNA nebo DNA s různými jinými molekulami a opakovaně se vybírají látky s nejsilnější vzájemnou vazbou. Tyto krátké molekuly nukleových kyselin se specifickou afinitou k určitým molekulám se označují jako aptamery. V experimentech selekce in vitro se podařilo získat aptamery RNA, které se vázaly např. na aminokyselinu arginin. Nejpozoruhodnější bylo zjištění, že vazebná místa pro arginin obsahovala opakující se triplety argininových kodonů. Aminokyseliny tedy mohou přímo fyzicky interagovat se svými kodony. Zdá se, že přímé interakce kodonů a aminokyselin hrály roli při formování prvního kódu. Složitý translační mechanizmus zahrnující tRNA je zřejmě až pozdějším výdobytkem. Aminokyseliny se vázaly i na DNA aptamery, což dokazuje, že rozhodující jsou báze a ne cukrfosfátová páteř. To vedlo některé badatele k myšlence, že páteř mohla být v původních informačních molekulách tvořena peptidy místo fosfátů. Tyto molekuly se označují jako PNA. Mimochodem, uvedenými selekčními experimenty se podařilo připravit i enzymaticky aktivní molekuly DNA, tzv. DNAzymy. Pokusme se zrekonstruovat vznik a vývoj genetického kódu. Na počátku, ještě ve světě RNA, byly první peptidy zřejmě tvořeny přímou vazbou aminokyselin na templátovou RNA bez potřeby enzymatické katalýzy. Pořadí aminokyselin v těchto peptidech bylo převážně náhodné a o jejich úspěšnosti rozhodovalo to, jak obstojí v přírodním výběru. Fáze této nekódované syntézy peptidů byla později nahrazena kódovanou syntézou. První kód byl zřejmě dinukleotidový a kódoval menší počet aminokyselin než dnešní tripletový kód. Postupně došlo ke zvýšení počtu aminokyselin na bázi jejich metabolické (biochemické) příbuznosti a kód se změnil na tripletový. 1.9.4. Na scénu přichází transferová RNA Zřejmě již ve fázi dinukleotidového kódu přicházejí na scénu molekuly tRNA a enzymy aminoacyl-tRNA-syntetázy (aaRs) a do systému vstupuje mRNA. Aminoacyl-tRNAsyntetázy připojují aminokyseliny k jednotlivým tRNA. Patří k nejstarším proteinům na Zemi. Jejich funkci předtím zřejmě plnily ribozymy. Začleněním tRNA do translačního aparátu byly odstraněny přímé interakce aminokyselin s kodony a byl umožněn určitý stupeň optimalizace přiřazování kodonů. Zajímavou vlastností molekul tRNA je jejich schopnost vytvářet složité sekundární a terciární struktury, jedná se o známý tvar jetelového listu. Na jeden konec tRNA se váže aminokyselina. Na druhém konci, vzdáleném 7,6nm, se prostřednictvím tří nukleotidů tvořících antikodon tRNA váže na komplementární trojici nukleotidů (kodon) molekuly mRNA, která představuje přepis genu. Molekuly tRNA nesoucí jednotlivé aminokyseliny se řadí vedle sebe podle pořadí kodonů v mRNA a aminokyseliny se spojují za tvorby proteinu. Každému kodonu odpovídá jedna tRNA (obsahující specifický antikodon), přičemž některé tRNA nesou stejnou aminokyselinu. Konec tRNA, na který se váží aminokyseliny je vždy zakončen bázemi CCA. U některých bakteriálních nebo rostlinných virů (bakteriofág Qβ, virus CaMV), jejichž genetická informace je uložena v molekulách RNA vznikají struktury podobné dnešním molekulám tRNA, které hrají klíčovou roli v replikaci. Zdá se, že tyto struktury dříve hrály 16 důležitou roli v nejzákladnějším procesu živých systémů, jímž je replikace, jako specifická značka určující, kde má replikace začít. Až postupně převzaly úlohu v proteosyntéze. Předkové tRNA tak možná představovali jedny z nejstarších biomakromolekul. 1.9.5. Nejstarší aminokyseliny a evoluce kodonů Existují různé názory na to, které kodonové triplety a které aminokyseliny jsou nejstarší. K nejznámějším badatelům v této oblasti patří nositel Nobelovy ceny Manfred Eigen, jakož i japonský vědec Susumu Ohno, autor teorie evoluce genovou duplikací. Zde se zaměříme na pozoruhodné objevy Edwarda Trifonova z Izraele, podle jehož představ na počátku existovaly triplety GCX, GXU a XCU (X je libovolná báze). Tyto kodony byly odvozeny vždy jedinou mutací od konvenční sekvence GCU. V této souvislosti je zajímavé, že ke spontánní expanzi trinukleotidových repeticí DNA, jež stojí v pozadí některých nemocí, dochází právě v sekvencích (GCT)n a (GCC)n. Při pohledu do tabulky současného genetického kódu zjistíme, že tyto nejstarší kodony kódují aminokyseliny alanin, kyselinu asparagovou, glycin, prolin, serin, threonin a valin. Znamená to tedy, že zde máme kandidáty na první aminokyseliny? Snad ano, neboť uvedené aminokyseliny jsou jak chemicky nejjednodušší, tak byly syntetizovány ve známém experimentu Ureyho a Millera (viz výše). To by však znamenalo, že přiřazení kodonů aminokyselinám se od počátku nezměnilo. Předpoklad, že některé aminokyseliny jsou starší než jiné, vedl vědce k nápadu srovnat jejich zastoupení v evolučně starých a mladých proteinech. Ukázalo se, že staré proteiny obsahují více časných aminokyselin než proteiny mladší. Tzv. „glycinové hodiny“ založené na měření obsahu glycinu v proteinech umožňují podle Edwarda Trifonova dokonce datovat evoluční události. Trifonov se pokusil na bázi chronologie aminokyselin rekonstruovat i pořadí, v němž se objevovaly v průběhu evoluce jednotlivé kodony. Všiml si, že kodony pro nejstarší aminokyseliny alanin a valin (GGC a GCC) se mohou vzájemně párovat na principu komplementarity, a co víc, tento pár kodonů je termodynamicky nejstabilnější ze všech možných párů. Triplety dalších aminokyselin – valinu (GAC) a kyseliny asparagové (GUC) jsou opět komplementární. Tak se lze dopracovat až k nejmladším aminokyselinám, přičemž nové kodony se objevovaly vždy v komplementárních párech. To mimo jiné svědčí o tom, že první proteiny byly zřejmě kódovány současně oběma komplementárními vlákny replikující se nukleové kyseliny. 1.10. První živé systémy byly založeny na jiném principu Kromě uvedených představ o vzniku života existují i alternativní hypotézy. Podle nejznámější z nich, kterou vyslovil na počátku 80. let Cairns-Smith (1982), byly médiem pro uchování genetické informace látky typu jílů. Jíly totiž vytvářejí krystaly, které jsou schopny produkovat kopie sebe sama a navíc mutovat (generovat drobné poruchy struktury). Různé formy jsou pak různě úspěšné v daném prostředí (nabalují na sebe další vrstvy, vysychají či se rozdrobují na menší částice, které infikují další lokality) a může docházet k obdobě přírodního výběru. Spekuluje se o tom, že život založený na jílech mohl předcházet současnému životu na bázi uhlíku nebo alespoň fungovat jako matrice a katalyzátor reakcí vedoucích k dnešním formám života. Je však obtížné si představit, jak mohlo dojít k přechodu od systémů uchovávání genetické informace anorganickými látkami typu jílů ke genetickým systémům na bázi nukleových kyselin. 1.11. Převzetí role média pro uchování genetické informace molekulami DNA Jak bylo uvedeno výše, nejrannější formy života zřejmě obsahovaly samoreplikující se genomy tvořené molekulami RNA. Jejich vznik se datuje do období před 4 miliardami let. RNA je schopna vlastní replikace bez přítomnosti enzymů, dokáže sebe sama modifikovat, tj. vystřihovat ze sebe určité části a rozdělená vlákna opět spojovat, a dokonce syntetizovat 17 peptidové vazby. Klíčovým evolučním procesem bylo zřejmě převzetí genetických funkcí molekulou DNA, přičemž klíčovou roli hrál proces reverzní transkripce. Tento starobylý proces se významně podílí na tvarování velikostí a struktury genomů dodnes. Dokladem toho je i existence retroelementů, mobilních genetických entit používajících reverzní transkripci ke své reprodukci (viz kapitoly o evoluci genomů a mobilních elementech). O tom, že jsou relikty dávného světa RNA, které zřejmě stály u zrodu života, svědčí jak jejich konzervativní struktura a replikační cyklus, tak jejich všudypřítomnost. Zajímavý je i fakt, že tymin (báze v DNA) se biochemicky syntetizuje z uracilu (báze RNA). Současně s převzetím genetických funkcí molekulou DNA došlo k oddělení katalytických funkcí, které převzaly proteiny. Molekula DNA je chemicky stabilnější než RNA, i dnešní molekuly DNA jsou delší než RNA. Skupina ribózy je velmi reaktivní, což je v souladu s původním fungováním RNA jako enzymu, je však nežádoucí u media uchovávajícího informaci. Důležitá je i vyšší flexibilita DNA oproti rigidním molekulám RNA. Důsledkem toho je fakt, že DNA může nabývat v závislosti na vnějším prostředí (hydratace, ionty, pH) různých prostorových struktur, které mohou mít funkční relevanci. Zásadní vlastností je však schopnost DNA se replikovat, což umožňuje komplementarita bází této dvouřetězcové molekuly. Rigidita původních ribozymů byla také zřejmě příčinou toho, že katalytickou funkci převzaly mnohem flexibilnější proteiny, což zásadně rozšířilo spektrum biochemických reakcí. 18 Kapitola II.: RELIKTY SVĚTA RNA 2.1. Důkazy světa RNA 2.2. Vznik světa RNA 2.3. Evoluční osud prvních RNA katalyzátorů 2.4. tRNA - od replikace k proteosyntéze 2.5. Ribozóm 2.6. Sestřih, snRNA, snoRNA 2.7. Maturace tRNA a RNázaP 2.8. Signální rozpoznávací částice a srpRNA 2.9. Editace RNA a řídící RNA (gRNA) 2.10. Telomeráza a telomerická RNA 2.11. Vault RNA (vRNA) 2.12. tmRNA u prokaryot 2.13. Malé nekódující RNA a RNA interference – miRNA, siRNA, smRNA aj. 2.14. První RNA organizmus: Riborgis Eigensis 2.15. Dnešní viry a viroidy – nejpodobnější časným replikonům 2.16. Jsou starobylejší prokaryota nebo eukaryota? Dnes je všeobecně přijímáno, že současným živým systémům, jejichž genetická informace je na bázi molekul DNA, předcházely replikony na bázi RNA, replikony nezávislé na proteinech. V určité fázi evoluce pak vznikl genetický kód a proteosyntéza. RNA molekuly se postupně vyvinuly v centrálního hráče i v pozdějším světě, kde katalytickou roli měly proteiny. Tato fáze evoluce se označuje jako svět RNA (Gilbert 1986). Starobyle formy života na bázi molekul RNA postupně vymizely. Avšak některé ústřední funkce v moderních buňkách jsou katalyzovány molekulami RNA nebo alespoň koenzymy s ribonukleotidovými kofaktory. Tyto funkční RNA nebo nukleotidy možná představují molekulární relikty nebo fosilie předbuněčných předků. Možnou výjimkou jsou dnešní RNA viry a viroidy. Jejich původ není jasný. Buď jsou to pouze deriváty moderního světa DNA, a jejich mechanizmy se vyvinuly v důsledku jejich parazitického života, anebo lze původ virů hledat ve RNA světě a jsou jeho funkčními relikty. Přinejmenším mohou složit jako funkční modely světa RNA. 2.1. Důkazy světa RNA Hlavními skutečnostmi, které podporují hypotézu existence světa RNA je (i) centrální role nejrůznějších molekul RNA v dnešních živých systémech a (ii) přítomnost různých retroelementů (genetických elementů šířících se prostřednictvím molekul RNA) v moderních genomech. Molekuly RNA dodnes hrají nezastupitelnou roli ve všech hlavních stupních realizace genetické informace. Molekuly mRNA nesou přepis genetické informace z místa jejího uložení v jádře do místa syntézy proteinů v ribozómech. Samotné ribozómy jsou tvořeny vedle proteinů i několika typy molekul RNA, tzv. rRNA. Aminokyseliny jsou dopravovány na povrch ribozómů, kde probíhá syntéza proteinů, prostřednictvím molekul tRNA. Je pozoruhodné, že i klíčová reakce tvorby proteinů, tvorba peptidické vazby, spojující jednotlivé aminokyseliny, je uskutečňována molekulou 23S rRNA, tedy ribozymem. Jak je vidět proteiny mohou být syntetizovány jedině podle RNA templátů a to jedině za účasti dalších klíčových molekul RNA. Zrání tRNA i rRNA i sestřihu pre-mRNA se účastní další molekuly RNA, v případě tRNA je to RNáza P, jejíž katalytickou jednotkou je ribozym, v případě zrání rRNA jsou to malé jadérkové RNA (snoRNA) a při sestřihu pre-mRNA (neboli hnRNA) jsou to malé jaderné RNA (snRNA). Dalším důkazem pro existenci světa RNA jsou různé retroelementy (viz kapitola V. – Dynamika genomů) vyznačující se starobylým mechanizmem reprodukce, jehož součástí jsou molekuly RNA, a také svou všudypřítomností v genomech eukaryot i prokaryot. Mezi retroelementy se také někdy 19 zahrnují RNA viry replikující se mechanizmem reverzní transkripce. O pohledu na ně jako na funkční relikty anebo alespoň funkční modely světa RNA jsme mluvili výše. 2.2. Vznik světa RNA Podmínkou vzniku světa RNA byla existence potřebných prekurzorů, z nichž spontánním sestavováním vznikaly první RNA polymery. První fáze nebyly katalyzovány enzymaticky a zahrnovaly syntézu dostatečných množství ribózy, purinových a pyrimidinových bází, z nichž byly dále neezymaticky syntetizovány ribonukleotidy. Syntéza purinů mohla probíhat jednoduchými prebiotickými reakcemi vycházejícími z kyanovodíku a zřejmě zahrnovala také formamid. Pyrimidinové báze mohly vznikat z kyanoacetylénu nebo z kyanoacetaldehydu a močoviny (nebo ještě dříve z metanu a molekulárního dusíku). Protože výtěžky těchto reakcí jsou velmi nízké, je možná, že probíhaly v prostředí, kde se roztoky mohly být zahušťovány opakovaným vymražováním, anebo naopak v prostředích velmi horkém a o vysoké energii, např. v hydrotermálních pramenech. Ribóza může vznikat tzv. formózovou reakcí z formaldehydu. Při této reakci vzniká proměnlivá směs různých pentóz a hexóz. Obohacení o ribózu je problematické i vzhledem k její nízké stabilitě, situaci zčásti řeší katalýza za přítomnosti olova a stabilizace zprostředkovaná borátem vápenatým. Purinové a pyrimidinové báze musí být kovalentně vázány v beta orientaci s uhlíkem 1 ribózy. Tím vznikají nukleosidy. Fosforylací nukleozidů vznikají nukleotidy. Rozpustné fosfáty nebyly moc hojně dostupné v prebiotickém světě. K fosforylaci dochází ve zředěném roztoku fosforečnanu vápenatého (CaP, hydroxylapatit) v přítomnosti močoviny a při zahřátí. Jako fosforylační činidla mohou fungovat i polyfosforečnany vznikající při vulkanické činnosti. Prebiotická syntéza nukleotidů vzniká racemická směs různých nukleotidů,které jsou jak alfa a beta, tak i v D a L izoformách. Spontánní polymerizace je pomalá a vede ke tvorbě různých vazeb. Schopné prodlužovat se a replikovat se mají jen ty, které vznikly vazbou 5-3 fosfodiesterovou vazbou mezi beta-D-nukleotidy. Účinnost polymerizace může být zvýšena přítomností iontů kovů nebo zmražováním. Protože tvorba nukleotidů a jejich polymerů z molekulárních prekurzorů (HCN, NH3, CH2O, CH4, PO4 3, H2O) zahrnuje mnoho málo pravděpodobných kroků, existují názory, že molekulám RNA předcházely jednodušší polymery. Navíc molekuly RNA mají již poměrně složitou strukturu a jsou také značně nestabilní, zejména při vyšších teplotách, které panovaly v místech potenciálního vzniku života – v blízkosti podmořských komínů na dně oceánů (viz výše). Nejčastěji se mluví o peptidových nukleových kyselinách (PNA), threosových nukleových kyselinách (TNA) a nukleových kyselinách odvozených od glycerolu a 20 pyranosylu. V této souvislosti se také hovoří o již zmíněných anorganických látkách, jílových minerálech (Cairns-Smith 1982). Dalším kandidátem na pre-RNA svět jsou polycyklické aromatické uhlovodíky (PAH world – polycyclic aromatic hydrocarbonates). O nich se ukázalo, že mají schopnost se na sebe vrstvit a současně vázat na své okraje purinové a pyrimidinové báze, což mohlo dát vznik polymeru nesoucím genetickou informaci. 2.3. Evoluční osud prvních RNA katalyzátorů Experimenty in vitro i in vivo ukázaly, že pradávné molekuly RNA byly schopny katalyzovat celou řadu různých reakcí jako je polymerizace RNA, aktivace aminokyselin, aminoacylace tRNA, štěpení a ligace molekul RNA, tvorba C-C vazeb, tvorba peptidové i glykosidické vazby. Po nástupu nových katalyzátorů v podobě proteinů čekal RNA katalyzátory nový osud. Většina z nich vymizela (i). Některé se adaptovaly na novou situaci tak, že získaly nové funkce (ii) a jiné si zachovaly svoji konzervativní roli (iii). Příkladem získání nové funkce ve světě proteinů jsou ribozómy a tRNA, které se obojí staly součástí translačního aparátu (viz níže fág Qbeta, kapitola 2.4.). Naopak vysoce zakonzervovanými molekulami RNA jsou malé jaderné RNA (snRNA) a jimi katalyzovaný procesing rRNA, dále procesing tRNA molekulou RNázyP u všech říší organizmů a také sestřih intronů. Zajímavé je, že zatímco u eukaryot jsou tyto funkce jsou vysoce konzervativní, u prokaryot byly některé z nich nahrazeny proteinovými katalyzátory. To podporuje představu, že eukaryota jsou bližší původním organizmům, zatímco prokaryota jsou odvozené organizmy, které opustily systém méně účinných katalyzátorů na bázi RNA světa a vytvořily si pro některé funkce účinnější mechanizmy katalýzy založené na proteinech. Vzhledem, k tomu, že proteiny jsou mnohem účinnějšími katalyzátory než RNA, lze předpokládat, že katalytická schopnost RNA není novým evolučním výdobytkem ale pouze pozůstatkem, reliktem. Molekuly RNA, které se nacházejí u širokého spektra organizmů, lze považovat za starobylé spíše než předpokládat, že vznikly u různých organizmů vícekrát na 21 sobě nezávisle. Molekuly RNA, které zaujímají centrální postavení v metabolismu, bude v evoluci obtížné zaměnit a tak pravděpodobně přežily ze světa RNA. Hlavními kriterii, podle kterých se posuzuje, zda určitá molekula RNA muže být reliktem ze světa RNA, jsou (i) katalytické schopnosti, (ii) všudypřítomost a (iii) centrální postavení v metabolismu. RNA s katalytickými schopnostmi je pravděpodobnějším reliktem ze světa RNA než RNA nesoucí pouhou informaci. Dále se budeme zabývat jednotlivými příklady reliktů světa RNA jako jsou předchůdci tRNA, ribozómy, splicezómy, snorpozómy, vault částice, signální rozpoznávací částice, telomeráza, editace RNA a jiné struktury a procesy, v nichž se do dnešních dob dochovala interakce proteinů s molekulami RNA. 2.4. tRNA - od replikace k proteosyntéze Názorný příklade nám nabízí svět RNA virů, dokládající, jak se mohly původní ribozymy adaptovat na novou funkci je převzetí role tRNA účastníci se proteosyntézy molekulou či spíše strukturou podobnou tRNA, tzv. mikrohelixem původně důležitým v replikaci RNA genomu. U některých bakteriálních nebo rostlinných virů (bakteriofág Qβ, virus CaMV), jejichž genetická informace je uložena v molekulách RNA, byla totiž na jednom konci nalezena vlásenková struktura nápadně podobná struktuře tRNA. Tato struktura byla podobně jako tRNA zakončena tripletem CCA. A co více, ukázalo se, že i v tomto případě sekvence CCA váže aminokyseliny, které zde však hrají roli v procesu replikace. U RNA virů jsou struktury podobné molekulám tRNA, tzv. TLS (tRNA-like structures) aminoacylovány aminokyselinami histidinem, valinem a tyrosinem a fungují jako primery pro replikaci. Máme před sebou zřejmě starobylou strukturu, jakousi molekulární fosilii přežívající z dob, kdy aminokyseliny plnily ještě jinou roli, než jako stavební kameny pro syntézu proteinů. O tom, že některé proteiny se původně účastnily replikace a až později s zapojily do translace, svědčí i to, že ribozomální protein S1 stejně tak jako translační elongační faktory Tu a Ts jsou u bakteriofága Qβ součástí replikázového komplexu. Elongační faktory jsou součástí replikázových komplexů i u některých rostlinných RNA virů. Struktury podobné dnešním tRNA tehdy hrály důležitou roli v nejzákladnějším procesu živých systémů, jímž je replikace, jako specifická značka určující, kde má replikace začít. V tomto kontextu je zajímavé také to, že i dnešní mobilní genetické elementy množící se prostřednictvím molekul RNA, tzv. retroelementy (viz E. Kejnovský - Vesmír 2000/5), využívají k zahájení své replikace molekuly tRNA. Podobné vlásenky byly objeveny i při replikaci konců eukaryotických chromosomů, telomer, jimiž se buňky brání proti jejich zkracování. Zdá se, že molekuly tRNA vznikly z krátkých vlásenkových struktur, tzv. mikrohelixů. Analýza sekvencí mnoha tRNA ukázala, že skladbu dnešních tRNA lze odvodit z opakovaných spojení, přeskupování a mutací krátkých sekvencí. Dvě domény současných tRNA, jedna vážící aminokyselinu a druhá interagující s mRNA, mají asi počátek ve dvou původně nezávislých mikrohelixech, z nichž mikrohelix vážící aminokyselinu je zřejmě evolučně starší. Předkové tRNA tak možná představovali jedny z nejstarších biomakromolekul. Pozůstatkem z dávných dob je možná i přítomnost podivných aminokyselin inosinu a hypoxantinu v tRNA. 2.5. Ribozóm Ribozómy jsou malé buněčné organely tvořené molekulami RNA a ribozomálními proteiny. Probíhá na nich translace, při níž se překládá genetická informace z molekul mRNA do proteinů. Ribózmy se nacházejí volně v cytoplazmě anebo jsou navázány na endoplazmatické retikulum či na jadernou membránu. Ribózmy se nacházejí také uvnitř dalších organel – mitochondrií a chloroplastů. Z evolučního hlediska jsou ribozómy pozůstatky světa RNA, jsou to vlastně ribozymy stabilizované proteiny. Mnoho funkcí ribozómů vykonávají dodnes molekuly RNA, např. katalyzují tvorbu peptidické vazby peptidyltransferázovou aktivitou RNA. Důležité jsou interakce RNA-RNA, např. interakce tRNA s 23S rRNA. Bylo 22 experimentálně zjištěno, že ribozómy zbavené proteinů mohou dokonce katalyzovat některé reakce. Podle současných představ mohl dříve existovat ribozóm tvořený pouze molekulami RNA bez účasti proteinů. Bylo např. ukázáno, že molekuly RNA vzniklé in vitro jsou schopny aminoacylovat molekuly tRNA. Přechod od RNA katalyzátorů k proteinovým katalyzátorům dokládá i fakt, že u některých organizmů je podstatný pro peptidyltransferázovou aktivitu ribozomální protein L2. Proteiny postupně stabilizovaly původní ribozómy tvořené pouze molekulami RNA a především zvýšily jejich přesnost. Je také možné, že ribozómy měly původně jinou úlohu, např. v replikaci. V důsledku Eigenova limitu byly původní molekuly dlouhé jen několik stovek bází a až postupně se zvyšující se přesností replikace se jejich délka zvyšovala. Je také možné, že jednotlivá aktivní místa dnešních ribozómů existovala původně jako nezávislé ribozymy a ty byly poté spojeny rekombinací. To je podporováno i zjištěním, že některé interakce RNA v ribozómu lze napodobit malými RNA. Odhadovaná původní velikost ribozómu je 7500 nukleotidů, což zahrnuje velkou podjednotku, 5.8S rRNA a mezilehlé sekvence. Podle jednoho modelu byl prekurzorem proteosyntézy systém, v němž RNA polymeráza specificky prodlužovala molekulu RNA podle templátu a to tak, že připojovala vždy trinukleotidy, předtím než vždy disociovala. Délka trinukleotidu se zdá být optimální z hlediska přesnosti a rychlosti. Čím je oligonukleotid, o který je vlákno najednou prodlouženo, delší, tím je přesnost vyšší ale rychlost replikace nižší. Stabilita roste lineárně a počet možností exponenciálně. Podobná periodicita se uplatňuje při prodlužování telomér in vitro u Tetrahymena, zde je základní délkou hexanukleotid. Při replikaci pomocí struktur podobných molekulám tRNA je trinukleotid přenesen z této tRNA do rostoucího vlákna RNA. Označení těchto tRNA struktur aminokyselinami napomáhá replikáze v jejich rozpoznávání. Je možné, že původní aminokyseliny navázané na tRNA mohly plnit ještě nějakou další úlohu, např. napomáhat včleňování trinukleotidů. Původní molekuly tRNA zřejmě sestávaly pouze z části dnešních tRNA. Ribozóm je tedy zvláštním ribozymem, který v průběhu evoluce přeměnil svoji úlohu z replikace na vznikající translaci. 2.6. Sestřih, snRNA, snoRNA Sestřih je postranskripční úprava pre-mRNA (hnRNA), při níž je z primárního transkriptu vystřižen přepis intronů a jsou spojeny přepisy exonů.. Vzniká mRNA, která slouží jako templát pro translaci na ribozómech. Při sestřihu se stvoří komplex nukleových kyselin a 23 proteinů, tzv. spliceosom. Spliceosom je dalším příkladem RNP komplexu, jehož součástí je katalytická RNA.Aktivní místo spliceosomu obsahuje struktury RNA, které jsou podobné intronům II. skupiny a intronům typu hammerhead (viz výše). Při sestavování spliceosomu a tvorbě jeho aktivního místa hrají důležitou roli interakce RNA-RNA. Tato představa naznačuje, že spliceosom má původ ve světě RNA. Vznik spliceosomu před vznikem translace zdánlivě nemá smysl, není důvod přesně sestřihovat pre-mRNA a těžko by se v evoluci udržela takováto struktura, pokud by neměla nějakou selekční výhodu. Zdá se, že protospliceosom měl původně úlohu v rekombinaci jako jakási původní rekombináza. Umožňoval zřejmě kombinování různých molekul RNA. Toto je další příklad, kdy se změnila původní funkce ribozymu na funkci novou. V této souvislosti je pozoruhodný objev bimolekulárního sestřihu u trypanozom a nematod. Při něm jsou kombinovány dvě molekuly RNA, exony se nacházejí na dvou různých primárních transkriptech. Sestřihu pre-mRNA se účastní molekuly malých jaderných RNA, snRNA. Tyto molekuly interagují s proteiny označovanými jako snRNP-proteiny a vytvářejí spolu snRNP částice. Tyto částice řídí ve spliceosomu proces sestřihu. Proteiny ve spliceosomu zřejmě mění konformaci pre-mRNA a umožňují její posttranskripční úpravy. Molekulami snRNA účastnícími se sestřihu pre-mRNA jsou U1, U2, U4, U5 a U6 snRNA. Každá z těchto molekul tvoří komplex s několika proteiny. Molekula U1 se váže na 5-místo a molekula U5 na 3-místo sestřihu. Molekula U2 se váže na místo větvení, kde se poté uzavře smyčka tvořená intronem. Posttranskripčním úpravám podléhají i molekuly pre-rRNA. Tento proces probíhá v jadérku a zajišťují jej molekuly malých jadérkových RNA, snoRNA. Ty se účastní kromě sestřihu molekul pre-rRNA také modifikací RNA. Samotné molekuly snoRNA vznikají výhradně sestřihem intronů. Nacházejí se v intronech ribozomálních genů nebo „heat shock“ genů. Na příkladu molekul snoRNA je vidět, že mRNA mohla vzniknout jako vedlejší produkt, kdy byly spojeny oblasti mezilehlé mezi oblastmi kódujícími ribozymy, které se tak staly introny a nadále kódují snoRNA. Extrémním příkladem podporující právě tuto představu je gen, který je po transkripci sestřižen a vzniklá mRNA je degradována bez translace, zatímco intronové oblasti kódují osm různých snoRNA. Introny jsou zde tedy důležitější než exony, došlo ke ztrátě funkce proteinu při zachováním důležitosti snoRNA. Molekuly snoRNA ve starších intronech tak možná předcházejí vzniku translace a také vzniku mladších exonů, které je dnes obklopují. To, že introny obsahují funkční relikty světa RNA, svědčí o tom, že se jedná o struktury velmi staré. 24 2.7. Maturace tRNA a RNázaP Některé geny pro tRNA obsahují introny. Pro maturaci molekul tRNA je potřebný enzym RNázaP. Tento enzym je RNA-proteinovým komplexem. Byl objeven u všech hlavních skupin organizmů, nejlépe je prozkoumána RNázaP E. coli. RNA složka RNázyP, označovaná také někdy jako P-RNA, je zde dlouhá necelých 400 nukleotidů. Samotná P-RNA je schopná katalyzovat štěpení pre-tRNA in vitro. Narozdíl od ostatních RNA katalyzátorů, které jsou schopny provést určitou reakci pouze jednou, je RNázaP skutečným enzymem štěpícím opakovaně. V současnosti jsou známé sekvence mnoha P-RNA a studuje se také jejich struktura. Přestože podobnosti na úrovni sekvence jsou dost nízké, jsou zde zřejmé podobnosti na úrovni sekundární a terciární struktury. RNA složka enzymu RNázy P a její schopnost štěpit pre-tRNA se stala druhým objeveným ribozymem (Guerrier-Takada, 1983), hned rok po objevu samosestřihujícího se intronu u Tetrahymena thermophila. 2.8. Signální rozpoznávací částice a srpRNA Signální rozpoznávací částice je RNA-proteinový komplex zajišťující vazbu ribozómu na endoplazmatické retikulum a následnou sekreci nově syntetizovaných proteinů do endoplazmatického retikula. Složení SRP je konzervativní mezi eukaryoty, pokaryoty a archebakteriemi. RNA složkou je u eukaryot a archebakterií 7S RNA. U eukaryot je délka této srpRNA asi 300 nukleotidů. srpRNA zřejmě existovala již ve světě RNA. Z oněch dob si srpRNA uchovala pouze schopnost napomáhat hydrolýze GTP. 2.9. Editace RNA a řídící RNA (gRNA) Editace je jedním z mechanizmů posttranskripčních úprav. Při editaci RNA dochází k drobným úpravám, inzercím, delecím či substitucím, výsledkem čehož je zralá mRNA. Nejznámějším příkladem je vkládání několika uracilů do sekvence pre-mRNA. Strukturní geny, které obsahují informaci podléhající editaci, se označují jako kryptogeny. Editace byla objevena nejprve u mitochondrií trypanozom, později i u jiných organizmů, např. v mitochondriích vyšších rostlin či strunatců. Nejznámější je inzerce bloku uridinů u mitochondrií trypanozom, dále nahrazení cytosinu uracilem nebo naopak uracilu cytosinem u rostlinných mitochondrií a chloroplastů, editace tRNA u Acanthamoeba a vačnatců, nahrazení adeninu inosinem u savců a virů a v neposlední řadě inzerce guaninů u RNA virů. Proces editace není náhodný, nýbrž je přesně řízen. Účastní se ho molekuly řídící RNA (guideRNA, gRNA), která vykazuje homologii s upravovanou pre-mRNA a obsahuje také např. nukleotidy (blok uracilů), které budou při editaci vloženy do pre-mRNA. U mitochondrií Acanthamoeba bylo zjištěno, že čtyři z pěti tRNA v každém ze dvou klastrů dochází k editaci RNA. Pokud k této editaci nedojde, pak výsledná tRNA nevytvoří potřebnou sekundární strukturu a to zabrání zrání tRNA molekulami RNázyP (také ribozym, viz výše). Ve světě RNA mohl tento mechanizmus, podobně jako i dnes, řídit expresi molekul tRNA. Existují však protichůdné názory na původ RNA editace. Podle některých autorů vznikl ještě před endosymbiotickou událostí, která dala vznik mitochondriím, snad ještě ve světě RNA, podle jiných vznikl tento proces až po vzniku mitochondrií. Někteří autoři se také domnívají, že vznik RNA editace je až evoluční reakcí na skutečnost, že mitochondrie nemohou, narozdíl od svých volně žijících předchůdců (proteobakterií), volně rekombinovat a v důsledku tzv. Mullerovy rohatky (Mullers ratchet) se v nich akumulují drobné mutace. RNA editace je rozhodně významným mechanizmem, jehož selhání může mít pro organizmus fatální důsledky, u člověka je např. příčinou řady nádorových onemocnění nebo neurologických onemocnění (např. epilepsie v případě chybné editace adeninu na inosin). 2.10. Telomeráza a telomerická RNA 25 Vzhledem k tomu, že replikace DNA se účastní primer tvořený RNA, který je nakonec odstraněn, vzniká u lineárních molekul eukaryot a RNA virů problém nezreplikovaného 3‘konce. Ten je u eukaryot vyřešen pomocí enzymu telomerázy. Telomeráza je enzym tvořený jednak proteinovou složkou a jednak molekulou RNA. Tato RNA slouží jako templát pro přidávání telomerických repeticí, opakujících se úseků typických pro určitý organizmus (TTAGGG u všech obratlovců). Přestože telomeráza neexistuje u prokaryot, jejichž cirkulární genomy se replikují mechanizmem otáčivé kružnice, předpokládá se, že se jedná o relikty ze světa RNA. Telomeráza je vlastně reverzní transkriptáza syntetizující úseky DNA podle templátu RNA, který si sama nese. Není proto překvapením, že byla zjištěna homologie telomerázy s reverzními transkriptázami různých retroelementů. RNA složka telomerázy může i bez účasti proteinů tvořit složité sekundární struktury. Její účast v katalýze však není zatím zcela jasná jako je tomu u RNA složek, jež jsou součástí ribozómu nebo které se účastní sestřihu. Bylo ale zjištěno, že mutace v RNA složce vedou k prodlužování telomér. Předpokládá se, že tato RNA hrála svoji roli již ve světě RNA ještě před vznikem proteosyntézy. První genomy byly zřejmě lineárními dvouřetězcovými molekulami RNA. 2.11. Vault RNA (vRNA) Na povrchu jaderné membrány byly v polovině 80. let objeveny RNA-proteinové částice, tzv. vault částice, které jsou spojeny s komplexem pórů v jaderné membráně (Kedersha a Rome, 1986). V buňkách savců jsou přítomny desetitisíce těchto částic. RNA složka těchto částic byla označena jako vault RNA (vRNA) a ukázalo se, že je značně konzervativní mezi různými organizmy. I přes rozdíly ve své délce jsou konzervativní především sekundární struktury které vRNA tvoří. Úloha vRNA není zatím jasná, předpokládá se, že může fungovat jako značka určující které molekuly budou transportovány z jádra a do jádra. Je známo, že např. u člověka hrají vault částice roli při rezistenci rakovinných buněk proti léčivům. Vault RNA má spíš funkční než strukturní úlohu, neboť odstranění RNA složky z vault částic nevedlo ke změně jejich struktury. Její existence může souviset s kompartmentací prvních RNA organizmů a může tak představovat další relikt světa RNA. Je totiž možné, že již ve světě RNA existovalo protojádro a protoplazma jako nástroj separace replikace a transkripce (genové exprese). To mohlo být evolučně výhodné, např. k oddělení informace a potlačení šumu. 26 2.12. tmRNA u prokaryot V bakteriích byly objeveny molekuly mající charakter jak mRNA tak současně i tRNA, byly proto označeny jako tmRNA. tmRNA se účastní procesu trans-translace, kdy přidává na Ckonec peptidu, vznikajícího omylem podle rozbité mRNA, značku signalizující, že peptid je určen k proteolýze. Geny pro tmRNA byly nalezeny ve všech osekvenovaných genomech prokaryot, bakteriofágů, mitochondrií a chloroplastů. 2.13. Malé nekódující RNA a RNA interference – miRNA, siRNA, smRNA aj. viz kapitola VI 2.14. První RNA organizmus: Riborgis Eigensis První RNA genomy byly zřejmě hned po vzniku proteosyntézy stabilizovány proteiny. Vznikaly RNA-proteinové (RNP) komplexy. RNA mohly být také uzavírány do membránových vesikulů. Prvními RNA replikony byly krátké molekuly RNA, které byly replikovány RNA-dependentní RNA polymerázou (RNA replikázou). Tento enzym byl možná nejstarším proteinem. Vznikl pravděpodobně náhodou a na počátku byl výhodný pro RNA genom tím, že ho např. stabilizoval nebo nějak výhodně měnil jeho konformaci, až později byl schopen katalyzovat syntézu dalších kopií RNA genomu. V důsledku chyb RNA polymerázy vznikla populace podobných molekul RNA. Tyto replikony si byly vzájemně výhodné, některé kódovaly replikázu, jiné zase ochranný plášťový protein nebo konformační podjednotky. Tak vznikal interaktivní fragmentovaný genom. Z RNA-dependentní RNA polymerázy se pravděpodobně vyvinula reverzní transkriptáza, jejíž vznik byl jednou z podmínek přechodu od molekul RNA k molekulám DNA. Při uvažování o velikostech prvních genomů je důležitý tzv. Eigenův limit – podle něhož je replikační přesnost limitujícím faktorem (Eigen 1992). Čím je totiž frekvence chyb při replikaci vyšší, tím menší genom může projít do další generace. Délka původních molekul RNA zřejmě v důsledku tohoto omezení nepřesahovala několik stovek bází. 2.15. Dnešní viry a viroidy – nejpodobnější časným replikonům První genomy byly na bázi molekul RNA. Limitujícím faktorem byla malá velikost těchto genomů, což vyplývá z nestability RNA. Postupně byl RNA genom stabilizován proteiny a 27 RNA byla chráněna membránovými vesikuly nebo enkapsidací do proteinových struktur. První genomy byly fragmentovány. Vyvíjely se díky v tehdejší době značně chybující RNA polymeráze a díky častým rekombinacím. Tento stupeň organizace genomu velmi připomíná současné RNA viry. Dnešní RNA viry jsou proto často považovány za funkční relikty časných RNA-proteinových replikonů. Viry jsou molekulární parazité, mohou se replikovat pouze v prostředí, z něhož mohou získávat všechny potřebné látky. Ve vhodném prostředí se replikují velice účinně a mohou se adaptovat na nové prostředí. Jsou to organizmy na hranici života podobně jako časné replikony. Viry používají také odlišný genetický kód, některé se replikují ve speciálních vesikulárních strukturách tvořených membránou hostitele. Některé viry (pararetroviry a retroviry) mají ve svém cyklu jak DNA tak i RNA stádia a při tom používají reverzní transkripci. To zase připomíná evoluční přechod z RNA do DNA. Pozoruhodná je i skutečnost, že mnohé dnešní viry obsahují ve svých kapsidech více molekul RNA, což může připomínat dávnou organizaci prvních RNA genomů. Viroidy jsou parazité rostlin tvoření molekulami RNA. Od virů se odlišují tím, že jejich RNA jsou menší, v rozmezí 240-400 bází, jsou cirkulární a neobsahují žádné sekvence kódující proteiny. V buňce se obvykle nachází 200-10 000 kopií viroidové RNA. Existence genomů bez kódovací kapacity může připomínat replikony z dob před vznikem proteosyntézy. Viroidy se replikují mechanizmem otáčivé kružnice a jejich replikaci zajišťují hostitelské RNA polymerázy. Při replikaci vznikají multimerní kopie, které jsou štěpeny autokatalytickými ribozymovými sekvencemi. RNA genom viroidů vytváří v důsledku vnitřního párování výrazné sekundární struktury, které silně zvyšují jeho stabilitu a chrání jej proti enzymatické i fyzikální degradaci i pokud je tato RNA volná bez přítomností proteinů. 2.16. Jsou starobylejší prokaryota nebo eukaryota? Svět RNA může přispět k zodpovězení otázky, zda prapůvodnímu organizmy byly podobnější spíše dnešním prokaryotům nebo eukaryotům. Níže uvedené argumenty podporují představu starobylosti eukaryot: 1. Je známo mnoho reliktů světa RNA u eukaryot, jen několik také u prokaryot. Vzhledem k tomu, že proteiny jsou účinnější katalyzátory než molekuly RNA (turnover u proteinů 103 až 106 zatímco u ribozymů je turnover 1) není důvod proč by selekční tlak měl zvýhodnit nahrazení proteinů ribozymy u eukaryot. 2. Posttranskripční úpravy mRNA a rRNA jsou rychlé a účinné u prokaryot. Pokud by se eukaryota vyvinula z prokaryot, muselo by se de novo vyvinout množství nových molekul RNA a RNP komplexů účastnících se např. sestřihu pre-rRNA eukaryot, např. 30 snoRNA a proteinů účastnících se sestřihu. 3. Neexistuje selekční výhoda pro moderní vznik sestřihu a spliceosomu u eukaryot. Těžko si lze představit selekční síly, které by zvýhodňovaly zavedení složitého systému úpravy mRNA pomocí komplexu RNA a proteinů, aby vytvořily mRNA za 1 hodinu místo původního času 1 minuty, jak je tomu u prokaryot 4. Eukaryotické telomerázy jsou starobylé struktury. I některá prokaryota mají lineární chromosomy s jednoduchými telomerickými strukturami podobnými telomerickým strukturám u DNA virů. Podle některých současných představ je tedy fragmentovaný, introny obsahující a diploidní genom starobylý, zatímco rychle se replikující a operony obsahující genom utvořený jednou cirkulární molekulou odvozený. U prokaryot genom přešel z podoby lineárních molekul do podoby cirkulárních molekul. Při tom se zbavil mnoha kroků, při nichž docházelo k úpravám primárních transkriptů, zbavil se intronů, a geny pro nekódující RNA (snoRNA), které byly potřebné pro úpravy primárních transkriptů buď nebyly již potřeba nebo byly nahrazeny proteiny. Zajímavou představou vysvětlující příčiny vzniku cirkulárních genomů bez intronů u prokaryot je „hypotéza termoredukce“ založená na předpokladu, že v evoluci prokaryot existovalo termofilní stádium, ne-li extrémně termofilní stádium. Vše vychází z faktu, že 28 jednořetězcová RNA je značně citlivá k hydrolýze při teplotách nad 50o C. Všechny prekurzorové RNA by byly v takovém prostředí rychle degradovány, pokud by jejich zrání nebylo odstraněno anebo nebyly nahrazeny proteiny. Z hlediska možné degradace je nevýhodná i časová a prostorová separace transkripce a translace. Jakákoliv prodleva by vedla k degradaci dříve než by molekuly byly upraveny. Proto u prokaryot translace bezprostředně navazuje na transkripci a je zahájena ještě před dokončením transkripce. Odstraněním intronů odpadl zdlouhavý proces sestřihu. Malé jadérkové RNA (snoRNA) účastnící se úprav rRNA a následně sestavování ribozómů by neodolaly vyšší teplotě. Proto byly u prokaryot nahrazeny stabilnějšími proteiny. Důležitá je i skutečnost, že cirkulární molekuly DNA jako genetický materiál prokaryot mají mnohem nižší teplotu tání než molekuly lineární. Představu, že prokaryota mohla projít stádiem termofilních organizmů, podporuje i existence mnoha termofilních druhů u různých skupin prokaryot. Pokud jde o mechanizmus přechodu lineárních genomů k cirkulárním, posloužily jako model retroviry. Ty se nacházejí v genomu včleněné v podobě proviru. Pokud provirus leží v blízkosti genu, může být tento gen transkribován spolu s provirem a začleněn do virové částice. Virová RNA je následně přepsána do dvouřetězcové DNA. Část těchto molekul se zpětně včlení do genomu a ostatní molekuly zůstanou cirkulární. V selekci potom mohou být za určitých podmínek zvýhodněny cirkulární molekuly (rychlejší replikace, tepelně stabilnější). Takových molekul může být mnoho a mohou spolu rekombinovat a spojovat se v molekuly delší tvořící rostoucí cirkulární DNA genomy. 29 Kapitola III.: EVOLUCE GENOMŮ 3.1. Typy genomů - srovnání prokaryotického a eukaryotického genomu 3.2. První genomy – lineární nebo cirkulární 3.3. Velikosti genomů a paradox hodnoty C 3.4. Genomy prokaryot 3.5. Minimální genom 3.6. Anatomie eukaryotického genomu a struktura chromosomů 3.7. Počty chromosomů 3.8. B chromosomy – parazité? 3.9. Repetice – podstatná složka genomu 3.10. Změny ve velikosti genomů, plynulost nebo skoky 3.11. Polyploidizace – výhody a nevýhody 3.12. Polyploizace v linii obratlovců, rostlin a kvasinky 3.13. Genomová obezita rostlin a „big bang“ v genomu kukuřice 3.14. Proměnlivost velikosti genomu v rámci druhu 3.15. Kolinearia (syntenie) 3.16. Izochory 3.1. Typy genomů - srovnání prokaryotického a eukaryotického genomu Genom je celková genetická informace daného organizmu. U všech autonomních forem života jsou nositelem genetické informace molekuly DNA. Pouze u některých virů nesou genetickou informaci molekuly RNA. Genom prokaryotických organizmu je představován jednou dvouřetězcovou molekulou DNA, tzv. bakteriálním chromosomem, který je většinou cirkulární. Kromě toho některé bakterie obsahují malé kružnicové molekuly DNA nazývané plazmidy. Genetická informace eukaryotické buňky se nachází převážně v jádře, ale také v mitochondriích a případně chloroplastech. V jádře tvoří složité chromatinové struktury, tzv. chromosomy, každý z nichž obsahuje jednu molekulu DNA. V mitochondriích a chloroplastech se nacházejí kružnicové molekuly DNA. 3.2. První genomy – lineární nebo cirkulární Není známo, kdy došlo k převedení genetické informace z molekul RNA do molekul DNA. Stejně tak není známo, zda byly první DNA genomy tvořeny lineárními nebo cirkulárními molekulami nukleových kyselin. Zajímavá je představa profesora Edwarda Trifonova, podle něhož byly první DNA genomy tvořeny mnoha malými kružnicovými molekulami DNA. Tyto autonomní DNA se přenášely do dceřiných buněk a jejich počty a zastoupení byly pouze statistické. Nenesly pouze geny kódující proteiny, ale kódovaly i syntézu rRNA a tRNA a snad i další důležité funkce ranného disperzního genomu. O existenci malých kružnicových genomů dnes svědčí jednak periodicita délek proteinů, kde monomer odpovídá právě délce DNA, o které bylo experimentálně zjištěno, že nejochotněji cirkularizuje. Se stejnou periodicitou se v proteinech objevuje aminokyselina metionin stojící vždy na začátku proteinu, a tak vymezuje hranice mezi fúzovanými geny. Jednotlivé kružnicové molekuly DNA postupně fúzovaly a rekombinovaly, což vedlo k jejich zvětšování. Nakonec vynikly první chromosomy obsahující různé počty kopií a kombinace původních genů. Existence chromosomů usnadnila distribuci genů při buněčném dělení. Pozůstatky dávné organizace disperzních genomů můžeme pozorovat i v dnešních genomech v podobě různých extrachromosomálních DNA jako jsou plazmidy, mobilní elementy, lyzogenní fágy, a snad i genomy organel. 30 3.3. Velikosti genomů a paradox hodnoty C Velikosti genomů se uvádějí v kilobázích (kb) nebo megabázích (Mb). Jindy se množství DNA daného organismu uvádí jako hodnota C. Ta se udává většinou v pikogramech DNA na jedno jádro (haploidní genom). Prokaryotické genomy jsou velké většinou miliony bází, např. velikost genomu E. coli je 5 Mb. Nejmenší genomy mezi buněčnými organismy mají mykoplazmata – Mycoplasma genitalium 500kb. Jednoduchý eukaryotický organismus, jako je kvasinka, má genom veliký 13,5 Mb. Lidský genom je velký přibližně 3 200Mb. Největší genomy mají někteří obojživelníci, např. mloci, nebo liliovité rostliny, přesahující velikost genomu člověka až téměř 100x. Pozoruhodným jevem je velké rozmezí velikostí genomů mezi často i příbuznými druhy. Tyto rozdíly dosahují až pěti řádů, tedy liší se až 100 000 krát! Např. u obojživelníků se velikosti genomů pohybují mezi 700Mb až 100 000Mb. U kvetoucích rostlin najdeme genom velký pouhých 120 Mbp u A. thaliana a na druhém konci liliovitou rostlinu Fritillaria assyriaca s genomem o velikosti 110 000 Mbp. Genom pšenice je 11krát větší, než genom rýže, přičemž obě obiloviny mají podobnou morfologii, podobný počet biochemických drah a fyziologických procesů. Existují primitivní řasy honosící se obřími genomy, stejně tak jako evolučně pokročilé druhy s malými genomy. Např. čolek či lilie mají 30krát větší genomy než člověk. Je tedy evidentní, že mezi velikostí genomu a složitostí organismu neexistuje jednoduchý vztah. Tomuto nesouladu se říká „paradox hodnoty C“. Tento fakt je do značné míry vysvětlitelný redundancí určitých oblastí genomů, především nekódujících repetitivních sekvencí DNA, jejichž funkce (pokud vůbec nějaká existuje) není zcela pochopena. Tyto části genomů bývají označované jako „zbytečná“ (anglicky „junk“) či „sobecká“ DNA. Repetice jsou v genomu rozptýlené anebo jsou nahloučené v tandemech. Výzkumy z poslední doby naznačují, že jak velikosti genomů, tak i počty genů se v průběhu evoluce nevyvíjely plynule, 31 nýbrž, že docházelo k jakýmsi skokům či časově omezeným expanzím. Příčiny těchto změn i jejich mechanizmus jsou stále zahaleny tajemstvím. Pokud se však berou v úvahu nejnižší hodnoty velikostí genomů dané systematické skupiny, lze pozorovat jejich závislost na složitosti organismů, resp. jejich postavení v evolučním stromu. 3.4. Genomy prokaryot Velikost bakteriálních genomů většinou nepřesahuje 5 Mb (jednou z výjimek je Bacillus megaterium s genomem 30Mb). To odpovídá skutečné délce asi 1.6mm, přičemž velikost bakteriálních buněk E.coli je 1x2μm. Je tedy jasné, že bakteriální genom musí být nějakým způsobem kompaktizován. Napomáhají tomu proteiny vážící se na DNA. Spolu s DNA pak vytvářejí bakteriální chromosom, tzv. nukleoid. V bakteriálním chromosomu je DNA nadšroubovicově zavinutá, což je ideální způsob, jak namačkat cirkulární DNA do malého prostoru. Nadšroubovicové vinutí (supercoiling) je řízeno dvěma enzymy - gyrázou a topoizomerázou I. Molekula DNA E. coli tvoří přibližně 40-50 smyček vyčnívajících z centrálního proteinového jádra do cytoplazmy. Každá smyčka obsahuje asi 100kb nadšoubovicově vinuté DNA. Nejhojnějším proteinem zodpovědným za udržování DNA ve sbaleném stavu je protein Hu, který je sice strukturně zcela odlišný od eukaryotických histonů, avšak funguje podobně, tvoří tetramery, kolem nichž se ovíjí 60bp dlouhý úsek DNA. V poslední době se ukazuje, že dosavadní pohled na anatomii prokaryotických genomů, odvozený převážně ze studia E. coli, byl příliš zjednodušen. Ačkoliv je drtivá většina bakteriálních a archeálních genomů skutečně cirkulární, stále přibývá nově objevených lineárních genomů prokaryot. První z nich byl popsán v roce 1989 u Borrelia burgdorferi (Ferdowe a Barbour, 1989), podobná situace byla zjištěna i u Streptomyces a dalších bakterií. U B. burgdorferi je hlavní lineární genom (910kb nesoucích 853 genů) provázen existencí nejméně 17 lineárními a cirkulárními plazmidy (dohromady 533kb nesoucích 430 genů). Tyto plazmidy jsou podstatnou složkou genomu a svědčí o tom, že i prokaryotické genomy mohou být rozděleny do více molekul DNA, což připomíná situaci u eukaryot. Uspořádání genomu u B. burgdorferi je však spíše výjimkou, neboť i její blízký příbuzná bakterie Treponema 32 pallidum má standardní prokaryotický genom tvořený velkou cirkulární molekulou DNA, a neobsahuje žádné homology genů přítomných u B. burgdorferi na plazmidech. Dalšími místy uložení genetické informace u prokaryot jsou plazmidy – malé cirkulární molekuly nacházející se v bakteriální buňce. Některé jsou schopny se začleňovat do bakteriálního chromosomu, jiné jsou trvale nezávislé a přenášejí se z mateřské buňky do dceřiné buňky při buněčném dělení. Plazmidy nesou geny, které mohou za určitých podmínek být pro bakterii užitečné. K fenotypovým projevům (funkcím) některých plazmidů patří rezistence k antibiotikům (Rbk u E. coli), schopnost konjugace (F plazmid), syntéza toxinů zabíjejících bakterie (Col plazmidy), patogenita (Ti plazmid Agrobacterium tumefaciens). Mnohé plazmidy se snadno přenášejí z jedné buňky do druhé a mohou tak putovat i mezi různými bakteriálními druhy. Bakterie může obsahovat kombinaci různých plazmidů a naopak jeden typ plazmidu může „hostovat“ ve více druzích bakterií. Mnohé druhy bakterií tak mohou sdílet určitý „banku“ genů přítomných na plazmidech, které si mohou podle potřeby vzájemně „půjčovat“. Genetická organizace prokaryotických genomů je charakteristické, že geny jsou velmi blízko sebe pouze s krátkými mezilehlými úseky. Například u E. coli tvoří nekódující DNA pouze 11% genomu. Kompaktní uspořádání prokaryotických genomů se vysvětluje nejčastěji výhodností pro rychlou replikaci těchto genomů. Dalším typickým znakem prokaryotických genomů je přítomnost operonů. Operon je skupina genů nacházejících se za sebou, oddělené pouze několika nukleotidy. Všechny geny operonu jsou transkribovány současně jako jedna jednotka. Genom E. coli obsahuje téměř 600 operonů, každý z nichž má dva nebo více genů. Nejznámějším příkladem je laktózový operon E. coli tvořený třemi geny důležitými pro přeměnu laktózy na glukózu a galaktózu. Syntéza enzymů kódovaných třemi geny laktózového operonu je tak koordinována. 3.5. Minimální genom Jednou z nejvíce provokujících otázek biologie je otázka minimálního genomu resp. minimálního počtu genů v genomu autonomně žijícího organizmu. Tato otázka má dosah i do filozofie či náboženství. Nejmenší genom ze známých autonomních organizmů má Mycoplasma genitalium s 470 geny a příbuzná M. pneumonie s 679 geny. Jeden z nejmenších genomů má i bakterie Pelagibacter ubique nesoucí 1354 genů. Přestože byla objevena až roku 1990, představuje asi nejhojnější bakterii na Zemi, vyplňující téměř celý vodní sloupec všech oceánů. Při studiu minimálního genomu se používají jak teoretické tak experimentální přístupy. Teoretické studie jsou založeny na srovnávací analýze známých genomů prokaryot (např. E. coli, M. genitalium a H. infuenzae), a minimální počet genů se odhaduje podle počtu genů přítomných u všech těchto bakterií. Experimentální přístupy mají dvě základní strategie. V první strategii se postupuje „shora dolů“ tak, že v bakteriálních genomech jsou systematicky inaktivovány jednotlivé geny a tak se zjistí, jaký počet genů a které geny jsou nepostradatelné. Minimální počty genů, k nichž se u různých organizmů dospělo se pohybovaly od 260 do 670 genů v závislosti na prostředí, v němž bakterie rostly. Takto byl zkoumán genom Bacillus subtilis a dospělo se k počtu 271 nepostradatelných genů v prostředí bohatém na živiny. U M. genitalium bylo transposonovou mutagenezí zjištěno, že 265-350 genů z celkového počty 480 genů je podstatných, přičemž u 100 z nich není známa jejich funkce. Opačnou strategii reprezentuje přístup „zdola nahoru“, kdy se vědci snaží syntetizovat autonomní živý organizmus de novo. Je však otázkou zda se vůbec někdy člověku podaří smícháním patřičných chemikálií připravit v laboratoři nový život. Předpokladem toho je pochopení všech i těch nejjemnějších detailů fungování živých systémů. To se zdá značně nepravděpodobné, když si uvědomíme k jakým revolučním objevům otvírajícím zcela nové 33 obzory stále dochází (např. objev úlohy malých RNA, fenomén RNA interference) svědčící o tom, jak velké mezery v chápání mechanizmů fungování živých systémů stále máme. 3.6. Anatomie eukaryotického genomu a struktura chromosomů Pro eukaryota je charakteristické velké rozmezí velikostí genomů sahající od 10Mb až po více než 1300 GB (1.3x1011 bp). Genom je rozdělen do chromosomů, které jsou vždy lineární. Již i ty nejjednodušší organismy včetně bakterií a virů si vyvinuly strategie umožňující jim vměstnat dlouhé molekuly DNA do svých buněk (nebo virových částic). To je možné díky uspořádání DNA do shluku smyček zahuštěných do tvaru klubka. Stabilita této struktury je závislá na síti interakcí DNA s proteiny a molekulami RNA. U eukaryot se DNA nachází v chromosomech, vláknitých útvarech tvořených chromatinem, který je složen z DNA a proteinů označovaných jako histony. Základními jednotkami chromatinu jsou částice nazývané nukleozómy. Jsou tvořeny 8 molekulami histonů, vždy po dvou molekulách každého ze 4 typů histonů (H2A, H2B, H3 a HA4). Histony tvoří válcovité jádro, kolem něhož se ovíjí ve dvou otáčkách DNA o délce 140- 150bp. Mezi histony se nachází spojovací DNA (linker DNA) o délce 50-70bp. Spojování nukleozómů do vyšších struktur napomáhá další histon, histon H1. Tak vzniká 10nm vlákno, označené podle své tloušťky, jehož další kompaktizací způsobenou interakcemi histonů se tvoří 30nm vlákno. To je základním typem chromatinu v interfázním jádře. Během buněčného dělení dochází k další kompaktizaci za vzniku typických metafázních chromosomů. Velikost chromosomů se pohybuje většinou v rozmezí jednotek až desítek mikrometrů, například součet délek lidských chromosomů je 300μm (pokud vezmeme všech 46 chromosomů a položíme je do řady) a obsahuje více než 2 metry DNA. Z toho vyplývá, že kompaktizace zkrátila DNA přibližně 7000x. Struktura chromosomů se během buněčného cyklu mění. Zatímco v interfázi jsou despiralizované a vytvářejí síť vláken, na začátku mitózy (v profázi) se začínají spiralizovat a zkracovat za tvorby vysoce kondenzovaných chromosomů mikroskopicky nejlépe pozorovatelných v metafázi, kde nabývají charakteristických tvarů. Typický metafázní chromosom je tvořen dvěma chromatidami (každá obsahuje jednu molekulu DNA), které jsou spojeny v centrální oblasti, která se nazývá centromera. Centromera dělí chromosom na dvě části nazývaná ramena. Kratší se vždy označuje jako p-rameno, delší jako q-rameno. Označování ramen je důležité pro mapování chromosomů. Konce chromosomů se označují jako telomery. Telomery jsou důležité z hlediska zachování intergrity chromosomů. U člověka dochází během života k jejich zkracování a fungují tak možná jako biologické hodiny. 34 Strukturu chromosomů, stejně jako jejich kondenzaci a intenzitu transkripce, lze studovat pomocí barvitelnosti chromatinu bazickými barvivy. Rozlišujeme tzv. heterochromatin, lépe barvitelné kondenzované oblasti chromosomů obsahující většinou repetitivní sekvence DNA, a euchromatin, který se barví hůře a představuje dekondenzované oblasti obsahující často transkribované geny. Heterochromatin je buď konstitutivní, který je trvale transkripčně inaktivní, nebo fakultativní, který je potenciálně transkribovatelný. 3.7. Počty chromosomů Počty i velikosti chromosomů se mezi jednotlivými druhy velmi liší. Neexistuje korelace mezi počtem chromosomů a komplexitou organismu. Všechny eukaryotické druhy mají nejméně dva chromosomy. Např. kvasinka S. cerevisiae, jednoduchý jednobuněčný organizmus, má čtyřikrát více chromosomů než D. melanogaster. Počet chromosomů nezávisí ani na velikosti genomu. Někteří mloci mají genom 30x větší než člověk, přičemž mají pouze polovinu počtu chromosomů. Jsou známy blízko příbuzné druhy jelínků rodu Muntiacus, které se výrazně liší počtem chromosomů. Extrémisty jsou například mravenec Myrmecia pilosula, který má pouze 1 pár chromosomů, přičemž samec nese jen 1 chromosom, naopak kapradina Ophioglossum reticulatum vlastní 630 párů chromosomů. Tato srovnání jsou sice zajímavá, ale v současné době nám neříkají nic o genomech jako takových, svědčí jen o různé intenzitě působení sil tvarujících genomy různých organizmů. Počet chromosomů závisí také na typu buňky daného organizmu. Ve většině buněk se chromosomy nacházejí v párech, mluvíme o diploidních buňkách. Naproti tomu pohlavní buňky obsahují pouze jednu sadu chromosomů, jsou haploidní. Po splynutí pohlavních buněk vzniká opět diploidní buňka. 3.8. B chromosomy – parazité? Zajímavým fenoménem jsou tzv. B chromosomy. Jsou definovány většinou jako přidatné postradatelné chromosomy přítomné v některých jedincích některých populací určitých druhů, které zřejmě vznikly z „normálních“chromosomů, označovaných také někdy jako A chromosomy. Jejich základními vlastnostmi je tedy (i) postradatelnost, (ii) původ z A chromosomů, (iii) fakt, že nerekombinují a (iv) neúčastní se meiózy. Vykazují tedy nemendelovskou dědičnost. Poprvé byly popsány Wilsonem (1906) jako tzv. „extra“ chromosomy u hmyzu Metapodius, později je pozorovali například N. Stevens (1908) u brouka Diabrotica nebo Kuwada (1915) u kukuřice. Pokud jde o jejich rozšíření, byly objeveny u 10 druhů hub, 1300 druhů rostlin a 500 druhů živočichů, přičemž převažují v některých taxonech jako jsou čeledi Compositae, Graminae, Liliaceae, Orthoptera, např. u hmyzu Orthoptera jsou přítomny u 10-15% druhů. Počet B chromosomů v buňce většinou nepřevyšuje 3-4, existují však rozdíly mezi populacemi i mezi jedinci. Extrémními příklady jsou Pachyphytum fittkaui s 50 B chromosomy, kukuřice s 34 B chromosomy nebo Fritillaria japonica s 26 B chromosomy. Velikostí jsou B chromosomy srovnatelné s normálními chromosomy, i když jsou známy i extrémní případy, kdy B chromosomy jsou buď nejmenší ze všech chromosomů (u ryby Astyanax scabripinnis) nebo naopak nejmenší (myš Reithrodontomys megalotis). Jsou metacentrické nebo akrocentrické. Jsou většinou heterochromatické, což souvisí s jejich velkým obsahem repetitivní DNA, buď satelitní DNA, rDNA nebo transposonů. Vysoký obsah „sobecké“ či „parazitické“ DNA v B chromosomech vedl k představě, že se jedná o ve své podstatě parazitické genetické entity, jejichž jedinou úlohou v genomu je se replikovat a šířit do dalších generací. Důležitou vlastností B chromosomů je to, že se neúčastní rekombinace, podobně jako pohlavní chromosom Y. Podle některých představ dokonce z pohlavních chromosomů mohly vzniknout nebo naopak daly vznik pohlavním chromosomům. To bylo dokonce prokázáno u drozofily, kde tzv. 35 „ancestrální“ chromosom Y vznikl z B chromosomu, jež se začal párovat s X chromosomem po zániku původního Y chromosomu. 3.9. Repetice – podstatná složka genomu Podstatnou část genomů tvoří opakující se sekvence DNA, tzv. repetice. Vyskytují se ve dvou základních typech organizace: tandemově uspořádané a rozptýlené. Tandemově uspořádané repetice se dělí dále na mikrosatelity, minisatelity a satelity; někdy se hovoří o megasatelitech. Ty mohou tvořit úseky dlouhé až stovky milionů bází. Předpokládá se, že tandemové repetice vznikly expanzí progenitorových sekvencí buď při replikaci „prokluzováním“ polymerázy (u mikrosatelitů), anebo rekombinačními procesy. Většina rozptýlených repeticí je tvořena mobilními DNA elementy, buď retroelementy, šířícími se prostřednictvím RNA intermediátu, nebo DNA transposony. Retroelementy představují dominantní typ sekvencí DNA, u některých druhů tvoří více než polovinu jejich genomů. Jedná se o archaické parazitické DNA elementy množící se mechanismem „zkopíruj a vlož“, které zřejmě představují pozůstatky dávného světa, kdy byly nosičem genetické informace molekuly RNA. Existence repeticí v genomech je velkou záhadou. Pokud jde o jejich funkci stojí proti sobě dva názory. Podle jednoho mají repetitice nějakou zatím neznámou funkci, např. ve struktuře chromatinu, či jiné kontrolní funkce. Druhá představa se dívá na repetice jako na DNA bez funkce, která se replikuje bez ohledu na to, zda je to pro organizmus užitečné či nikoliv, a genom tak expanduje až do mezí tolerovatelných daným organizmem 3.10. Změny ve velikosti genomů, plynulost nebo skoky Velikost genomu je dána výslednicí působení protichůdných mechanizmů vedoucích k jejich zvětšování, resp. zmenšování. Při pohledu na velikosti genomů jednotlivých taxonů je zřejmé, že existuje jasný trend zvětšování genomů v průběhu evoluce. Tento trend se uplatňuje v evoluci života na Zemi zejména v průběhu posledních stovek milionů let a zřejmě nějak odráží větší schopnost větších genomů reagovat na měnící se vnější podmínky. Za růst genomů jsou zodpovědné především dva základní procesy. Prvním je duplikace, celého genomu, polyploidizace, která bývá někdy opakovaná. Obzvláště u rostlin jde o poměrně běžný jev, uvádí se, že asi 70% druhů angiosperm prošlo ve své evoluci alespoň jednou duplikačním procesem. K duplikaci genomu došlo i u obratlovců, kdysi dávno byl zdvojen i genom kvasinky. Následně po polyploidizaci dochází často k restrukturalizacím genomu, což může někdy vést ke tvorbě nových genových komplexů, a tak ke zrychlení evoluce. Polyploidizace je evolučně úspěšná snad i proto, že vede ke zvýšení počtu všech genů stejně, aniž by drasticky ovlivnila rovnováhu mezi geny. Druhým klíčovým mechanizmem zvětšování genomů je amplifikace jeho částí. Jedná se jednak o expanze krátkých opakování několika nukleotidů (mikrosatelitů), především pak o duplikace mobilních elementů, z nichž nejrozšířenější jsou tzv. retroelementy. Zatímco polyploidizace vede ke znásobení veškeré genetické informace organizmu, tedy také genů, amplifikace zmnožuje většinou jen tzv. “sobeckou“ DNA. Retroelementy, starobylé relikty dávného světa RNA, se totiž šíří po genomu duplikativně prostřednictvím molekul RNA jako intermediátů a zanechávají přitom své kopie na původních místech. Tak jsou schopny během evolučně krátkého období okupovat značnou část hostitelského genomu. Byla zjištěna zajímavá korelace mezi velikostí genomu a teplotním režimem. Arktické druhy či populace – lososovité ryby, zooplankton (Daphnia, Bosmina) či rostliny v polárních oblastech byly polyploidní, zatímco jejich příbuzní v teplých oblastech byly jen diploidní. Existuje korelace velikosti genomu a některých fenotypových znaků. Velikost genomu pozitivně koreluje s velikostí buněčného jádra, s velikostí buňky (tzv. nukleotypický efekt), s dobou mitózy a meiózy, s velikostí semen. Naopak byla prokázána negativní korelace 36 s morfologickou komplexitou mozku u žab a mloků nebo s rychlostí bazálního metabolismu u obratlovců. Zde se často uvádí jako příklad malý genom ptáků a netopýrů, tedy organizmů s rychlým metabolismem při letu, v protikladu k malým genomům ryb, které estivují za hypoxických podmínek. 3.11. Polyploidizace – výhody a nevýhody Polyploidi jsou organismy se znásobenou sadou chromozomů. Ačkoli je fenomén polyploidie mnohem výraznější a významnější u rostlin není výjimkou ani u vyšších živočichů (zvláště u ryb a obojživelníků). Základní výhodou polyploidizace v kontextu evoluce je určitá destabilizace genomu, která skýtá větší prostor pro adaptivní evoluční procesy pod selekčním tlakem. Tato fáze bývá často následována zpětnou tendencí k funkční i strukturní diploidizaci a tudíž k redukci genomu. Po duplikaci genů během polyploidie může docházet k prostoru ke vziku genů s novou funkcí (neofunctionalization) nebo k potlačení aktivity rodičovské (rodičovských) kopie (subfunctionalization). Obecně se uvádí jako hlavní výhoda polyploidie heterozní efekt, zvětšený počet genů (redundance v pozitivním slova smyslu, kdy je v systému větší množství prvků, se kterými lze operovat) a určitá propojenost s nepohlavním rozmnožováním. 37 3.12. Polyploizace v linii obratlovců, rostlin a kvasinky Polyploidie se zjevně nebo skrytě vyskytuje jak v rostlinné tak v živočišné říši. Polyploid je zjednodušeně řečeno organismus obsahující více než obvyklé dvě sady chromosomů. Výskyt polyploidie je ovšem převážně spjat s evolucí rostlinných genomů. 38 V živočišné říši se pokusil prokázat existenci a úlohu duplikace genomů během fylogeneze již Susumo Ohno (1970). Ohno vytvořil model, který naznačuje, že člověk je oktaploidní organizmius. Ukazuje, že první duplikace (tetraploidizace) proběhhla u raných chordát a druhá během oddělení ryb a obojživelníků. Ohno vycházel ze dvou základních parametrů: komplexity izoenzymů a velikostí genomů. Zvláště druhý parametr je z dnešního pohledu irelevatní jako měřítko komplexity organismů. Pozdější revize zmíněného modelu se zaměřily na analýzu velikosti jednotlivých genových rodin a ukazují, že první duplikace se netýkala ještě kopinatců a druhá se udála po oddělení chrupavčitých a kostnatých ryb (Holland 1994). Ve světle údajú ze sekvenačních projektů, které odhadují, že háďátko (Caenorhabditis elegans) má přibližně 19000 genů a drozofila (Drosophila melanogaster) 13600 genů se zdá být pravděpodobné že mezi prvními strunatci (sumka Ciona intestinalis), která má 15500 genů se žádné globální multiplikace genomu neudály. Nedá se ovšem očekávat, že sledování počtu genů přesně odhalí počet duplikací genomu mezi jednotlivými organismy. Kvůli udržení expresní rovnováhy dochází často k eliminaci redundantních kopií jednotlivých genů u polyploidů. Pokud bychom porovnali počet genů již zmíněné sumky (15500) a porovnaly s počtem genů člověka (34000) a předpokládaly že během každé duplikace polovina duplikovaných genů bude eliminována, zjistíme, že počet genů člověka přesně odpovídá oktoploidnímu stavu. K podobným duplikacím došlo také v genomech rostlin před 100-200 miliony let. U Arabidopsis thaliana leží 60% genomu v duplikovaných oblastech. U rostlin je známa řada tetraploidů (kukuřice, bavlna, brambor, zelí), hexaploidů (pšenice, chryzantéma) či oktoploidů (jahodník). Je pozoruhodné, že dokonce i v genomu kvasinky bylo nalezeno 54 dlouhých duplikovaných segmentů, přičemž drtivá většina z nich si zachovala stejnou orientaci vzhledem k centromeře. Protože nebyly nalezeny žádné triplikované segmenty a příbuzné 39 druhy (Kluveromyces waltii a Ashbya gossypii) tyto duplikace neobsahovaly, předpokládá se, že i u předků kvasinky došlo k polyploidizaci. Bylo také zjištěno, že některé z duplikovaných genů se vyvíjejí mnohem rychleji ve srovnání se svými homology u příbuzného druhu Kluveromyces waltii. 3.13. Genomová obezita rostlin a „big bang“ v genomu kukuřice Narůstání genomů do obřích rozměrů je vlastností vyšších eukaryot. Přestože byly popsány různé mechanizmy vedoucí ke zmenšování genomů (např. delece způsobené nerovnoměrnou rekombinací), zdá se, že převažují procesy vedoucí k zvětšování genomů. Tento trend je zřejmý především u rostlin, kde se někdy mluví o jednosměrném procesu vedoucím k obezitě rostlinných genomů. V mnoha případech bylo prokázáno, že k explozím šíření retroelementů došlo dokonce pouze v průběhu posledních několika milionů let, což je v evolučním měřítku pouhý okamžik. Nedávno bylo např. prokázáno, že u kukuřice došlo v průběhu posledních 6 milionů let k periodickým explozím retroelementů, jejichž počet dosáhl několika desítek tisíc kopií. Je pozoruhodné, že nové kopie retroelementů byly téměř vždy včleněny do již existujících retroelementů. To lze chápat jako obranu proti negativnímu působení přírodního výběru. Existují však i mobilní elementy, které se vyskytují nejčastěji poblíž nebo uvnitř genů. Některé druhy se dokáží bránit okupaci svých genomů retroelementy, nebo je dokáží dokonce ze svého genomu aktivně odstraňovat, a tak si zachovávají štíhlou linii. Základním dosud známým mechanizmem je metylace retroelementů, což vede k jejich „umlčení“ a znemožnění jejich dalšího šíření po genomu. Genom zřejmě disponuje i mechanizmy aktivního odstraňování některých svých oblastí, čímž se brání růstu velikosti. Tyto mechanizmy jsou na bázi rekombinace a důležitou roli zde zřejmě hrají rozptýlené repetice, které se nacházejí na různých místech genomu. Mezi nimi pak dochází k homologickému párování v procesu tzv. nerovnoměrného crossing-overu (unequal crossing-over). Pokud tyto dvě vzdálené repetice ležící na témže chromosomu, může dojít k deleci mezilehlé oblasti. Tento mechanizmus je také někdy označován jako ektopická rekombinace a je možná klíčovým mechanizmem vedoucím ke zmenšování velikosti genomů a alespoň částečně kompenzujícím jeho neustálý růst. Důsledkem rekombinačního odstraňování úseků DNA je existence osamělých dlouhých koncových repeticí, tzv. „solo“ LTR, retrotransposon. Původní retroelementy mají vždy dvě dlouhé koncové repetice (LTR) nacházející se na jejich koncích. Pokud mezi nimi dojde k rekombinaci a odstranění mezilehlé oblasti, zůstanou v genomu jako otisky dávných retrotransposonových inzercí osamělé („solo“) LTR. Dokonce se ukázalo, že mezi delšími LTR dochází k rekombinaci častěji, což způsobilo, že retrotransposony jsou selektovány tak, aby jejich LTR byly spíše kratší. 3.14. Proměnlivost velikosti genomu v rámci druhu Ke změně obsahu DNA může dojít i v rámci téhož jedince, a to jak ke zvýšení tak i ke snížení obsahu DNA. Příkladem zvýšení obsahu DNA je endpolyploidie a polytenie. Dobře známy jsou polytenní chromosomy slinných žláz drozofily. U rodu Daphnia dochází ke tkáňově specifickým rozdílům v ploidii v rozmezí 2-2048C, což má vliv na velikost vajíčka a na morfologii hlavy indukovanou predátorem. U Bombyx mori se nacházejí polyploidní buňky (1 000 000x) ve žlázách produkujících hedvábí. I zde existuje korelace mezi ploidií a velikostí buňky. Ke snížení obsahu DNA může dojít v některých somatických buňkách u nematod, bičíkovců nebo dvoukřídlých. Například somatické buňky u Cyclops strenuus mají pouze 5% obsahu DNA oproti oplozenému vajíčku. Nabízí se vysvětlení z hlediska „sobecké“ DNA, kdy je logická delece DNA ze slepé somatické linie a ne v zárodečné linii. Je to nádherný příklad toho, jak repetitivní DNA může významně ovlivnit genetické mechanizmy svého 40 „hostitele“. Pozoruhodné je i to, že dochází ke změně obsahu DNA během života jako odpověď na stimuly prostředí, což odpovídá spíše představám Lamarcka než Darwina. 3.15. Kolinearia (syntenie) Srovnávací analýza genomů vedla k pozoruhodnému zjištění: pořadí genů v genových ostrovech je často konstantní, a to i u vzdálených druhů. Tomuto jevu se říká kolinearita nebo také syntenie. Existují pochopitelně menší či větší odchylky, které jsou způsobené různými lokálními přestavbami, jako je například převrácení pořadí genů, tzv. inverze DNA. Míra konzervativnosti pořadí genů je však někdy taková, že se geny do genetických map určitých oblastí dají zakreslovat v podobě soustředných kružnic, na nichž se v totožných polohách nacházejí totožné geny. To platí například pro obiloviny, a to i přesto, že se velikosti jejich genomů za pouhých 60 milionů let evoluce, které je dělí od společného předka, dramaticky rozrůznily. Vždyť genom rýže je velký pouhých 430 Mbp, zatímco ječmen má 2600 Mbp a pšenice se dokonce honosí obřím genomem o velikosti 14 000 Mbp. Je pozoruhodné, že ani takové množství repetitivní DNA tvořící 80% genomu (případ pšenice) nezpůsobilo erozi původního pořadí genů. Současná genomika kolinearity genů s úspěchem využívá při mapování genomů. Informaci o polohách genů získanou z malého genomu, který je již osekvenován, lze použít při studiu velkého genomu, jehož sekvenování je zatím neekonomické. Takto lze extrapolovat i mnohé známé genové funkce, čímž se otvírá široké pole aplikací například při vytváření rostlin rezistentních k patogenům či při léčbě lidských nemocí. Zatímco struktura dlouhých úseků (makrokolinearita) bývá často značně konzervativní, mikrostruktura (mikrokolinearita) je více dynamická. Zejména polyploidizace značně urychlí evoluci této mikrostruktury. Byly prokázány rozdíly (např. duplikace genů, inverze) u druhů, které divergovaly před pouhými několika miliony let. Rozdíly lze pozorovat dokonce i mezi různými ekotypy téhož druhu, zejména pokud jde o oblasti podléhající rychlé evoluci. Takovou oblastí je u Arabidopsis thaliana např. oblast rezistence k patogenu Perenospora parasitica, jejíž struktura se značně liší mezi ekotypy Lansberg erecta a Columbia, kde došlo k rozrůznění v důsledku duplikací genu RPP5, přeměně řady jeho kopií v pseudogeny a k akumulaci mobilních elementů. Je logické, že oblast rezistence k patogenu, která je klíčová z hlediska přežití organizmu, podléhá rychlejší evoluci. Mechanizmy výše uvedených chromosomových přestaveb fungují zřejmě na bázi rekombinace DNA, tedy zlomu a znovuspojení (crossing-over). Tak dochází k delecím, duplikacím, inverzím i translokacím. 41 3.16. Distribuce genů v genomech Zatímco v malých genomech eukaryot jsou geny v přibližně konstantních vzdálenostech (např. u rostliny Arabidopsis thaliana je to vzdálenost asi 5 kb), u velkých genomů je tomu jinak. Geny nejsou rozloženy rovnoměrně, nýbrž se shlukují do určitých oblastí. Tvoří tak jakési ostrovy genů uprostřed moře ostatní DNA, většinou repetitivní a méně probádané. Tyto genové ostrovy se často nacházejí poblíž konců chromozomů. Ukázalo se, že vzdálenosti mezi jednotlivými geny v těchto shlucích jsou podobné vzdálenostem mezi geny v malých genomech. To je v rozporu s původním očekáváním, že ve velkých genomech budou mezi jednotlivými geny jednoduše ve větších vzdálenostech. Shluky genů tak připomínají shluky hvězd v galaxiích oddělených navzájem černou hmotou tvořenou převážně starobylými mobilními sekvencemi DNA, retroelementy. Je pozoruhodné, že nové kopie retroelementů se téměř vždy včleňují do již existujících retroelementů, neboť inzerce do genů by mohla být pro jejich hostitele a potažmo i pro samotné retroelementy fatální. Až hlubší analýza dat pocházejících z genomových projektů ukáže, zda snad neexistuje analogie s chováním galaxií, totiž, zda se v důsledku inzercí retroelementů do jiných retroelementů geny nevzdalují v genomu tím rychleji, čím jsou od sebe více vzdáleny. Nezapomeňme však, že genom je sice tvořen lineárními molekulami DNA (jejich počet odpovídá počtu chromozomů), ale pro fungování genomu je klíčové jeho dynamické trojrozměrné uspořádání. 3.17. Izochory Genom má mozaikovou strukturu tvořenou různými segmenty DNA a připomíná tak fraktály – obrazce jejichž vzhled je podobný bez ohledu na použité měřítko (rozlišení). Podle izochorového modelu jsou genomy obratlovců a rostlin (a možná i nižších eukaryot) tvořeny segmenty o délce přibližně 300kb s charakteristickým zastoupením bází odlišným od sousedních segmentů. Průběh obsahu bází, např. GC obsah, tak má skokovitý charakter, zahrnující oblasti s víceméně stejným obsahem, který prudce přechází do oblasti s odlišným obsahem. S touto představou přišel již v 60. letech Giorgio Bernardi a dlouho poté byla předmětem bouřlivých debat. V genomu člověka se rozlišuje pět oblastí – L1 a L2 s nízkým obsahem GC, a oblasti H1, H2 a H3 s vysokým GC-obsahem. Je pozoruhodné, že oblast H3 tvoří jen 3% genomu a obsahuje 25% genů. 42 Existence izochor se vysvětluje nejčastěji třemi možnými mechanizmy – mutačním biasem, selekcí a genovou konverzí. Mutační představa tvorby izochor vychází z toho, že včleňování nukleotidů při replikaci je ovlivněno koncentrací volných nukleotidů, ta zase závisí na poloze v jádře a dále je známo, že různé části genomu jsou replikovány v různou dobu. Výsledkem je pak odlišný obsah bází v určitých částech genomu. Dalšími příbuznými mechanizmy může být různá účinnost reparace DNA a také deaminace cytosinu na uracil, která je častější v ATbohatých oblastech. Podle jiné teorie izochory nevznikají aktivně mutacemi,ale jsou až výsledkem selekce. Ta například může působit na úrovni teplotní stability DNA. Představu selekce podporuje srovnání starých a mladých inzercí mobilních Alu elementů u člověka. Ukázalo se, že zatímco mladé Alu elementy jsou GC-chudé, staré Alu elementy jsou naopak GC-bohaté, což se vysvětluje právě selekcí. Posledním mechanizmem, kterým vědci vysvětlují tvorbu izochor, je genová konverze. Je to proces na bázi rekombinace, kdy je určitá oblast DNA (např. alela) přeměna (konvertována) na jinou podle určitého vzoru za vzniku dvou totožných oblastí. Výsledkem je homogenizace těchto oblastí. Představa, že genová konverze se může podílet na tvorbě izochor pramení z poznatku, že existuje korelace mezi frekvencí rekombinace a obsahem GC, což vede ke zvyšování GC-obsahu. V oblastech, které přestaly rekombinovat, dochází k poklesu GC obsahu, což bylo pozorováno u některých genů na chromosomu Y. 43 Kapitola IV.: EVOLUCE GENŮ 4.1. Historie konceptu genu 4.2. Definice genu, typy genů, složené geny 4.3. Základní struktura genu 4.4. Velikosti genů, počty a velikosti exonů a intronů 4.5. Alternativní sestřih a kuriózní uspořádání genů 4.6. Jsou introny evolučně staré anebo mladé struktury? 4.7. Genové rodiny, pseudogeny, orfony 4.8. Počty genů v genomech 4.9. Nekódující RNA (ncRNA), miRNA, siRNA, RNAi 4.10. Vznik nových genů, úloha duplikací v evoluci genomů 4.11. Geny nedávno vzniklé na příkladu genů jingwei, sphinx, Sdic a AFGP 4.12. Vznik AFGP genu a konvergentní evoluce 4.13. Vznik nových genů štěpením a fúzí 4.14. Vznik nových genů řízenou evolucí 4.15. Horizontální genový přenos 4.1. Historie konceptu genu V dnešní době chápeme gen jako základní funkční jednotku genetické informace zapsanou v sekvenci nukleotidů DNA nebo RNA. Když Mendel postuloval zákony pro přenos genů z rodičů na potomky sám ještě nepoužíval termín geny, ale hovořil o faktorech, které určují určité vlastnosti či znaky. Na počátku 20. století Morgan ukázal, že geny se nacházejí ve vazbových skupinách odpovídajících chromosomům a že jsou na chromosomu uspořádány lineárně za sebou. Roku 1928 Griffith proslulými transformačními experimenty na bakteriích prokázal, že geny lze přenášet z bakterie na bakterii. Jako substance zodpovědná za přenos genů byla identifikována DNA (Avery, MacLeod, McCarthy,1944, Hershey a Chaseová, 1952). To znamenalo pád dosud uznávané proteinové hypotézy genu - Caspersonovy teorie, podle níž je třeba hledat chemickou podstatu genu ve struktuře proteinů, neboť DNA obsahující pouze čtyři nukleotidy genetickou informaci nést nemůže (tetranukleotidová teorie DNA). V roce 1941 Beadle a Tatum ukázali, že mutace v genech mohou vést ke změnám v metabolických drahách a formulovali hypotézu „jeden gen – jeden enzym“, podle níž jednotlivé geny kódují jednotlivé proteiny. Roku 1953 byla objasněna struktura DNA (Watson a Crick), na jejímž základě bylo možné vysvětlit základní funkce genu – kódování informace, replikaci a mutabilitu. Následně byla objevena řada různých druhů molekul RNA a Francis Crick formuloval centrální dogma molekulární biologie (genetická informace se přenáší ve směru DNA-RNA protein) a teorie proteosyntézy (Crick 1958). V témže roce byl podán experimentální důkaz semikonzervativní replikace (Meselson a Stahl 1958) a v roce 1961 navržena operonová teorie (Jacob a Monod, 1961).V průběhu 60. let byl rozluštěn genetický kód (Nirenberg, Khorana, Ochoa, 1966) a v podstatě položeny základy nového oboru – molekulární biologie. Na počátku 70. let byly zkonstruovány první rekombinantní molekuly DNA a začala tak éra genového inženýrství (Cohen, 1973) trvající dodnes. Během 90. let se postupně zformoval další nový obor - genomika - studující geny v kontextu celých genomů. V rámci tzv. genomových projektů byla poznána kompletní genetická informace celých genomů, nejprve virů, později bakterií a následně mnoha eukaryotických organizmů počínaje kvasinkami až po rostliny a živočichy včetně člověka a šimpanze. 4.2. Definice genu, typy genů, složené geny Geny jsou základními funkčními jednotkami genetické informace. Vyskytují se jako strukturní geny kódující primární strukturu polypeptidu nebo geny pro RNA, kódující transferovou nebo ribozomální RNA (tRNA, rRNA). Definice genu různých autorů se stále liší. Je jasné, že genem je vždy úsek nukleové kyseliny – DNA u všech autonomních forem 44 života a jen u některých RNA virů je to molekula RNA. Podle nejširší definice se za gen považují všechny sekvence potřebné k syntéze funkční bílkoviny nebo molekuly RNA, tedy i oblasti regulační a signální. Podle jiných definic se genem rozumí sekvence přepisované (transkribované) z DNA do RNA. Konečně, podle nejužší definice jsou genem pouze sekvence, které přímo určují pořadí aminokyselin v proteinech nebo pořadí nukleotidů ve funkčních molekulách RNA (posttranskripčně upravených molekulách tRNA, rRNA, snRNA, snoRNA, miRNA atd.). U většiny eukaryotických genů není informace zapsána v souvislém sledu nukleotidů, ale je rozdělena do částí kódujících a nekódujících proteiny. Jedná se o tzv. složené geny, tvořené exony a introny. Exony (název pochází z „expressed sequence“) jsou úseky, jejichž transkripty jsou po sestřihu RNA v mRNA zachovány. Naopak introny (název pochází z „intervening sequence“) jsou z primárního transkriptu vyštěpeny procesem sestřihu. Sestřih probíhá za účasti ribonukleoproteinových částic označovaných jako snRNP (viz kapitola II „Relikty světa RNA“), při čemž dojde k vychlípení intronu v podobě smyčky a ke spojení sousedních exonů. Některé introny – introny I., II. a II. skupiny – jsou považovány za ribozymy - katalyticky aktivní molekuly RNA, schopné samostatného sestřihu (viz kapitola I „Vznik života“). Introny se nacházejí nejen v jaderných genech kódujících proteiny, ale i v genech pro rRNA a tRNA, a také v mitochondriálních genech nižších eukaryot. Introny byly nalezeny i v genech bakterií a bakteriofágů. V prokaryotických genomech jsou však vzácné, nacházejí se pouze v genech pro tRNA a rRNA a to se jedná o samovystřihující se introny I. a II. skupiny. 4.3. Základní struktura genu Mezi geny prokaryot a eukaryot existují značné rozdíly. Hlavním rozdílem je kromě přítomnosti intronů v genech eukaryot uspořádání prokaryotických genů do operonů – jednotek obsahujících několik genů, které jsou transkribovány najednou. Před genem se nachází regulační sekvence - promotor. Na promotor se váže RNA polymeráza zajišťující transkripci přilehlého genu. Promotor obsahuje konvenční sekvence TATAA v oblasti -10 (označuje se také jako Pribnowův box) a sekvenci TTGACA v oblasti -35. Síla promotoru určuje intenzitu transkripce a závisí na tom, jak se promotor podobá uvedeným konvenčním sekvencím. Místo zahájení transkripce a zahájení translace nejsou shodná. Oblast mezi 5‘koncem mRNA a místem zahájení translace (prvním kodonem) se označuje jako vedoucí sekvence. Vedoucí sekvence obsahuje tzv. Shine-Dalgarnovu sekvenci (AGGAGG), pomocí níž se následně mRNA váže na 16S rRNA ribozómu. Podobná netranslatovaná sekvence se nachází i na 3‘-konci transkriptu a označuje se jako koncová sekvence. Za vedoucí sekvencí následují jednotlivé geny. Ty jsou vždy vymezeny iniciačním a terminačním kodonem. Jak bylo uvedeno výše u prokaryot transkript obsahuje více genů. Tak jako se na začátku transkripční jednotky se nachází promotor, na jejím konci leží terminátor. Terminátor zajišťuje zakončení transkripce genu a uvolnění transkriptu a RNA polymerázy z matricového DNA řetězce. Existují dva typy terminátorů lišící se tím zda jsou nebo nejsou závislé na tzv. Ró-faktoru (rho factor), proteinu důležitém pro uvolnění RNA polymerázy z DNA. Terminátorová sekvence RNA obsahuje obrácené repetice, což umožní intramolekulární párování komplementárních bází a vznik terminátorové vlásenky se smyčkou. Terminátory nezávislé na ró faktoru obsahují za vlásenkou úsek tvořený několika uracily. V některých případech může dojít k předčasné terminaci – tzv. atenuaci. Některé geny obsahují ve své vedoucí sekvenci (na 5-konci genu) sekvenci, která po přepisu do RNA může za určitých podmínek vytvořit smyčku s vlásenkou – atenuátor – která předčasně zastaví transkripci. 45 4.4. Velikosti genů, počty a velikosti exonů a intronů Zatímco exony jsou dlouhé většinou jen několik stovek bází, introny mohou dosahovat délek až desítek tisíc bází a tvoří tak podstatnou část délky genu. Velikost genu se pohybuje většinou v kilobázích u nižších eukaryot (většinou do 2kb) a v jednotkách až desítkách kilobází u živočichů. Geny rostlin jsou ve srovnání s geny živočichů kratší. Značné délky některých genů jsou způsobeny přítomností dlouhých intronů, neboť součet kódujících úseků, resp. délka mRNA, jsou podobné u dlouhých i krátkých genů. Za příklad extrémně krátkého genu lze považovat bakteriální antibiotikum mikrocin C7 dlouhý 21 nukleotidů, který je nesen plazmidem bakterie E. coli a kóduje oligopeptid o sedmi aminokyselinách. Tento gen je transkribován spolu s dalším mikrocinovým genem, translatován je však jako samostatný gen. Translace začíná zařazením N-formylmethioninu jako u všech pravých bakteriálních bílkovin. Pozoruhodná je i konzervativita exonů ve srovnání s variabilitou intronů, čehož se využívá i při hledání exonů. Počet exonů resp. intronů vzrůstá s rostoucí složitostí organismů. Zatímco kvasinka má jen několik procent genů složených, u zástupce hmyzu Drosophila melanogaster většina genů obsahuje introny a u savců je přes 90% genů složených, obsahujících často i desítky intronů. Délky exonů jsou mnohem nižší oproti délkám celých genů a většina nepřesahuje 100 aminokyselin, což platí zejména u obratlovců a rostlin. Většinu z celkové délky genů tedy tvoří introny. Jejich délka se pohybuje v rozmezí od několika stovek bází, tedy délka srovnatelná s délkami exonů, až po desítky kilobází. Extrémním případem je lidský gen pro dystrofin dlouhý 2,4Mb obsahující desítky intronů z nichž nejdelší má 32kb. Zatímco u savců jsou mnohdy v genech desítky exonů, u hmyzu jejich počet většinou nedosahuje deseti. 4.5. Alternativní sestřih a kuriózní uspořádání genů Pojem exonů a intronů je relativní a úsek, který je v jednom případě exonem může být jindy intronem a naopak. Určitý úsek DNA může být v závislosti na čase a místě (např. různé tkáně nebo pohlaví) sestřižen různým způsobem za vzniku odlišných produktů. Jedná se o tzv. alternativní sestřih. Kombinací velkého počtu exonů a intronů lze vytvořit obrovské množství různých produktů. Podobný proces, kde však k této kombinaci dochází již na úrovni DNA, se uplatňuje při tvorbě protilátek (VDJ rekombinace). K alternativnímu sestřihu je nutné ještě připočíst skutečnost, že transkripce může začínat i končit na různých místech 46 téhož úseku DNA. Při transkripci se využívají alternativní promotory, které mohou měnit 5‘konec transkriptu, anebo naopak se uplatňují alternativní terminátory, určující různá místa jeho 3‘-konce. Příklady kuriozního uspořádání genů jsou jednak překrývající se geny, které se občas vyskytují v kompaktních genomech virů a vzácně i v genomech vyšších organismů; dále jsou to geny nacházející se v intronech jiných genů. Gen hrající roli při neurofibromatose I. typu (neurofibromatosis type I gene) má dlouhý intron, v němž se nacházejí tři další krátké geny (OGMP, EVI2B a EVI2A), každý z nichž má také svůj intron. Tyto geny jsou přepisovány v opačné orientaci než gen v němž leží. 47 4.6. Jsou introny evolučně staré anebo mladé struktury? Existují protichůdné názory na to, zda introny jsou struktury starobylé či mladé. Skutečnost, že se introny vyskytují u eukaryot a chybí u prokaryot lze totiž vysvětlit dvěma způsoby. Buď se včlenily až do genů eukaryot nebo byly z genů rychle se dělících prokaryot odstraněny. Většina vědců se dnes kloní k představě, že introny jsou starobylé struktury, které jsou součástí genomů již miliardy let. Některé nejnovější názory však poukazují na to, že introny jsou původně parazitické elementy, které se včlenily do genů eukaryot až nedávno. Na jedné straně stojí názory, podle nichž jsou introny evolučně mladé struktury. V rámci této představy se lze dále na introny dívat také z jiného úhlu, zda jde o elementy pro hostitelský genom nějak užitečné nebo naopak se jedné o parazitické elementy. Podle jedné představy jsou introny genomoví parazité, kteří buňce nepřinášejí žádný užitek. Kopírují se v genomu z místa na místo a protože nekódují virový kapsid (jako např. retroviry) nemohou se šířit horizontálně, ale pouze v rámci téhož genomu a v populaci pak vertikálně z rodičů na potomky. Z tohoto pohledu je sestřih mechanizmem zajišťující, aby introny nezabíjely buňku. Spliceosom – komplex zajišťující vystřižení intronů - je sice kódován buňkou, původně se však mohlo také jednat o autonomní parazitické elementy typů virů nebo transposonů. Podle jiných představ jsou introny svým genomům užitečné. Nejčastěji se mluví o pozitivním vlivu na rychlost evoluce, podle některých autorů dokonce vznik intronů stojí v pozadí vzniku eukaryot. Je zřejmé, že existence exonů a intronů dává genomům stavebnicový charakter umožňující kombinovat jednotlivé strukturní a funkční domény procesem genové rekombinace. V opačném případě, u genů bez intronů, by k rekombinaci docházelo v libovolné místě, což by vedlo k nefunkčním produktům. Další výhoda intronů může souviset s existencí histonů u eukaryot. Na nich jsou totiž navinuty dlouhé úseky DNA, které jsou nepřístupné pro regulační proteiny. Introny mohou posunout regulační oblasti tak, aby mohly s těmito proteiny interagovat. Introny mohou hrát i důležitou roli tím, že brání potenciálně fatálním důsledkům nelegitimní rekombinaci. Při ní dochází ke genetické výměně mezi homologickými oblastmi, které se nacházejí v různých lokusech, např. paralogních genech. Tomu lze zabránit právě vložením intronů do různých pozic jinak homologických genů. 48 Na druhé straně stojí názory, považující introny za struktury staré, přítomné již v primitivních genech. Tuto představu podporuje zjištění, že některé sekvenční motivy se nacházejí v genech bez ohledu na přítomnost exonů a intron. To, že tyto často starobylé motivy přesahují hranice exonů a intronů, spíš svědčí o jejich současném vzniku. Diferenciace původní souvislé sekvence na introny a exony může umožnit kódovat delší proteinové řetězce nepřerušované terminačními kodony. 4.7. Genové rodiny, pseudogeny, orfony Většina genů se v genomu vyskytuje v jedné kopii případně několika málo kopiích. Některé geny se však v genomu mnohonásobně opakují, uspořádané v tandemu na témže chromosomu. Jedná se o geny, jejichž produkty buňka potřebuje ve značném množství – histony a geny pro ribozomální RNA (rRNA). Například obojživelníci, jejichž embryonální vývoj je extrémně rychlý, mají mnohonásobně vyšší počet kopií genů pro histony, než ptáci a savci, jejichž buňky se v embryonálním stádiu tak rychle nedělí. V některých případech může dojít k sekvenční divergenci jednotlivých kopií tandemově uspořádaných genů. Pak se jedná o genovou rodinu, což je skupina sekvenčně podobných genů majících společný evoluční původ a stejnou biologickou funkci. Často jsou geny jedné rodiny exprimovány v různých stadiích vývoje organismu. Nejznámějšími zástupci jsou geny pro syntézu globinů, aktinu, ovalbuminu. Několik příbuzných rodin může tvořit nadrodiny. Pokud se člen genové rodiny nachází ojediněle v genomu v místě vzdáleném od ostatních členů rodiny, hovoříme o tzv. orfonech (orphan – sirotek). Za členy genové rodiny jsou považovány i tzv. pseudogeny, neaktivní kopie původně funkčních genů. Za pseudogen se často označuje sekvence homologická s genem, která však nekóduje funkční produkt. To ale neznamená, že pseudogen nemůže plnit nějakou funkci. Byl popsán kuriózní případ, kdy byl pseudogen exprimován a ovlivňoval stabilitu RNA svého funkčního homologa a fungoval tak tedy jako důležitá regulační RNA. Pseudogeny vznikají buď duplikací původního genu a následnou degenerací jedné kopie, tento pseudogen není upraven posttranskripčními úpravami a obsahuje tedy i intronové sekvence. Druhou možností 49 je vznik pseudogenu retrotranspozicí, kdy takto vzniklý pseudogen introny neobsahuje. Je zajímavé, že „poločas rozpadu“ genů je delší u rostlin než u živočichů. Například v genomu člověka se nachází asi 19 000 pseudogenů. 4.8. Počty genů v genomech Počty genů v genomech zhruba odrážejí komplexitu organismu. Virové genomy obsahují jednotky až desítky genů, maximálně něco přes 100 genů. Prokaryotické genomy nesou od několika stovek (Mycoplasma genitalium – 470 genů) do několika tisíc genů (E. coli - 3000 genů). Nižší eukaryota obsahují tisíce genů (kvasinka 6000 genů), vyšší eukaryota desítky tisíc genů. Přečtení kompletní informace genomů několika vyšších eukaryot ukázalo, že různé organismy mají podobné počty genů, a to i přesto, že byly v evoluci separovány po stovky milionů let. Člověk má 20 000 – 40 000 genů, ostatní obratlovci mají genů o něco méně, červ Caenorhabditis elegans a moucha Drosophila melanogaster mají do 20 000 genů. Vzhledem k tomu, že některé geny se vyskytují ve více kopiích a tvoří genové rodiny, se zdá, že přibližně 10 000 typů proteinů vytváří kompletní proteinovou sadu (tzv. proteom) jakékoliv mnohobuněčného organismu. 4.9. Nekódující RNA (ncRNA), miRNA, siRNA, RNAi Velké pozornosti se v poslední době těší tzv. nekódující RNA molekuly (ncRNA), které byly identifikovány jak experimentálně tak i nalezeny v genomových databázích pomocí nástrojů bioinformatiky. Podle některých by mohly tyto molekuly RNA představovat komplexní regulační systém paralelní s regulačními systémy na bázi proteinů. Jejich existence by také mohla vysvětlit i vyšší složitost savců oproti nižších organizmům (hmyz, červi) při zachování podobného počtu genů. Nejznámějšími představiteli nekódujících molekul RNA jsou miRNA (microRNA) a siRNA (small interfering RNA). Jedná se o dvouřetězcové molekuly RNA o délce 21-26 párů bází, které vznikají z delších dvouřetězcových RNA prekurzorů štěpením enzymem označovaným jako Dicer. Pracují pak v kombinaci s proteiny vážícími se na RNA za vzniku komplexu označovaného jako RISC (RNA induced silencing complex). Jak miRNA tak i siRNA při svém fungování využívají mechanizmu protismyslné (antisense) nukleové kyseliny, a tak sekvenčně-specificky inhibují translaci či integritu cílové mRNA. Tento jev se nazývá RNA interference (RNAi) a uplatňuje se při širokém spektru procesů od odpovědí na patogenní exogenní i parazitické endogenní nukleové kyseliny přes genovou regulaci až po ovlivňování struktury chromatinu; od regulace počtu bakterií až po inaktivaci chromosomu X u savců. 4.10. Vznik nových genů, úloha duplikací v evoluci genomů Nový gen vzniká ve většině případů z jiného genu. Důsledkem toho je skutečnost, že geny se často vzájemně podobají. Podobné geny pak tvoří rodiny a nadrodiny, které je možné řadit do genealogických stromů. V genomech vyšších eukaryot se nachází 10-40 tisíc genů. Naproti tomu, počet exonů, z nichž jsou tyto geny tvořeny, se pohybuje v řádech stovek nebo maximálně tisíců, je tedy výrazně nižší. Ještě nižší bude zřejmě počet tzv. genových modulů, ještě kratších jednotek tvořících exony. Byla popsána řada mechanizmů vzniku nových genů. Hlavními je duplikace genů, kdy si jedna kopie zachová původní funkci a druhá kopie získá funkci novou. Tento proces se nazývá neofunkcionalizace. Ve většině případů se však druhá kopie stane nefunkčním pseudogenem, který sbírá mutace a degeneruje. Jedná se o tzv. pseudofunkcionalizaci. Pouze výjimečně druhá kopie kóduje užitečný produkt. Rozdíly jsou také v tom, jak rychle duplikovaná kopie genu získá novou funkci, zda rychle nebo až po delší době. Nový gen 50 může vznikat i pouhým přeskupováním svých vnitřních částí – exonů – nebo duplikací exonů. Při tzv. subfunkcionalizaci mutace poškodí odlišné části dvou kopií genu, takže výsledný produkt vznikne komplementací dvou neautonomních produktů, většinou se však jedná o subfunkcionalizaci na úrovni regulačních oblastí. Dalším mechanizmem je transpozice a retropozice, které mohou způsobit, že přenesený gen nebo jeho část se dostanou do nového sekvenčního kontextu, např. do blízkosti jiných regulačních sekvencí či přímo do jiného genu za vzniku fúzního genu. Nový gen může vzniknout i fúzí sousedních dvou genů a naopak jeden gen může být rozštěpen na dva geny. Organismy mohou získat geny i přenosem z jiných organismů, tzv. horizontálním neboli laterálním přenosem, což je běžné především u bakterií. Tento přenos může dokonce přeměnit neškodnou bakterii v patogenní. Ve vzácných případech mohou geny vznikat i de novo z původně nekódujících sekvencí, např. z intronů (např. gen Sdic u drozofily). Často však dochází při vzniku genů ke kombinování více mechanismů. Pro geny stejného původu (homologní geny) se běžně používají termíny paralogní a ortologní geny neboli paralogy a ortology. Geny, které vznikly duplikací a následnou diverzifikací v rámci jednoho druhu se označují jako paralogy. Často mají odlišnou funkci. Naopak ortology jsou homologické geny u různých druhů mající společného předka a většinou plní podobné funkce. Nejrychlejším způsobem zvýšení počtu genů v genomu je duplikace celého genomu. Chybou v meióze se mohou vytvořit diploidní gamety místo haploidních, a jejich fúzí vznikne polyploidní, v tomto případě tetraploidní organismus. Polyploidie je poměrně častá u rostlin. Podle některých názorů lze najít stopy duplikací genomů (před 200 a 80 miliony let) u všech dnešních rostlin. K obdobným duplikacím genomů došlo i v evoluci obratlovců. Kdysi dávno byl zdvojen i genom kvasinky. Následně po polyploidizaci může dojít k restrukturalizacím genomu, což může vést ke tvorbě nových genových komplexů, a tak ke zrychlení evolučních procesů. Polyploidizace je evolučně úspěšná snad i proto, že vede ke zvýšení počtu všech 51 genů stejně, aniž by tak výrazně ovlivňovala rovnováhu mezi geny. Přestože byly popsány i mechanismy vedoucí ke zmenšování genomů, zdá se, že navrch mají procesy vedoucí k jejich zvětšování. 4.11. Geny nedávno vzniklé na příkladu genů jingwei, sphinx, Sdic V roce 1990 byl objeven u skupiny afrických drozofil objeven nově vzniklý gen. Byl pojmenován jingwei. Tento gen vznikl před 2 miliony let u předka dvou druhů drozofil D. yakuba a D. teissieri. Základem pro vznik nového genu byl gen yellow-emperor. Ten se zduplikoval, jedna kopie zůstala aktivní a do třetího intronu druhé kopie se retrotranspozicí přenesl (jako fúzní exon) gen Adh, který kóduje alkoholdehydrogenázu. Gen Adh si nesl vlastní terminační signál na 3-konci. Exony původního genu yellow-emperor ležící napravo od včleněného genu pro Adh proto zdegenerovaly. Tak vznikl nový gen označený jako jinwei. Jedná se o krásný přiklad dokládající kombinaci exonů původně dvou různých genů, čímž vzniká nová struktura proteinu. Také to dokládá, že původní gen musel být duplikován, aby byla druhá kopie volná pro evoluční experiment vedoucí ke genu s novou funkcí. Skutečnost, že k fúzi genů došlo v intronu, svědčí o jejich úloze při vzniku nových genů mechanizmem kombinace exonů. Gen byl pojmenován po princezně Jingwei, dceři prvního čínského císaře Yandeho. Ta velmi ráda plavala až se jednou utopila při koupání v moři a poté se převtělila v krásného ptáka, který se snažil zabránit tragedii jiných tím, že nosil do moře kamínky. Gen jingwei byl totiž nejprve považován za nefunkční pseudogen a až po nějaké době se „převtělil“ do nového funkčního fúzního genu. Podobným příkladem vzniku nového genu je gen Sphinx (spx) u D. melanogaster, jehož stáří je pouhé 2 miliony let. Ke vzniku genu sphinx došlo tak, že genu pro ATPázový řetězec F se včlenil do genu pro RNA. Tento příklad dokládá, že vzniku nových genů se účastní nejen geny kódující proteiny, ale i geny pro RNA. Gen Sdic je nově vzniklý gen u D. melanogaster, který vznikl fúzí genu AnnX pro annexin a genu Cdic, který kóduje polypeptidový řetězec cytoplazmatického dyneinu. Fúzí se spojil čtvrtý exon genu AnnX se třetím intronem genu Cdic. Dostaly se tak do blízkosti tři potenciální promotory, které mohou zajišťovat expresi specifickou pro varlata. Dva jsou odvozeny z genu AnnX a jeden z intronu genu Cdic. Fúzní gen Sdic se nachází v tandemově uspořádaných deseti kopiích ležících mezi rodičovskými geny Cdic a AnnX. Tyto geny se nacházejí na chromosomu X. Vznik genu Sdic představuje příklad, kdy ke vzniku nového genu vedla duplikace původních genů, jejich fúze a následný vznik nových promotorů zajišťujících tkáňově specifickou expresi. Fúzí vznikl nový exon kódující N-konec peptidu. Ke vzniku genu došlo před méně než 3 miliony let. 52 4.12. Vznik AFGP genu a konvergentní evoluce Dalším příkladem zajímavého vzniku nového genu je vznik genu pro nemrznoucí glykoprotein, AFGP (antifreeze glycoprotein). Byl objeven u ryb žijících v polárních oblastech, jak v Antarktidě tak i v Arktidě a má odlišné formy – antarktickou a arktickou. Jedná se o protein, který brání růstu krystalů ledu a tím zmrznutí krve. Antarktický AFGP vznikl před asi 10 miliony let, právě v době, kdy došlo k prvnímu zamrznutí polárních oblastí. Arktický AFGP vznikl před 2.5 miliony let. Přestože obě formy genu AFGP vznikly z různých genů, oba obsahují dlouhé úseky kódující tripeptid Thr-Ala-Ala, který váže ledové krystalky. Antarktický AFGP vznikl z funkčně zcela nepříbuzného genu pro trávicí enzym trypsinogen tak, že byly zachovány oblasti genu na 5‘-konci a 3‘-konci a uvnitř byl mnohonásobně amplifikován segment kódující tripeptid Thr-Ala-Ala, zřejmě v důsledku prokluzování polymerázy při replikaci genu. Naopak arktický AFGP nemá žádnou homologii s genem pro trypsinogen. Vznik genů AFGP je tak nádherným příkladem konvergentní evoluce. Tyto geny vznikly nezávisle z různých předků u velmi vzdálených organizmů avšak evoluce je dovedla v podobných prostředích k podobnému výsledku. 4.13. Vznik nových genů štěpením a fůzí V několika z mnoha kompletně osekvenovaných genomech byly sledovány homologické geny (ortology), které byly v některých genomech rozštěpeny do dvou či více genu, zatímco v jiných tvořily pouze jeden gen. Bylo zjištěno, že počet genů vzniklých fúzí vzrůstal s rostoucí velikostí genomů. V evoluci tedy zřejmě převládaly fúze genů nad jejich štěpením. Převaha fúzí nad štěpením je logická, protože pro organizmus je výhodné také fyzické spojení funkcí, které spolu biologicky souvisejí. 53 Zvláštní postavení zaujímají termofilní organizmy, u nichž byl zjištěn zvýšený výskyt štěpení genů. Vysoká teplota a teplotní fluktuace totiž vedou k replikačním chybám a tím k vyšší frekvenci mutací, které způsobují rozštěpení genů. Rozštěpené geny mohou být také pouze adaptací k vyšším teplotám, vzhledem k častým chybám u termofilních organizmů, jež jsou úměrné délce genu, je výhodnější rozdělit informaci do oddělených podjednotek tvořících proteinový komplex. 4.14. Vznik nových genů řízenou evolucí Vědci se snaží připravit umělé geny, které by kódovaly proteiny s požadovanými vlastnostmi, anebo aptamery - molekuly RNA vážící se silně na některé proteiny. Hlavním přístupem jsou experimenty typu SELEX, kdy dochází k selekci (evoluci) in vitro. Představme si, že chceme získat molekulu RNA vážící se silně na určitý protein. V prvním kroku vezmeme požadovaný gen, který chceme „vylepšit“ z hlediska síly vazby jeho RNA na určitý protein a tuto sekvenci amplifikujeme pomocí PCR. Použijeme přitom však polymerázu, která dělá často chyby, čímž vznikne populace vzájemně se lišících molekul DNA. Tyto molekuly poté přepíšeme do molekul RNA a necháme je navázat na imobilizované proteiny. Nejsilněji navázané molekuly RNA potom přepíšeme reverzní transkriptázou do DNA a použijeme na další kolo „chybující“ amplifikace. Tento cyklus generování chyb a selekce nejsilněji se vážících molekul mnohokrát opakujeme. Na konci tak získáme požadované molekuly RNA s nejsilnější vazbou na požadovaný protein. Podobným postupem byly například získány kmeny virů rezistentních k protilátkám hostitele, což je nutné pro úspěšnou genovou terapii. Horší by však bylo, kdyby se takové viry dostaly do rukou bioteroristů. Dalším přístupem řízené evoluce jsou experimenty, při nichž se smíchají dva homologické geny pocházející z odlišných druhů s cílem získat rekombinantní protein s lepšími vlastnostmi než produkty původních dvou genů, například gen pro rezistenci k určitému antibiotiku. Výchozí geny se fragmentují a smíchají dohromady, čímž vznikne řada kombinací původních genů. Poté se pomocí polymerázy dosyntetizují chybějící úseky DNA, geny se vpraví do bakterie a selektují se klony s nejsilnější rezistencí. Takto byly připraveny extrémně účinné geny pro rezistenci k moxolactamu, kdy bakterie vlastnící nový rekombinantní gen vykazovaly rezistenci ke 250x vyšším koncentracím antibiotika. 54 4.15. Horizontální genový přenos Genetická informace se normálně přenáší s rodičů na potomky, tento proces se označuje jako vertikální genový přenos. Kromě toho občas dochází i k tzv. horizontálnímu (laterálnímu) genovému přenosu, kdy organizmem, na který se přenáší genetická informace není potomek dárce. Horizontální přenos je častý zejména u prokaryot, vyskytuje se však i u eukaryot. Je to další mechanizmus, kterým organizmus získává nové geny. U bakterií si mohou vyměňovat svoji genetickou informaci často i velmi vzdálené druhy. Jedná se například o přenos rezistence k antibiotikům. Někteří badatelé hovoří dokonce o tom, že bakterie žijící v určitém prostředí mohou vlastnit dohromady určitý soubor (pool) genů, který si podle potřeby vzájemně půjčují. Jsou známy tři hlavní mechanizmy horizontálního přenosu u bakterií – transformace, transdukce a konjugace. Transformace spočívá v přijetí (absorbci) čisté DNA nacházející se v prostředí, při transdukci je přenašečem cizorodé DNA virus (bakteriofág), a při konjugaci si bakterie vyměňují genetickou informaci při vzájemném kontaktu. Horizontální přenos u eukaryot spočívá v přenosu genů z genomů chloroplastů a mitochondrií do jádra. Tyto organely byly podle endosymbiotické teorie původně volně žijící bakterie podobné sinicím (předchůdci chloroplastů) a alfa-proteobakteriím (předchůdci mitochondrií). DNA přenesená z organel do jádra se označuje jako promiskuitní DNA. Dochází také k přenosu genů z bakterií na některé houby, např. kvasinku Saccharomyces cerevisiae nebo z endosymbiotické bakterie Wolbachia na hostitelské druhy hmyzu. Wolbachia je dokonce schopna tímto přenosem ovlivnit fenotyp napadeného jedince – zabíjí samečky nebo mění samčí pohlaví na samičí. V genovém inženýrství se často využívá fenoménu přenosu části Ti plazmidu (T-DNA) z bakterie Agrobacterium tumefaciens nebo A. rhizogenes, jež se zabudovává do genomu hostitelských rostlin. Jsou známy i případy, kdy se na horizontálním přenosu podílely mobilní genetické elementy – transposony a retrotransposony (např. retroviry). Ke konstrukci fylogenetických stromů u bakterií se často využívá genu pro 16SrRNA, protože tato sekvence je velmi konzervativní mezi různými druhy a současně dostatečně variabilní, aby bylo možné měřit rozdíly a evoluční vzdálenosti. Ukázalo se však, že i tato sekvence podléhá v některých případech horizontálnímu genovému přenosu a v některých případech musejí být evoluční stromy přehodnoceny. 55 Je tedy zřejmé, že přírodní genetické inženýrství, kdy dochází k výměně genetické informace mezi často i velmi vzdálenými druhy, je v přírodě časté. Měli bychom tedy spíše než o stromu života hovořit o síti života, kde horizontální genový přenos představuje příčné spojky mezi hlavními evolučními větvemi. 56 Kapitola V.: DYNAMIKA GENOMŮ 5.1. Repetice, dynamika genomů a změna paradigmatu 5.2. Hlavní typy mobilních genetických elementů 5.2.1. Retroelementy 5.2.1.1. Virové retroelementy 5.2.1.2. Retrotransposony (retrotransposony s LTR) 5.2.1.3. Retroposony (retrotransposony bez LTR) 5.2.1.4. Retrony 5.2.2. DNA transposony 5.3. Původ a evoluce hlavních skupin transposonů 5.3.1. První genomy a původ retroelementů 5.3.2. Hledání společného předka všech retroelementů 5.3.3. Šíření retroelementů mezi genomy 5.3.4. Chromosomální distribuce transposonů 5.4. Vliv transposonů na hostitele a jejich koevoluce 5.4.1. Role transposonů v přestavbách genomů 5.4.2. Negativní vliv transposonů na hostitele 5.4.3. Mechanizmy transposonu minimalizující jejich negativní vliv na hostitele 5.4.4. Obranné mechanizmy hostitele 5.4.5. Umlčování transposonů mechanizmem RNA interference 5.4.6. Transposony jako zdroj funkcí užitečných pro hostitele – strukturní funkce 5.4.7. Transposony jako zdroj funkcí užitečných pro hostitele – enzymatické a regulační funkce 5.1. Repetice, dynamika genomů a změna paradigmatu Stále extenzivnější analýza genomů, reprezentovaná často genomovými projekty, dokládá, že značnou část genomů představují opakující se úseky DNA, tzv. repetice. Ty se vyskytují jednak v podobě tandemově uspořádaných úseků tvořících tzv. satelity, jednak v podobě rozptýlených repeticí, která jsou reprezentovány zejména různými mobilními elementy. Mobilní elementy jsou zastoupeny jednak častějšími retroelementy šířící se po genomech mechanizmem retrotranspozice, druhou skupinou jsou DNA transposony využívající proces transpozice. Podíl repeticí na velikosti genomů představuje často desítky procent, v některých případech tvoří repetice, a zejména retrotransposony, drtivou většinu genomu, u některých rostlin až 90% genomu. U člověka představuje složka kódující proteiny pouhé 1.2% genomu, zatímco mobilní elementy tvoří téměř polovinu našeho genomu. Lidský genom není v tomto směru nijak výjimečný. Dokonce i bakteriální genomy obsahují repetitivní elementy, které mohou tvořit až 5-10% jejich genomů. Repeticí jsou přítomny dokonce v genomech některých virů, kuriozním příkladem jsou genomy Mimivirů (velikostí srovnatelné s některými prokaryoty) obsahující až 10% repeticí. Důležitým atributem genomů ale není pouze jejich repetitivní charakter, je to zejména jejich inherentní nestabilita. Právě objev mobilních elementů, u jehož zrodu stála Barbara McClintocková, která poprvé popsala mobilní elementy u kukuřice ve 40. letech, představoval jednu ze základních změn nového paradigmatu v genetice. Do té doby byly genomy považovány za invariantní entity. Genom, a především jeho mobilní elementy, jsou podle současných představ aktivním generátorem změna a přestaveb, jejichž mechanizmem je zejména rekombinace, produkujícím nové genetické struktury. Tyto přestavby jsou stochastickými (náhodnými, nepředvídatelnými) procesy, které jsou však regulovány (opakem jsou deterministické, předvídatelné procesy). Dříve se předpokládalo, že veškeré fungování genomu a potažmo organizmu zajišťují pouze geny, a že repetitivní sekvence DNA představují pouze jakousi zbytečnou DNA („junk DNA“). Tato DNA se také označovala jako „sobecká“ nebo „parazitická“ DNA. Podle těchto 57 představ neměla pro hostitele žádný užitek, jejím jediným cílem bylo amplifikovat se do maximální míry tolerovatelné hostitelem. Nyní dochází ke změně paradigmatu v této oblasti. V současné době převládá pohled na genom jako na jakýsi ekosystém obsahující jednotlivé elementy nacházející se v různých genomových nikách, mezi nimiž existuje celé spektrum vztahů od sobeckých elementů po altruistické (dělení podle „chování“), od parazitických po mutualistické (role), od zbytečné DNA po geny (podstata). Dnes je jasné, že existuje mnoho nejrůznějších mechanizmů umožňujících koexistenci mobilních elementů a hostitele, a že mobilní elementy daly vzniknout mnoha důležitým funkcím prospěšným pro hostitele a představují hlavní nástroj evoluce genomů. 5.2. Hlavní typy mobilních genetických elementů 5.2.1. Retroelementy Jako retroelementy se nejčastěji označují mobilní sekvence DNA nebo RNA, které obsahují gen pro enzym reverzní transkriptázu. Tento enzym katalyzuje syntézu molekul DNA podle templátu RNA. Někteří autoři se přiklánějí k širšímu pojetí definice retroelementů a řadí k nim veškeré sekvence, jež vznikají reverzní transkripcí RNA do DNA. Retroelementy se po genomech šíří procesem retropozice. Jedná se o přemístění genetického materiálu z jednoho místa v genomu do místa jiného, přičemž prostředníkem je molekula RNA. Retroelement je nejprve přepsán do RNA, ta je přepsána reverzní transkriptázou do komplementární DNA (cDNA), jež je poté včleněna do nového místa v genomu. Vzhledem k tomu, že původní element není při retropozici odstraněn, má retropozice vždy duplikativní charakter a vede k expanzi retroelementů v genomu. Retroelementy se nacházejí v širokém spektru organizmů, od bakterií přes houby až po rostliny a živočichy včetně člověka. V průběhu evoluce vznikly postupně nejrůznější formy retroelementů, vyznačující se různou genovou organizací a stupněm složitosti, počínaje nejprimitivnějšími retroelementy obsahujícími pouze gen pro reverzní transkriptázu až po relativně složité retroviry. Různým stupněm složitosti se vyznačují i replikační mechanizmy, respektive životní cykly, jednotlivých retroelementů. Retroelementy se nejčastěji dělí do několika hlavních skupin. První skupinou jsou virové retroelementy, k nimž patří zejména retroviry a retrovirům podobné elementy, další skupinou jsou retrotransposony, obsahující dlouhé koncové repetice (LTR), dále pak strukturně jednodušší retroposony, jež nemají LTR, a nakonec bakteriální retroelementy - retrony. Uvedené typy retroelementů se nacházejí v genomech obvykle jak v podobě plně funkčních nepoškozených kopií, tak i v podobě defektních kopií, nejčastěji zkrácených či jinak mutovaných. 5.2.1.1. Virové retroelementy Jedná se o retroelementy tvořící infekční virové částice. Jsou to viry, v jejichž životním cyklu se střídají fáze DNA a RNA, přičemž používají reverzní transkripci. Hlavní skupinou virových retroelementů jsou retroviry. K retrovirům patří jednak (i) oncornaviry (např. virus Rausova sarkomu, RSV), a (ii) lentiviry (např. lidský HIV virus). Mezi retroelementy se někdy také řadí pararetroviry. Pararetroviry jsou viry, jejichž genom je tvořen dvouřetězcovou kružnicovou DNA. K retroelementům se řadí proto, že kódují reverzní transkriptázu a během jejich životního cyklu dochází k reverzní transkripci. Na rozdíl od ostatních retroelementů u pararetrovirů nedochází k integraci jejich DNA do genomu hostitele. Mezi pararetroviry, někdy označované také jako retroidviry, patří (i) caulimoviry (např. virus mozaiky květáku, CaMV) a (ii) hepadnaviry (např. virus hepatitidy B, HBV). Retroviry jsou RNA viry napadající obratlovce, především savce a ptáky. Typickým a nejlépe prostudovaným zástupcem retrovirů je virus HIV, způsobující onemocnění AIDS u člověka. Genom retrovirů je tvořen dvěma identickými molekulami jednořetězcové RNA 58 uloženými ve virovém kapsidu. Retroviry jsou tudíž diploidní, což je mezi viry výjimečné. Na každou tuto molekulu RNA je navázána transferová RNA, která slouží jako primer pro syntézu komplementární DNA reverzní transkripcí. Virová RNA totiž neslouží jako mRNA, nýbrž pouze jako matrice pro zpětnou transkripci do DNA, která je následně včleněna do chromozómu hostitele. Tam se nachází v podobě tzv. provirové DNA, která je buňkou transkribována za vzniku RNA sloužící jak jako genomová RNA, tak i jako templát pro syntézu virových proteinů. Genom retrovirů obsahuje geny gag, pol a env. Gen gag kóduje polyprotein, který je dále štěpen na nukleokapsidové proteiny. Gen pol, který se s genem gag částečně překrývá, kóduje polyprotein, jehož štěpením vzniká reverzní transkriptáza, integráza, RNázaH a proteáza. Proteáza štěpí prekurzorový polyprotein na zralé proteiny, reverzní transkriptáza kopíruje RNA do duplexu RNA-DNA a ribonukleáza H degraduje RNA v heteroduplexu, čímž umožní syntézu druhého komplementárního řetězce DNA. Integráza katalyzuje včlenění dvouřetězcové DNA do chromozómu hostitele. Gen env kóduje obalové proteiny a zajišťuje tak infekční schopnosti retrovirů. Tyto geny jsou v provirové DNA lemovány po obou stranách dlouhými koncovými repeticemi, tzv. LTR, které jsou charakteristickým rysem retrovirů. Jsou tvořeny jednak přímými repeticemi, jednak jedinečnými sekvencemi obsahujícími regulační sekvence důležité pro transkripci těchto elementů jako jsou promotory, zesilovače transkripce a terminátorové sekvence. 59 S retroviry jsou příbuzné tzv. endogenní retroviry a retrovirům podobné elementy. Retrovirům se tyto elementy podobají nejen přítomností dlouhých koncových repeticí, ale i dalšími sekvenčními prvky a celkovou genomovou organizací. V genomu hostitele se však často nacházejí silně poškozené, neúplné kopie těchto retroelementů. Extrémním případem je přítomnost pouhých solitérních sekvencí LTR. Některé studie dokonce naznačují, že lidské endogenní retroviry, tzv. HERV (human endogenous retrovirus), a jejich fragmenty tak představují pozůstatky dávných retrovirových infekcí starobylých primátů, k nimž došlo před 10-60 miliony let. 5.2.1.2. Retrotransposony (retrotransposony s LTR) Retrotransposony jsou nejsložitější nevirové retroelementy hojně se vyskytující u všech hlavních skupin eukaryot. Strukturou i replikačním a integračním mechanizmem se podobají retrovirům. Jsou dlouhé několik kilobází a podobně jako retroviry obsahují dlouhé koncové repetice (LTR) a geny gag a pol. Při retropozici tvoří jako intermediát intracelulární ribonukleoproteinové částice. Retrotransposony se dělí podle uspořádání genů a podle podobností sekvencí na dvě hlavní skupiny: strukturně jednodušší elementy typu Ty1-copia a elementy typu Ty3-gypsy, strukturně podobné retrovirům. Obě skupiny se liší pořadím domén v genu pol. Kromě toho, některé elementy typu Ty3-gypsy obsahují gen neznámé funkce ve stejné poloze, jako se nachází retrovirový gen env. Oba typy retrotransposonů byly pojmenovány podle Ty elementů kvasinky a copia a gypsy elementů drozofily, které byly objeveny nejdříve. Postupně byly popsány i u ostatních eukaryot. Retrotransposony jsou hojné především u rostlin, zatímco u obratlovců se vyskytují pouze sporadicky. Kvasinka a drozofila obsahují pouhé desítky těchto elementů. Extrémními příklady počtu kopií retrotransposonů byly nalezeny u rostlin. Zatímco elementy Tnt1 tabáku nebo elementy Ta1 elementy huseníčku se vyskytují v hostitelských genomech pouze ve stovkách, genom kukuřice obsahuje asi 100 000 elementů typu Ty1-copia a genom bobu setého dokonce přibližně 1 milion těchto elementů. V posledních dvou případech tyto elementy představují asi polovinu genomu. Stále jsou objevovány další rodiny retrotransposonů, a to nejen u rostlin, ale také u obratlovců, konkrétně u ryb, obojživelníků, plazů a savců. Tyto genomy jsou však často osídleny různými endogenními retroviry a je tudíž těžké tyto retrotransposony od nich odlišit. V genomech se nachází, podobně jako v 60 případě endogenních retrovirů, mnoho defektních kopií, které se kopírují díky přítomnosti intaktních elementů. 5.2.1.3. Retroposony (retrotransposony bez LTR) Retroposony neobsahují dlouhé koncové repetice (LTR) a vyznačují se celkově jednodušší strukturou ve srovnání s retroviry a retrotransposony. Často se také označují jako retrotransposony bez LTR nebo „poly(A) retroelementy“. Typickým znakem této skupiny retroelementů je totiž úsek tvořený adeniny, poly A, nacházející se na jejich 3’konci. Jejich retropoziční cyklus a mechanizmus reverzní transkripce nejsou dosud zcela objasněny. Byly objeveny u všech hlavních skupin eukaryot. Jsou nejpočetnějším typem retroelementů u člověka a ostatních savců. Hlavními zástupci retroposonů jsou elementy typu LINE (long interspersed nuclear elements) a elementy typu SINE (short interspersed nuclear elements). LINE elementy jsou autonomní elementy dlouhé několik kilobází, obsahující gen kódující reverzní transkriptázu a endonukleázu. SINE mají zcela odlišnou strukturu. Jejich zařazení mezi retroelementy totiž závisí na tom, jak je chápána definice retroelementů. Elementy SINE jsou vlastně retropseudogeny a neobsahují ani vlastní gen pro reverzní transkriptázu. Jedná se o pasivní elementy, jejichž šíření po genomech je závislé na přítomnosti elementů LINE. SINE představují nejhojnější genetické elementy vzniklé retropozicí v lidském genomu. Retroposony typu LINE jsou dlouhé několik kilobází, například lidský element L1 je dlouhý 6,1 kb. Typický aktivní retroelement typu LINE obsahuje dva otevřené čtecí rámce, ORF1 a ORF2. První kóduje protein o neznámé funkci, o němž bylo zjištěno, že se váže na RNA. Druhý otevřený čtecí rámec kóduje reverzní transkriptázu a endonukleázu homologickou s endonukleázami účastnícími se reparace DNA. Na obou koncích elementu LINE se nacházejí netranslatované oblasti (UTR). Netranslatovaná oblast na 5’ konci obsahuje regulační sekvence, netranslatovaná oblast na 3’ konci je zakončena polyadeninovým úsekem. Na 3’ konci LINE elementů se nachází také konzervativní polypurinový úsek, vyznačující se schopností tvořit čtyřvláknovou strukturu DNA, tzv. tetraplex, která zřejmě hraje roli při replikaci těchto elementů. Celý element je lemován 61 přímými repeticemi o délce 7-16 bp, které však mohou někdy chybět. Pozoruhodným rysem LINE elementů je skutečnost, že pouze jejich malá část se nachází v plně funkční nezkrácené a nepoškozené podobě. Většina LINE elementů je zkrácena na 5’ konci (u člověka více než 90% elementů z celkového počtu asi 850 000 kopií tvořících 21% genomu), přičemž rozsah zkrácení je velmi variabilní až po fragmenty dlouhé jen 60 bp. V průměru každý desátý element je navíc vnitřně přestavěn, převážně v důsledku delecí či inverzí. Poškozené elementy nejsou schopny autonomní retropozice a po genomu se šíří s pomocí enzymů kódovaných omezeným počtem aktivních elementů. Procesy vedoucí ke zkracování nejsou známy. Předpokládá se, že to může být důsledek chybné reverzní transkripce nebo integrace. Zkrácené kopie jsou téměř vždy nefunkční, některé však mohou obsahovat regulační sekvence a ovlivňovat tak genovou expresi sousedních oblastí genomu. Retroposony typu SINE jsou dlouhé pouze několik stovek bází a neobsahují ani gen pro reverzní transkriptázu. Alu sekvence vznikla zřejmě z 7SLRNA; představuje vlastně 7SLRNA retropseudogen. Tuto představu podporuje i skutečnost, že retroposony typu SINE jsou, podobně jako geny pro tRNA, transkribovány z promotorů RNA polymerázy III. Tyto promotory se nacházejí uvnitř transkribované oblasti. Předpokládá se, že retropozice elementů SINE je zajišťována reverzní transkriptázou poskytovanou elementy LINE. Srovnání sekvencí několika rodin elementů SINE a LINE vyskytujících se v témže organizmu ukázalo, že 3’ konce elementů SINE jsou odvozeny ze 3’ konců odpovídajících elementů LINE téhož organizmu. Retroposony typu SINE se vyskytují u prvoků, hub, rostlin i živočichů. Hojně jsou zastoupeny především v genomech savců, kde se nacházejí v počtech 105 - 106 kopií. Nejznámějším zástupcem retroposonů typu SINE je lidská sekvence Alu. Výskyt Alu sekvence je omezen na člověka a další primáty. K jejímu rozšíření došlo během posledních 65 milionů let. Lidský genom obsahuje asi 1.5 milionu jejich kopií, což představuje při délce konvenční sekvence 280 bp asi 13% genomu. Alu sekvence je nejhojnější sekvencí v lidském genomu. Vyskytuje se v průměru každé 3 kb. Jejich distribuce v lidském genomu však není rovnoměrná, nacházejí ve shlucích. Sekvence Alu sestává ze dvou podobných monomerů spojených polyadeninovým úsekem. 5.2.1.4. Retrony Retrony jsou nejjednodušší retroelementy. Byly objeveny u některých myxobakterií a u 62 Escherichia coli. Retrony byly nalezeny v podobě tzv. msDNA (multicopy single-stranded DNA), což jsou bizardní chiméry tvořené molekulami DNA a RNA. Typická msDNA je tvořena krátkou jednořetězcovou DNA, která je na 5’ konci spojená prostřednictvím 2,5fosfodiesterové vazby s jednořetězcovou RNA. DNA a RNA zde nevykazují žádné významné homologie. Obě složky tvoří stabilní sekundární struktury. Na 3’konci tvoří komplementární DNA-RNA hybrid, dlouhý 6 bp. Retron obsahuje dva geny, kódující obě složky msDNA, přičemž gen msd kóduje vlákno DNA, gen msr kóduje molekulu RNA. Tyto dva geny se nacházejí na opačných vláknech DNA a jsou uspořádány tak, že se jejich 3’ konce vzájemně překrývají 8 bázemi. Kromě dvou zmíněných genů je součástí retronu také gen pro reverzní transkriptázu. Molekuly msDNA byly dříve považovány za intermediáty extrachromosomálního replikačního cyklu retronů. Ukazuje se však, že msDNA jsou zřejmě pouhými abortivními potomky těchto retronových intermediátů. O tom svědčí především skutečnost, že rozsáhlé části kompletního retronu v molekulách msDNA chybějí a to včetně genu pro reverzní transkriptázu. Objev retronů představoval nalezení důležitého evolučního článku dokládajícího existenci retroelementů u prokaryot. Od objevu reverzní transkriptázy byly postupně v širokém spektru eukaryotických organizmů nacházeny nejrůznější typy retroelementů. Až do objevu retronů, tedy celých dvacet let, však neexistovaly žádné důkazy svědčící o existenci elementů kódujících reverzní transkriptázu také u prokaryot. Jejich existence byla předpokládána vzhledem ke všeobecně přijímané představě, že RNA svět přecházel současnému DNA světu. Reverzní transkriptáza, která hrála roli při převedení genetické informace z RNA do DNA, stejně tak jako elementy, které ji kódovaly, tedy musely existovat již před vznikem eukaryot. 5.2.2. DNA transposony Vedle retroelementů existuje ještě jiný typ mobilních genetických elementů, tzv. DNA transposony, šířící se po genomech procesem transpozice. Transpozice probíhá buď tak, že replikací transposonu vznikne jeho nová kopie, která se včlení do jiného místa v genomu (tzv. replikativní transpozice, „copy and paste“), anebo dochází k vyštěpení transposonu z genomu a jeho včlenění do jiného místa (tzv. konzervativní transpozice, „cut and paste“). Při transpozici nevzniká RNA intermediát. Transposony se vyskytují především u prokaryot, u eukaryot jsou vzácnější, i když v poslední době se objevují jejich nové rodiny (např. helitrony) i u eukaryot. U bakterií byly objeveny nejjednodušší DNA transposony, označované jako IS elementy (insertion 63 sequences). Obsahující dva otevřené čtecí rámce kódující transpozázu a protein regulující produkci transpozázy. Element je lemován po obou stranách obrácenými repeticemi, za levou z nich se nachází promotor důležitý pro expresi transpozázy. Délka různých IS elementů se pohybuje okolo 1kb. Složitější DNA transposony potom obsahují navíc gen kódující resolvázu, která rozpoznává vnitřní rozpoznávací místo transposonu, nacházející se vedle genu pro resolvázu. Existence resolvázy souvisí s mechanizmem replikativní transpozice, kterou se tyto transposonu šíří po genomech. Při ní vzniká druhá kopie transposonu spojená s původní kopií v podobě tzv. kointegrátu, který je pak štěpen resolvázou. Ke složitějším transposonům patří transposony typu Tn. Většina složitějších DNA transposonů obsahuje ještě genu kódující rezistenci k antibiotikům a jsou takto užitečné svým hostitelským bakteriím. Z eukaryotických DNA transposonů jsou známé zejména Ac a Ds elementy, objevené roku 1948 Barbarou McClintockovou u kukuřice (Nobelova cena 1984). Jedná se vlastně o dvojici představující autonomní element (Ac) a neautonomní element (Ds). Autonomní element je schopný syntézy transpozázy, která mobilizuje i element neautonomní. Neautonomní element je defektní a neschopný samostatného pohybu. U drozofily byly objeveny také P elementy, způsobující tzv. hybridní dysgenezi. Jedná se o zvláštní fenotyp vznikající při křížení samců nesoucích P element se samicí, která ho nenese. Tyto elementy se rozšířily u všech populací drozofily až v průběhu posledních 50. let, takže například u starších laboratorních kmenů chybí. Velkou skupinou DNA transposonů jsou elementy typu Tc1/mariner. Původně byly objeveny u C. elegans (Tc1) a drozofily (mariner), později u všech hlavních skupin organizmů. Používají konzervativní (cut and paste) mechanizmus transpozice. Z elementů mariner byly pravděpodobně odvozeny elementy MITE, jež jsou velmi hojné u rostlin. Vzhledem k jejich vysokým počtům u rostlin se jim někdy přezdívá „rostlinné Alu elementy“. Jedná se o neautonomní elementy, o velikosti pouhých 100-500bp, lemované obrácenými repeticemi (TIR). Vyznačují se vysokým AT-obsahem (u typu Stowaway je to přes 72%). Zajímavé je na nich zejména to, že se většinou nacházejí v intronech genů anebo v jejich blízkém okolí. Často také tvoří různé sekundární struktury. Až nedávno byl objeven nový typ DNA transposonů – tzv. helitrony, a to i přesto, že tvoří značnou část genomů vyšších organizmů, jako je člověk, arabidopsis či C. elegans (zde asi 2%). Svůj název dostaly helitrony podle mechanizmu replikace, množí se totiž mechanizmem „otáčivé kružnice“, podobně jako plazmidy. Jedná se o poměrně velké elementy, dlouhé 5- 15kb, většinou jsou však degenerované a tudíž neautonomní (mechanizmus tvorby neautonomních elementů je nejasný). Helitrony kódují proteiny potřebné pro svoji replikace – helikázu, nukleázu/ligázu a proteiny vážící jednořetězcovou DNA. Nemají žádné sekvenční či strukturní prvky na svých koncích, pouze blízko 3-konce obsahují vždy konzervativní 64 palindromatickou strukturu. Zajímavým rysem helitronů je to, že se často nacházejí v blízkosti genů. 5.3. Původ a evoluce hlavních skupin transposonů 5.3.1. První genomy a původ retroelementů Hypotézy evolučních biologů předpokládají, že nejranější formy života obsahovaly samoreplikující se genomy tvořené molekulami RNA (viz kapitola Relikty světa RNA). RNA tehdy sloužila současně jako genetický materiál pro uložení informace, tak i jako katalyzátor reakcí. Obě tyto funkce postupně převzaly specializované molekuly. Na uchovávání genetické informace se specializovala DNA, která je ve srovnání s RNA chemicky stabilnější. Dále vznikly proteinové enzymy jako účinnější, především přesnější a rychlejší, katalyzátory biochemických reakcí. Převedení informace z RNA do stabilnějších polymerů, v nichž byla ribóza nahrazena deoxyribózou, bylo umožněno mimo jiné existencí polymeráz - tzv. reverzních transkriptáz, schopných vytvářet DNA kopie podle RNA templátů procesem reverzní transkripce. Objev reverzní transkriptázy v roce 1970 byl dalším pilířem hypotézy prvotnosti RNA světa, za nějž objevitelé získali Nobelovu cenu. Reverzní transkriptázy se zřejmě vyvinuly z RNA replikáz (RNA-dependentních RNA polymeráz), enzymů tvořících RNA kopie podle RNA předloh, o čemž svědčí především sekvenční homologie RNA replikáz dnešních RNA virů s reverzními transkriptázami. Z evolučního hlediska je zajímavá i skutečnost, že mnohé retroelementy (retroviry a retrotransposony) používají k iniciaci své reverzní transkripce molekuly tRNA nebo jiné RNA se stabilními sekundárními strukturami. Pozoruhodná souvislost mezi používáním tRNA, molekulou klíčovou pro translaci RNA do proteinů, a reverzní transkriptázou, enzymem katalyzujícím přepis genetické informace z RNA do DNA, naznačuje, že reverzní transkriptáza a molekulární předchůdkyně dnešních tRNA byly hlavními molekulami podílejícími se na formování DNA světa. 5.3.2. Hledání společného předka všech retroelementů Řada badatelů se pokoušela sestavit evoluční strom retroelementů s cílem určit jejich vzájemnou příbuznost. Zásadním problémem těchto studií bylo určit společného předka, progenitora, všech známých retroelementů. Za kandidáty byly pochopitelně považovány především nejjednodušší a všudypřítomné typy retroelementů. V současné době existují dva alternativní modely evoluce retroelementů. Podle první představy stály na počátku prokaryotické retroelementy - retrony. Tuto myšlenku podporuje jednak analýza používání kodonů ukazující, že retrony byly do genomů bakterií včleněny již dávno, jednak skutečnost, že čtecí rámce retronů jsou nejkratší a nejjednodušší ze všech retroelementů a jejich produkty mají pouze reverzně transkriptázovou a RNázovou aktivitu. Podle alternativní hypotézy založené na srovnání aminokyselinových sekvencí konzervativních domén reverzních transkriptáz pocházejících z bakterií, prvoků, hub, rostlin a živočichů, jsou nejpravděpodobnějším progenitorem retroelementy bez LTR podobné dnešním retroposonům. Vyznačují se jednoduchou strukturou, jednoduchým mechanizmem retropozice a všudypřítomností u eukaryot. Uvedenou hypotézu podpořilo také srovnání sekvencí reverzních transkriptáz retroelementů se sekvencemi RNA replikáz různých RNA virů, které se nevyznačují retropozicí. Srovnání ukázalo, že RNA viry jsou starší než retroelementy a lze je použít jako „kořen“ v evolučním stromu. A právě nejblíže RNA virům v tomto evolučním stromu byly retroposony, podstatně blíže než retrony. Tento předchůdce zřejmě obsahoval geny podobné genům gag a pol, a to buď jako dva oddělené otevřené čtecí rámce nebo jako jeden velký otevřený čtecí rámec. Gen pol přitom obsahoval jak reverzně transkriptázovou tak i integrázovou doménu. Podle některých autorů lze v evoluci retroelementů sledovat dvě hlavní vývojové větve. První větev obsahuje retroelementy bez dlouhých koncových repeticí, tedy kromě retroposonů 65 také retroelementy s jednodušší strukturou jako jsou retrony, mitochondriální plazmidy a introny II. skupiny. Bakteriální a organelové retroelementy zřejmě vznikly až druhotně později v evoluci a to v důsledku inzercí části původního retroelementu obsahujícího gen kódující reverzní transkriptázu do bakteriálního, mitochondriálního či plazmidového genomu anebo fúzí s intronem. Druhou hlavní větev tvoří retroelementy s dlouhými koncovými repeticemi včetně virových retroelementů. Těsnější příbuzenský vztah je mezi retrotransposony typu Ty3-gypsy a retroviry. Vzdálenějšími členy větve jsou strukturně jednodušší retrotransposony typu Ty1-copia. Retrotransposony typu Ty3-gypsy jsou zřejmě bezprostředními předchůdci retrovirů, které získaly gen env, jenž jim umožnil získat infekční schopnosti a opustit buňku. 5.3.3. Šíření retroelementů mezi genomy Během evoluce retroelementů docházelo k jejich šíření v rámci hostitelského genomu i mezi genomy různých druhů. Při šíření retroelementů mezi genomy se uplatňuje jak vertikální tak i horizontální genetický přenos. Vertikální přenos je běžný přenos genetické informace z rodičů na potomky uplatňující se při rozmnožování a jsou jím přenášeny všechny geny. Horizontální přenos spočívá v přenosu genetické informace z jednoho genomu do genomu jiného prostřednictvím nějakého vektoru (například retroviry). Vektorem mohou být nejen viry a jiné mikroorganizmy, jako jsou bakterie houby, ale i živočichové jako například červi či hmyz. Byl popsán horizontální přenos elementů LINE mezi plazy a savci a přenos elementů SINE mezi různými druhy ryb. Nedávno publikovaným příkladem horizontálního přenosu je přenos retroelementu copia mezi dvěma druhy drozofily parazitickým roztočem Proctolaelaps regalis živícím se vajíčky drozofily. V cytoplazmě vajíček se mohou nacházet retroelementy copia v podobě nukleoproteinových částic, které obsahují vše nezbytné pro integraci retroelementu do nového hostitelského genomu. Horizontálnímu přenosu napomáhají i mechanizmy způsobující, že při napadení hostitele patogenem dochází k aktivaci retroelementů. Tím se zvýší pravděpodobnost přenosu elementu na patogen a prostřednictvím něho k následné kolonizaci nových hostitelů. 66 Současně tato aktivace retroelementů patogeny či jiným vnějším stresem může být prospěšná i pro hostitele. Lze předpokládat, že aktivace retroelementů vede i k takovým přestavbám genomů, které umožní adaptaci organizmu na změněné prostředí. Horizontální přenos je tedy jedním z faktorů ovlivňujících jak evoluci retroelementů, tak i evoluci hostitelských genomů. 5.3.4. Chromosomální distribuce transposonů Experimenty založené na hybridizaci in situ ukázaly, že ve většině zkoumaných případů jsou retroelementy roztroušeny po většině nebo po všech chromosomech. Na chromosomech však existují místa, v nichž je koncentrace retroelementů výrazně zvýšená, a naopak i místa bez retroelementů. Z hlediska výskytu retroelementů jsou pozoruhodné pohlavní chromosomy. Z teoretických studií vyplývá, že by retroelementy měly být nadměrně zastoupeny v chromosomálních oblastech, v nichž je snížena či potlačena meiotická rekombinace. Takovými místy jsou nehomologické, a tudíž nerekombinující, části chromosomu Y. Experimentálně byla prokázána zvýšená četnost retroelementů v chromosomu Y u Drosophila miranda. V geneticky inertních oblastech, jako je chromozóm Y, nedochází k selekci proti inzerčním mutacím, výsledkem čehož je akumulace retroelementů. Ta zřejmě způsobí změnu struktury chromatinu vedoucí k umlčování přilehlých genů, což je první krok k celkové degeneraci chromozómu Y. V případě některých retroelementů byl prokázán jejich zvýšený výskyt v diskrétních oblastech heterochromatinu. V heterochromatinových oblastech je snížena pravděpodobnost eliminace včleněné sekvence z genomu, protože zde nemají takový negativní vliv na hostitele. Tyto oblasti představují spíše „hřbitovy“ retroelementů, než bezpečné místo pro aktivní elementy. Většina z nich je totiž inaktivní a vysoce degenerovaná. V poslední době se však ukazuje, že akumulace retrotransposonů v heterochromatinu je spíše důsledkem jejich aktivního cíleného včleňování do heterochromatinu (viz kapitola 4.3), než důsledek méně účinného selektivního odstraňování mobilních elementů z heterochromatinu. Příčiny přednostního včleňování do heterochromatinu nejsou zcela jasné, předpokládá se, že to může být důsledek vyšší hustoty zlomů v DNA v oblastech heterochromatinu, a tyto zlomy jsou takto pomocí mobilních elementů opraveny. DNA transposony většinou „skákají“ do malých vzdáleností od místa původní inzerce (tzv. „local hopping“). Zpravidla je to do vzdálenosti 100kb, avšak u některých transposonů je tato vzdálenost větší, např. u typu Tc1/mariner se 50% dceřiných kopií nacházela ve vzdálenosti do 3Mb a 80% na témže chromosomu. 5.4. Vliv transposonů na hostitele a jejich koevoluce Dříve byly zdůrazňovány negativní vlivy mobilních elementů na hostitele a až donedávna převládal pohled na mobilní elementy jako na parazitické elementy v souladu s představou, s níž přišli na počátku 80. let Orgel a Crick. Bylo poukazováno na to, že mobilní elementy se vyznačují základními rysy charakteristickými pro parazitický element, tedy že zvyšují počet svých kopií na úkor hostitele a svému hostiteli neposkytují žádnou selektivní výhodu. Postupně však přibývalo důkazů dokládajících i užitečnost mobilních elementů pro hostitele. Dnes je jasné, že mobilní elementy představují klíčové hráče v evoluci genomů. Představa transposonů jako primárních parazitů však není neslučitelná s jejich úlohou v evoluci hostitelského druhu. Narůstá důkazů, že dochází k vzájemné adaptaci, koadaptaci, těchto elementů a jejich hostitele, umožňující dlouhodobou existenci transposonů v hostitelském genomu. Transposony si lze představit jako genetické replikátory, jejichž ekologickou nikou se stal genom hostitele, který v průběhu času více či méně úspěšně osídlily. Většinou představují neškodné ale současně pro hostitelský genom nepoužitelné elementy. Pouze v některých případech je jejich přítomnost v genomech pro organizmus 67 škodlivá, o čemž svědčí řada chorob způsobených transposony. V jiných případech však tato koadaptace může být pro hostitele prospěšná a může dokonce vést k využití původně parazitických sekvencí k vytvoření nějaké funkce užitečné pro hostitele. Je pozoruhodné, že vztah mezi hostitelem a transposonem má určitý vývoj. Nejlépe to vystihuje tzv. pravidlo 3K: konflikt-kompromis-kooperace. Transposony jsou primárně sobecké a parazitické. Po napadení hostitelského genomu se snaží co nejvíce v něm namnožit. To však má negativní důsledky pro hostitele a potažmo i pro samotný mobilní element. Postupně začnou fungovat anebo se vyvíjejí obranné mechanizmy hostitele. Mnohé transposony hostitel nakonec použije k vytvoření vlastních užitečných funkcí a struktur. Je to krásný doklad toho, jak evoluce funguje, jak využívá cokoli, co je v genomu po ruce ke tvorbě nových struktur a funkcí zvyšujících fitness organizmu v daném prostředí. 5.4.1. Role transposonů v přestavbách genomů Nejvýznamnější vlastností transposonů z hlediska hostitelského genomu je jejich mutagenita. Transposony jsou především silné endogenní mutátory. Mutagenita je inherentní vlastností transposonů, vyplývající z jejich reprodukčního mechanizmu. S tím souvisí jejich negativní, ale i pozitivní vlivy na genom hostitele. Mají potenciál generovat svojí aktivitou mutace všeho druhu - delece, inzerce, duplikace, inverze, translokace, posuny čtecího rámce i větší genomové přestavby. Inzerce transposonů mohou narušit strukturu zasaženého genu, vedoucí často k posunové mutaci a mutantnímu fenotypu. Naopak excize elementu z genu může obnovit původní genotyp. Excize často nebývá přesná a způsobuje buď přidání nové sekvence anebo deleci sekvence lemující inzerční místo. Dalším významným mechanizmem přestaveb genomu způsobených transposony je tzv. ektopická rekombinace. Ta spočívá v genetických výměnách mezi nehomologickými avšak sekvenčně podobnými transposony (obecně jakýmikoliv repeticemi včetně genů), které se mohou nacházet buď na témže chromosomu nebo na různých chromosomech. Výsledkem mohou být například delece mezilehlých oblastí. Kromě delecí a inzercí mohou transposony způsobovat také inverze a translokace. Aktivita retroelementů se podílí na tvorbě pseudogenů, přestavbách exonů a tak vzniku nových genů (viz kapitola IV - Evoluce genů). Pokud se transposon včlení do intronu genu, může dojít ke tvorbě neomorfní chimerické mRNA spojující transkribovanou část transposonu a exonu genu. 5.4.2. Negativní vliv transposonů na hostitele Virové retroelementy představují silné patogeny, způsobující řadu chorob svých hostitelů. Škodlivé účinky na hostitele jsou snad nejzřejmější v případě různých nemocí způsobených například retroviry. K nejznámějším příkladům patří AIDS způsobené retroviry HIV (human immunodeficiency virus). Také nevirové retroelementy jsou příčinou chorob popsaných především u člověka a některých jiných savců, jejichž příčinou je inzerce retroelementu do biologicky důležitého genu. Například u pacientů trpících hemofilií A bylo zjištěno, že obsahují včleněný element L1 v genu pro faktor VIII, uplatňující se při srážení krve. Na inzerční inaktivaci se u člověka podílejí zejména retroelementy typu L1 a Alu sekvence. Inzerce L1 elementů byly zjištěny jako příčiny chorob v případě Duchenovy svalové dystrofie (DMD), u některých případů rakoviny prsu, rakoviny tlustého střeva a řady dalších chorob. Příčinou výše popsaných chorob jsou de novo inzerce retroelementů do různých genů. Byly však zjištěny i další mechanizmy uplatňující se při mutagenním účinku retroelementů. Jsou to výše zmíněné homologická rekombinace mezi retroelementy, např. Alu, způsobující delece, inverze a chromosomální přestavby. 5.4.3. Mechanizmy transposonu minimalizující jejich negativní vliv na hostitele 68 Protože negativní vliv transposonů na hostitele má potažmo samozřejmě negativní důsledky i pro samotný transposon, jsou selektivně zvýhodněny ty elementy, které jsou schopny svoji aktivitu nějak regulovat. Příkladem je represor transpozice kódovaný P elementem drozofily. Mechanizmem minimalizace škodlivých účinků na hostitele je omezení transpozice na zárodečnou linii. Tato strategie je využívána mnoha transposony. Dalším mechanizmem je cílené přednostní včleňování transposonů do míst v genomu, kde nejméně škodí. Takovými místy je heterochromatin, zejména pericentromerický a subtelomerický. Cílené včleňování do centromerického heterochromatinu bylo prokázáno u retrotransposonu Ty5 kvasinky. Důležitou roli zde hraje integráza těchto retrotransposonů. Její část nacházející se na C-konci, tzv. chromodoména, má schopnost specifické interakce s některými proteiny heterochromatinu, výsledkem čehož je přednostní inzerce do heterochromatinu. Naopak u retrovirů dochází k přednostnímu včleňování do rozvolněného chromatinu, často do transkribovaných oblastí. Obecně také platí, že transposony se často včleňují do jiných transposonů. Důležitým mechanizmem regulace počtu kopií retroelementů v genomech je také rekombinace mezi jednotlivými retroelementy, které se mohou nacházet i ve značné vzdálenosti. Vzhledem k tomu, že rekombinace ovlivňuje nejen jednotlivé lokusy, nýbrž vede často i k rozsáhlejším změnám v genomu, mají tyto přestavby většinou negativní vliv na životaschopnost organizmu a jsou podrobeny negativní selekci. Tento mechanizmus je tak zřejmě zodpovědný za evoluční odstraňování retroelementů z genomu. 5.4.4. Obranné mechanizmy hostitele Organizmy si vyvinuly obranné mechanizmy chránící jejich genomy před negativními účinky transposonů a jiných cizorodých DNA. Používají k tomu různé nástroje, včetně možnosti selektivně vystřihnout a degradovat nežádoucí element anebo schopnosti selektivně potlačit akumulaci transkriptů retroelementů. Významným obranným mechanizmem chránícím genomy před šířením mobilních elementů je metylace cytosinů nacházejících se v promotorech transposonů. Metylace znemožní jejich šíření po genomu a vede následně k destrukci elementů v důsledku substitucí, při nichž je metylcytosin nahrazen tyminem. Metylace transposonů může ovlivňovat i metylaci a expresi přilehlých genů hostitele. Pokud 69 se gen dostane do sousedství transposonů, které jsou hostitelem zametylovány, může dojít i k metylaci tohoto genu a jeho umlčení. Nedávné studie naznačily, že metylace DNA, jež je důležitým mechanizmem regulace genové exprese u eukaryot, se původně vyvinula právě jako nástroj obrany organizmů proti šíření parazitických sekvencí DNA. V poslední době se dokonce ukazuje, že mezi mechanizmy regulace genů hostitele a mechanizmy regulace transposonů prostřednictvím metylací existuje souvislost, jsou zajišťovány podobnými soustavami genů. Tyto dvě představy úlohy metylací – v epigenetické regulaci hostitelských genů jakož i transposonů - se konečně vzájemně nemusejí vylučovat. 5.4.5. Umlčování transposonů mechanizmem RNA interference Metylace je však pouze jedním z vzájemně propojených mechanizmů epigenetické regulace inaktivace transposonů. Dalšími jsou remodelování chromatinu a umlčování mechanizmem malých dvouřetězcových molekul RNA, mechanizmem známým jako RNA interference. Tento nedávno objevený mechanizmus zajišťuje jak obranu proti exogenním patogenním molekulám nukleových kyselin, tak se také účastní základních buněčných procesů jako je genová regulace či tvorba heterochromatinu. Předpokládá se, že RNA interference se vyvinula jako obranný mechanizmus proti mobilním elementům a virům, které tvoří dvouřetězcové molekuly RNA. Ukázalo se totiž, že u některých mutantů s narušeným systémem RNAi dojde k uvolnění aktivity původně umlčených transposonů. Klíčovými molekulami v umlčování transposonů mechanizmem RNAi jsou molekuly dsRNA (double stranded, dvouřetězcové) obsahující sekvence transposonů. Jakými mechanizmy mohou tyto dsRNA molekuly vzniknout? Jedním mechanizmem je chybné přepsání transposonu v důsledku transkripce přilehlého genu. Takto omylem přepsaný transposon obsahuje například v případě DNA transposonů koncové obrácené repetice, označované TIR (terminal inverted repeats), které se mohou vzájemně párovat a vytvářet vlásenku obsahující dsRNA. Ke tvorbě dsRNA může dojít i tehdy, pokud se celý transposon přepíše v obou směrech a tyto transkripty se spolu spárují. Tehdy obsahuje dsRNA celý transposon nebo jeho velkou část. Přepis v obou směrech však není podmínkou, protože i jedno vlákno může sloužit jako templát pro RNA-dependentní RNA polymerázu (RdRP), která dosyntetizuje komplementární vlákno za vzniku dsRNA. Dlouhé molekuly dsRNA vzniklé výše uvedenými způsoby jsou pak mašinérií RNA interference, jíž se účastní řada proteinů, naštěpeny na krátké dsRNA (štěpení provádí tzv. Dicer). Molekuly malých dsRNA poté zajistí transkripční umlčení homologických transposonů. A to mechanizmem transkripčního (např. metylací) anebo posttrankripčního umlčení. Při posttranskripčním umlčení dochází k tomu, že komplex nazývaný RISC (RNA-induced silencing complex) způsobí fragmentaci transkriptů transposonů, přičemž sekvenční specificitu zde zajišťují malé dsRNA. 5.4.6. Transposony jako zdroj funkcí užitečných pro hostitele – strukturní funkce Přibývá důkazů svědčících o významné roli transposonů ve fungování a evoluci eukaryontních genomů. Je pozoruhodné, že si organizmy zachovaly tyto sekvence i přesto, že jsou vysoce mutagenní. Někteří autoři dokonce tvrdí, že se organizmy staly v průběhu evoluce na mobilních elementech přímo závislé. Rozrůstá se seznam příkladů dokládajících, že transposony byly v evoluci použity při vzniku nových funkcí prospěšných pro hostitele. Obecně lze říci, že mobilní elementy představují místa vhodná pro rekombinaci a translokaci, čímž přispívají k přestavbám genomů. Výsledkem je vyšší genomová plasticita hostitele, umožňující jeho lepší přizpůsobení měnícímu se prostředí. Transposony například, podobně jako i jiné repetice, podporují duplikaci genů v genomech, což je důležitý proces při vývoji celých genových rodin, v nichž mohou jednotliví členové v důsledku rozrůznění 70 nabývat nových funkcí. Výše zmíněné dlouhé koncové repetice (LTR) retrovirů a retrotransposonů obsahují regulační oblasti, které mohou v některých případech ovlivňovat regulaci přilehlých genů ve prospěch hostitele. Příklady využití transposonů pro hostitelský genom lze rozdělit do několika skupin – transposony jako zdroje (i) strukturních funkcí, (ii) enzymatických funkcí a (iii) regulačních funkcí. Nejznámější příklad strukturní funkce užitečné pro hostitele, v jejímž pozadí stojí transposony, byl popsán u drozofily. U ní retrotransposony označované Het-A a TART nahradily činnost telomerázy, enzymu zajišťujícího integritu konců chromosomů tím, že syntetizuje krátká opakování určité sekvence DNA. Tyto retrotransposony na konci každé replikace DNA přidávají své kopie na konce chromozómů, čímž zabraňují jejich postupnému zkracování. Zdrojové místo transposonů se přitom nachází ve značné vzdálenosti od konců chromosomů. Jde o příklad toho, jak bylo v evoluci použito k vytvoření nové buněčné funkce genetického materiálu, který byl v buňce již k dispozici. Je dokonce možné, že samotná telomeráza se vyvinula z retrotransposonů. Bylo zjištěno, že reverzně-transkriptázová doména telomerázy je strukturně i funkčně velmi podobná reverzním transkriptázám retroelementů. Existuje však i alternativní vysvětlení, podle něhož je naopak starší telomeráza než reverzní transkriptáza retroelementů. Transposony hrají u mnoha organizmů roli nejen v evoluci telomer, ale i centromer. Centromery jsou mnohdy tvořeny různě degenerovanými transposony. V některých případech daly transposony vzniknout centromerickým satelitním DNA sekvencím. Na tyto sekvence DNA se váží různé proteiny, nejznámějším z nich je protein CENP-B. Ukázalo se, že i ten pochází ze starých a rozšířených rodin transposonů, u drozofily z transposonu „pogo“, u člověka z transposonu „Tigger“. Takto hrají transposony důležitou roli v segregaci chromosomů hostitele. Vzhledem k tomu, že narušení segregace chromosomů může vést ke změnám počtu chromosomů a tak i k reprodukční izolaci druhů, mohou takto transposony významně ovlivňovat i speciaci. 71 Potenciální úlohu transposonů ve speciaci naznačuje i práce sledující stáří různých mobilních elementů v genomu člověka. Výsledkem bylo zjištění, že v průběhu evoluce docházelo k periodickým explozivním amplifikacím elementů, a že tato období korelují s okamžiky oddělování jednotlivých větví savců. Masivní amplifikace mobilních elementů vždy tedy předcházely speciacím. Další příklad strukturní funkce poskytnuté hostiteli transposony pochází z genomů některých bičíkovců, majících mikronukleus a makronukleus. V jejich vývoji dochází k životně důležitým přestavbám a excizím mnoha intersticiálních sekvencí DNA (IES, internal eliminated sequences). Je pravděpodobné, že tyto sekvence se vyvinuly ze starobylých transposonů. 5.4.7. Transposony jako zdroj funkcí užitečných pro hostitele – enzymatické a regulační funkce Mobilní elementy možná stály i u zrodu imunitního systému obratlovců. Nedílnou součástí tvorby imunoglobulinových molekul, zajišťujících imunologickou ochranu organizmu, jsou totiž přestavby DNA, tzv. V(D)J rekombinace. Jejich mechanizmus je velmi podobný pohybu transposonů po genomu. Tento proces spojuje dohromady různé segmenty DNA, které pak kódují široké spektrum imunoglobulinů. Klíčovou roli při V(D)J rekombinaci hrají proteiny RAG1 a RAG2. Nedávno bylo zjištěno, že tyto dva enzymy dokáží in vitro katalyzovat intermolekulární i intramolekulární transpozici a byla dokonce odhalena homologie proteinu RAG1 s transpozázu transposonů rodiny Transib. To silně podpořilo představu, že systém V(D)J rekombinace se vyvinul z mechanizmů používaných ancestrálními transposony. Domestikace některých komponent endogenních retrovirů hrála roli v evoluci rezistence k virovým infekcím. Některé retrovirové geny byly použity v obranném mechanizmu hostitele. Příkladem jsou geny Fv1 nebo Fv-4 u myší, které kódují homolog virového genu env. Ten nyní hraje roli v rezistenci proti virové infekci. Endogenní retroviry podle některých autorů dokonce hrají roli při imunosupresi potřebné k tomu, aby u živorodých organizmů nedocházelo k imunitní reakci matky proti plodu. Savčí endogenní retroviry tak umožnily podle některých autorů samotnou živorodost. Zajímavá analogie imunosuprese u savců existuje u endoparazitických vos, které dávají do svých vajíček, nacházejících se v larvách hostitelů, také vosou kódovaný polydnavirus, který je transkripčně aktivní pouze v těchto larvách a chrání parazita před imunitní odpovědí hostitelské larvy. DNA polydnavirus je tak nezbytnou součástí reprodukčního systému těchto vos. Ukazuje se, že transposony se také podílejí na reparaci dvouřetězcových zlomů v DNA. Zlomy prostě představují ideální cíl pro inzerci elementu. Inzerce transposonu naopak může představovat užitečný mechanizmus opravy zlomů v DNA. Inzerční reparace zlomů je tak užitečná pro transposon i pro hostitele. Příkladem regulačních funkcí poskytovaných hostiteli transposony jsou MITE elementy. Jsou hojné zejména u rostlin, kde se nacházejí přednostně v intronech a regulačních oblastech genů, a často proto hrají regulační úlohu. Dalším příkladem jsou savčí retroposony SINE a LINE, které kódují konzervativní vazebná místa transkripčních faktorů polymerázy II a tím zesilují její činnost. Jsou známy příklady, kdy se v důsledku inverze dostaly regulační sekvence transposonů do blízkosti exonů, jejichž expresi pak ovlivňovaly. Krásným příkladem toho, jak transposony mohou stát u vzniku nových genů, je nedávno popsaný vznik genu SETMAR. Tento gen vznikl specificky v linii primátů před 40-58 miliony let tak, že do sousedství genu SET kódujícího histon metyltransferázu se včlenil DNA transposon typu Mariner (MAR) kódující transpozázu. Postupnou evolucí (odstranění stop kodonu a vznik místa sestřihu na konci prvního genu, destrukce levé koncové repetice TIR vedoucí k imobilizaci transposonu, vznik stop kodonu na konci transposonu) pak vznikl 72 chimerický gen. Z transposonu se zachovala funkční doména důležitá pro vazbu na DNA, zatímco doména katalyzující transpozici zanikla. Vznikl gen, který má funkčnost histon metyltransferázy a současně se může vázat na cílové sekvence TIR (terminal inverted repeat) Mariner transposonů, jichž je v lidském genomu asi 1500. Tato recyklace transposonu opět dokládá, že evoluce jde cestou flikování („tinkering“). Dalším pozoruhodným příkladem, jak mohou být transposony užitečné pro hostitele, je úloha LINE-1 elementů v inaktivaci chromosomu X. Ukázalo se, že na chromosomu X člověka je dvojnásobná hustota LINE-1 elementů oproti ostatním chromosomům. Nejvíce jich pak je v místě centra inaktivace chromosomu X (Xq13-Xq21). Naopak oblasti s geny na chromosomu X, které unikají inaktivaci (asi 10% genů) obsahují méně LINE-1 elementů. Předpokládá se, že LINE-1 elementy nějak napomáhají šíření inaktivačního signálu z centra. Je známo, že klíčovým genem pro inaktivaci chromosomu X je gen Xist. Nyní se ukazuje, že RNA vzniklá transkripcí genu Xist se váže na LINE-1 elementy. Byly prováděny experimenty, kdy byl gen Xist přenesen na autosom, anebo autosom připojen ke chromosomu X, v obou případech došlo k šíření inaktivačního signálu i na autosom. LINE elementy tak jsou zřejmě důležitými hráči (označované jako „way stations“ nebo „boosters“) v šíření inaktivačního signálu po chromosomu X. Zajímavé je i zjištění, že většina LINE elementů přítomných v lidském genomu vznikla v linii savců v průběhu posledních 100 milionů let, což se dává časově do souvislosti právě se vznikem inaktivace chromosomu X. 73 Kapitola VI.: REGULACE GENOMU 6.1. Pionýři RNAi (RNA interference) 6.2. Mechanizmus RNAi 6.3. Typy malých RNA 6.3.1 siRNA ( small interfering RNA) 6.3.2 miRNA (micro RNA) 6.3.3. piRNA (Piwi-associated RNA) 6.1. Pionýři RNAi (RNA interference) Dříve, než byl mechanizmus RNAi objasněn a byla definována jeho role v buňce, byly jevy související s tímto procesem pozorovány u mnoha organizmů. Nejznámější případ je experiment prováděný skupinou Riche Jorgensena, kteří vnesli do petunií gen pro tvorbu pigmentu genů. Ačkoli očekávali po zesílené expresi tohoto genu intenzivnější zbarvení květů, opak byl pravdou (zbarvení květů bylo variegované a často byly květy úplně bezbarvé). Pozorovaný jev byl nazván ko-suprese genové exprese, ale jeho podstata zůstala neobjasněna. Několik let poté byl pozorovaný jev, kdy rostliny, které byly transformovány krátkými, nekodujícími úseky patogenních virů byly vůči těmto virům rezistentní. Jako příčina pozorovaného jevu byla uváděna inhibice virové replikace. Opačný přístup, při kterém byla část rostlinného genu vnesena do viru, kterým byla infikována následně rostlina, vedl k potlačení exprese tohoto genu. Tento konkrétní jev byl nazván virem indukované umlčování genu (virus-induced gene silencing, VIGS). Obecně byly výše zmíněné fenomény označeny termínem post-trankripční umlčování genů. 6.2. Mechanizmus RNAi RNAi narušuje v obecném slova smyslu expresi (vyjádření) genetické informace na základě působení dvouvláknových RNA molekul působících na cílovou molekulu nukleové kyseliny (DNA či RNA), která je částečně nebo zcela komplementární. Celý proces, který se nazývá RNAi začíná působením enzymu Dicer (RNáza III) na dvouvláknovou RNA. Dicer je schopen štěpit dsRNA na fragmenty o délce 20-25 nukleotidů. Jeden z řetězců vzniklé krátké molekuly RNA je posléze zabudován do proteinového komplexu RISC (RNA-induced silencing komplex). RISC komplex v případě rozpoznání komplementární molekuly RNA (např. mRNA) k zabudované krátké ssRNA zahájí degradační proces vedoucí k fragmentaci původní dlouhé molekuly na krátké úseky ssRNA. Degradace cílové molekuly RNA je dosaženo pomocí katalytické části RISC komplexu, která se nazývá argonaut. Zmíněným procesem může být potlačeno vyjádření genu (knock-down) po již proběhlé transkripci (translation repression). V případě, že se naváže původní krátká molekula místo do komplexu RISC do komplexu RITS (RNA-induced transcriptional silencing) může dojít k potlačení již 74 samotné transkripce potenciálních komplementárních DNA úseků. Tento proces je zpravidla doprovázen reorganizací chromatinu (metylace DNA a histonů). 6.3. Typy malých RNA V současné době se rozlišuje několik typů krátkých molekul RNA, které souvisí s RNA interferencí: siRNA (small interfering RNA), miRNA (micro RNA), piRNA (Piwiassociated RNA). Základní rozlišení těchto krátkých RNA molekul je odvozeno od jejich původu, s čímž souvisí i následný způsob jejich zpracování vlastní buňkou. Je více než pravděpodobné, že se bude s přibývajícími poznatky o krátkých RNA molekulách tvořit a měnit jak základní názvosloví v celém procesu RNAi, tak bude přibývat i klíčových hráčů (enzymů…) vedoucích k umlčování RNA. 6.3.1 siRNA ( small interfering RNA) Krátké molekuly siRNA byly poprvé popsány a publikovány skupinou Davida Baulcombeho v roce 1999. SiRNA jsou úzce spjaty s obranou buňky proti virům a s formováním heterochromatinu. Na bázi přítomnosti dlouhé dvouvláknové RNA molekuly v buňce jsou vytvořeny pomocí enzymu dicer krátké úseky této RNA (21-25 nukleotidů). Jako templát pro činnost enzymu dicer může v případě siRNA sloužit exogenní ds RNA viry popřípadě dsRNA forma jiných virů, která se tvoří během jejich replikace či exprese, dále potom dsRNA molekuly endogenního původu (aberantní transkripty, retroviry) a uměle do buňky vnesené konstrukty, jež mají vyvolat cílené umlčení určitého lokusu. 6.3.2 miRNA (micro RNA) MicoRNA jsou endogenní molekuly RNA kódovány genomovou DNA vlastní buňky, které regulují expresi genů. MicroRNA je přepisována z DNA do formy primárního transkriptu (pri-miRNA). Pri-miRNA formuje následně vlásenkovou strukturu (pre-miRNA) o celkové delce 70 nukleotidů. V cytoplazmě je pre-miRNA zformována do finální podoby pomocí enzymu Dicer (endonukleáza, která odštěpí vlásenkovou strukturu) a posléze je zformován 75 s miRNA tzv. RISC komplex (RNA-induced silencing complex). Aby RISC komplex mohl vytvořit funkční efektorový komplex, dsRNA původní miRNA molekuly je rozdělena na jednotlivé ssRNA řetězce. Pouze jenom jeden z těchto řetězců (guide strand) je rozpoznáván proteinem argonaut, který je součástí RISC komplexu. Druhý řetězec (anti-guide, passenger strand) je následně degradován. Aktivovaný RISC komplex pokud dojde k párování integrované ssRNA molekuly s cílovou komplementární mRNA zablokuje translaci (časté u živočichů) nebo zahájí degeneraci mRNA pomocí argonaut proteinů (rostliny). U živočichů se miRNA vážou nejčastěji na 3' UTR oblast zatímco u rostlin dochází k vazbě po celé kódující oblasti mRNA. Ačkoli je proces RNAi na bázi miRNA podobný u živočichů i u rostlin a tudíž se jedná o evolučně starobylý proces, některé organizmy, zdá se, schopnost RNAi sekundárně ztratily. Jedná se zejména o některé druhy hub, parazitické prvoky (např. Leishmania major a Trypanosoma cruzi) a kvasinky (Saccharomyces cerevisiae). U bakterií se pravděpodobně vyskytuje k RNAi analogický fenomén nazvaný CRISPR (Clustered regularly interspaced short palindromic repeats). CRISPR představuje soubor téměř palindromatických opakování DNA motivů o délce 24-48 nukleotidů. Tato opakování jsou přerušována mezerniky o podobné délce. Tyto mezerníky jsou značně podobné sekvencím u některých fágů. Experimentálně bylo prokázáno, že přítomnost těchto krátkých úseků fágů organizovaných do určitých palindromatických struktur může souviset s obranou bakterií proti fágovým infekcím. 6.3.3. piRNA (Piwi-associated RNA) PiRNA (Piwi-associated RNA) jsou další známí zástupci krátkých RNA molekul v buňce. Jejich přítomnost a aktivita byla zjištěna v zárodečných buňkách živočichů. Ačkoli je známo zatím jenom málo, zdá se, že piRNA slouží promárně jako obrana před sobeckým genetickými elementy. Poprvé byly popsány jako atypické siRNA u drozofyly. Protože byly podobné určitým repeticím v genomu, byly nazvány rasiRNA (repeat-associated siRNA). Jejich aktivita je spojována zvláště s umlčováním endogenních retrotranspozonů během spermatogeneze. PiRNA jsou proti miRNA a siRNA delší (26-31 nukleotidů) a tvoří komplex 76 s piwi proteiny (patří do skupiny argonaut proteinů). PiRNA v genomu nejsou formovány jako vlásenkové struktury, jak je tomu u miRNA. Jedno z vysvětlení existence piRNA bylo formování nezpárované DNA během meiozy (její existence může být daná například retrotranspozicí). U Neurospora crassa vyvolá nezpárovaná DNA při meioze proces tzv. MSUD (meiotic silencing of unpaired DNA). Kapitola VII.: EVOLUCE SEXUALITY 7.1. Aspekty pohlavního rozmnožování 7.2. Pohlavní chromozómy a historie cytogeneticky 7.3. Mechanizmy evoluce pohlavních chromozómů 7.4. Molekulární důsledky degenerace pohlavních chromozómů 7.5. Evoluce pohlavních chromozómů rostlin 7.6. Determinace pohlaví u rostlin s pohlavními chromozómy 7.1. Aspekty pohlavního rozmnožování Pohlavní rozmnožování je spolu se všemi molekulárními aspekty týkajícími se této strategie uchovávání a evoluce genetické informace v čase, podle koncepce sobeckého genu, jedním z nejsamozřejmějších a přitom nejzáhadnějších aspektů našeho současného biologického poznání. O pohlavním rozmnožování lze hovořit již u bakterií, kdy je během procesu konjugace přenášena genetická informace z jedné bakteriální buňky do druhé. Jak postupujeme po evoluční větvi živočišné říše nahoru, k organizmům nejvíce diferencovaným, stává se pohlavní rozmnožování v podstatě samozřejmostí a u obratlovců již představuje výhradní reprodukční strategii. Pokud dochází u živočichů k pohlavnímu rozmnožování, je téměř pravidlem, že samčí a samičí gamety jsou produkovány odlišnými organismy. U rostlin je situace odlišná. Velká část rostlinných druhů může využívat jak pohlavního tak nepohlavního rozmnožování. V rámci pohlavního rozmnožování je kolem 90% rostlinných druhů hermafroditních. U zbylých 10% rostlin se vyvinula „unisexualita“ květů, buď ve formě jednodomosti (monoecy), kdy se na jedné rostlině vyskytují samčí i samičí květy, nebo dvoudomosti, kdy lze danou rostlinu podle pohlaví květů označit za samčí nebo samičí. Jednotlivé fenotypové projevy sexuality, kdy vznikají dvě skupiny jedinců v rámci druhu, které nesou morfologicky i funkčně odlišné gamety, mají svoji analogii i na molekulární úrovni. Snad nejzajímavějším z těchto molekulárních následků sexuality je vznik pohlavních chromozómů. 7.2. Pohlavní chromozómy a historie cytogeneticky Poprvé byl vztah mezi pohlavností a chromozómy naznačen v práci H. Henkinga (1891) , který pozoroval během meiózy u Pyrrhocoris apterus (Hemiptera), že do dceřinných buněk přechází v polovině případů nepárový element podobný chromozómu. Henking svoji nejistotu při pozorování vyjádřil i označením daného útvaru: struktura X. Že pozorovaná struktura X souvisí s determinací pohlaví postuloval v roce 1901 C.E. McClung. McClung mluví o pozorovaném „pohlavním“ chromozómu jako o chromozómu přídatném (accesory). V roce 1905 Nettie Stevens ukázala, že přídavný chromozóm má u Tenebrio molitor svého partnera. Tyto dva chromozómy nazvala X a Y. Její pozorování byla záhy potvrzena pro jiné druhy hmyzu Edmundem Wilsonem. Přes tyto úspěchy při objevování pohlavních chromozómů v živočišné říši, byly vůbec první heterochromozómy u organismu s determinací pohlaví XX/XY zjištěny u rostliny Silene latifolia. 77 7.3. Mechanizmy evoluce pohlavních chromozómů Již v šedesátých letech predikoval Susumo Ohno, že se pohlavní chromozómy vyvinuly z autozómů. Jedna z teorií říká, že pokud se na konkrétním páru chromozómů vyskytují lokusy související s determinací pohlaví (jak samčího, tak samičího), a jestliže určité přechodné genotypy měly sníženou zdatnost (například reprodukční), potom bude přirozený výběr silně působit na zastavení rekombinace mezi zmíněnými lokusy. Ztráta rekombinace mezi proto-X a proto-Y chromozómy vede k akumulaci mírně škodlivých (deleterious) mutací na nerekombinující části Y chromozómu. Tato skutečnost je umocněna faktem, že chromozóm Y je přítomen pouze v jedné kopii, a to pouze u jednoho ze dvou stávajících pohlaví. Efektivní velikost populace je tudíž pro chromozóm Y 3x nižší než pro X, a tak je chromozóm Y mnohem více vystaven náhodným evolučním procesům vedoucím k fixaci škodlivých alel během genetického driftu. Další evoluční mechanismy vedoucí k degeneraci chromozómu Y lze rozdělit do čtyř skupin: 1. Müllerova rohatka (Müller’s ratchet) Tento proces představuje náhodnou ztrátu nejméně mutované skupiny chromozómů. I za nepřítomnosti rekombinace a zpětných mutací dochází k běžné mutační zátěži chromozómu Y. Mírně škodlivé a neutrální mutace nejsou rekombinací odstraňovány a jsou na Y chromozómu kumulovány. Genetickým driftem je potom v populaci nejpravděpodobněji fixován chromozóm s nejčastěji se vyskytující mutační zátěží. Poněvadž jen s malou pravděpodobností se jedná o chromozóm nejméně mutovaný, dochází k postupné degeneraci chromozómu, která je o několik řádů rychlejší, než kdyby se jednalo o populaci volně rekombinující. 2. Hill-Robertsonův efekt (Hill-Robertson effect) Hill-Robertsonův efekt je proces podobný Müllerově rohatce. Pokud jsou dvě selektované alely v silné vazbě a interferují navzájem, potom tato situace vede k zabránění eliminace škodlivých mutací a potlačení výhodných mutací. Tento jev ovšem nehraje zásadní roli v degeneraci nerekombinujících chromozómů. 3. Evoluční svezení se (hitchhiking) Pokud dojde na nerekombinujícím chromozómu ke vzniku výhodné mutace (a pokud bude tato mutace natolik výhodná, že bude v populaci fixována), budou s ní v populaci fixovány i škodlivé mutace, které jsou ve vazbě. 4. Selekce na pozadí (background selection) Během selekce na pozadí dochází ke snižování efektivní velikosti populace, poněvadž dochází k selekci proti škodlivým mutacím. Redukce efektivní velikosti populace potom urychluje degeneraci nerekombinujícího chromozómu procesy výše zmíněnými. 78 7.4. Molekulární důsledky degenerace pohlavních chromozómů Evoluce pohlavních chromozómů a následná degenerace nerekombinující oblasti heteromorfního chromozómu je v současné době nejvíce prostudována u člověka. U člověka je genetické určení pohlaví XX/XY, kdy dochází k vývinu samčího pohlaví v přítomnosti dominantního chromozómu Y, za nepřítomnosti Y se vyvíjí samička. Chromozóm Y je nejmenším lidským chromozómem (cca 60 milionů bází) a narozdíl od několika tisíc genů ležících na chromozómu X, jich Y obsahuje pouze několik desítek. Předpokládá se, že lidské heteromorfní chromozómy se vyvinuly z páru autozómu před asi 240-320 milionů let. Progenitory pohlavních chromozómů zřejmě obsahovaly geny důležité pro determinaci pohlaví, jejichž vzájemná rekombinace byla díky selekčnímu tlaku v určité fázi evoluční historie zastavena mechanismem chromozómové inverze. Během evoluce došlo na chromozómu Y ke čtyřem velkým inverzím, což lze vysledovat z různé míry divergence mezi jednotlivými oblastmi chromozómu X a Y. Téměř 95% chromozómu Y zahrnuje oblast MSY (male specific region of the Y), která nerekombinuje s chromozómem X. Obecně lze oblast MSY rozdělit na heterochromatinovou část, obsahující vysoce repetitivní sekvence DNA, a oblast 79 euchromatinovou, ve které se nacházejí geny. Euchromatinová část obsahuje tři různé typy sekvencí, jejichž rozdělení je dáno jejich původem. První typ sekvencí je pozůstatkem z dob, kdy pár chromozómů X a Y patřil mezi standardní autozómy. Tyto sekvence na chromozómu Y během evoluce postupně degenerovaly a v současné době vykazují jen částečnou homologii se svými protějšky na chromozómu X. Proto je v této oblasti častý výskyt pseudogenů, které představují nefunkční, degenerované verze původně kódujících genů. Druhá část euchromatinové oblasti Y představuje sekvence přenesené z chromozómu X přibližně před 3-4 miliony let. Tato oblast je mezi chromozómy X a Y asi z 99% homologní a do současné doby v ní byly nalezeny pouze dva funkční geny. Poslední částí euchromatických oblastí MSY jsou palindromatické, opakující se sekvence, se vzájemnou homologií téměř 99,9%. Množství těchto typů sekvencí na MSY je mnohem větší, než je genomový průměr. Navíc tato oblast obsahuje téměř výhradně geny, které jsou specificky exprimovány u samců. Je tudíž velmi pravděpodobné, že na chromozómu Y se vyvinul alternativní mechanizmus, který brání důležité genové oblasti MSY před degenerací. Tímto mechanizmem je zřejmě genová konverze. 80 7.5. Evoluce pohlavních chromozómů rostlin V rostlinné říši není existence dvou pohlaví nijak výrazně provázena pohlavním dimorfismem. Pouze na úrovni reprodukčních orgánu (květů) dochází ke vzniku dimorfismu, na základě čehož je možno rozlišovat samčí a samičí rostliny. Co se týče genetické determinace pohlaví, nedochází často k diferenciaci pohlavních chromozómů. Příkladem je tykvice stříkavá (Ecballium elaterium), u které je pohlaví determinováno pouze jedním lokusem. Jiným, v nedávné době podrobně studovaným modelem s jednolokusovou determinací pohlaví, je papája (Carica papaya). Pohlaví řízené několika lokusy je v rostlinné říši zastoupeno například bažankou roční (Mercurialis annua), u které se prokázalo, že rostlinné hormony mají vliv na expresi pohlaví. Z výše zmíněných druhů dvoudomých rostlin bez diferencovaných pohlavních chromozómů je v současné době nejvíce analyzována v souvislosti s determinací pohlaví papája. Jak již bylo zmíněno, pohlaví papáji je determinováno jedním lokusem, který je zastoupen třemi alelami. M1 je dominantní alela, za jejíž přítomnosti dochází ke vzniku samčího pohlaví, M2 je dominantní alela, jež je spjata s hermafroditismem a m je recesivní alela samičího pohlaví. Samečci mají potom genotyp M1m, hermafroditi M2m a samičky mm. Kombinace dvou dominantních alel je embryonálně letální. V nedávné době byla charakterizována na chromozómu Y oblast o velikosti 5 Mbp (10% průměrné délky chromozómu), která nerekombinuje s chromozómem X. Tato oblast ve srovnání s ostatními částmi genomu papáji vykazuje o 38% nižší zastoupení genů, zatímco retroelemntů je zde o 28% více a obrácených repetic o 189% více. Tyto skutečnosti jsou jasnými důkazy, že v této nerekombinující oblasti dochází k degeneraci chromozómu Y. Navíc srovnání DNA sekvencí oblasti MSY mezi samečky a hermafroditními organismy v porovnání se samičí alelou m ukázalo, že lokusy M1 a M2 vykazují navzájem mnohem vyšší stupeň homologie v porovnání s lokusem m. Tento fakt je prvním přímým důkazem, že dvoudomost se vyvinula během evoluce přes gynodioecii. Relativně malý genom papáji (372 Mbp, srovnatelná hodnota s Arabidopsis či rýží), již vytvořená podrobná genetická mapa a vysoký hospodářský význam této rostliny jsou výraznými faktory, jež v blízké budoucnosti pravděpodobně z papáji vytvoří hlavní model pro studium evoluce pohlavních chromozómů u rostlin. 7.6. Determinace pohlaví u rostlin s pohlavními chromozómy Heteromorfní pohlavní chromozómy se stejně jako dvoudomost vyvinuly u rostlin nezávisle a mnohokrát u evolučně naprosto vzdálených čeledí. Mezi nejznámější rostliny, u kterých byly jednoznačně prokázány heteromorfní pohlavní chromozómy patří zástupci rodů Silene (Caryophyllaceae), Humulus (Cannabinaceae) a Rumex (Polygonaceae). Pohlavní chromozómy byly nalezeny též u nižších rostlin, konkrétně u jatrovky Marchantia polymorpha. Tato rostlina je ve fázi gametofytu v haploidním stavu, a tudíž se v genomu vyskytuje vždy pouze jeden pohlavní chromozóm, buď X nebo Y. Tato skutečnost je jednoznačnou výhodou pro případné analýzy, jak na genetické, tak na molekulární úrovni. V nedávné době byla objevena u játrovky Y specifická oblast, která kromě repetitivních sekvencí obsahuje genovou rodinu kódující protein, jehož přítomnost byla specificky prokázána v samčích reprodukčních orgánech. Pro studium pokročilé fáze evoluce pohlavních chromozómů rostlin je asi nejvhodnějším modelem šťovík (Rumex acetosa). Stejně jako Drosophila melanogaster má šťovík determinaci pohlaví X/A. U samečků jsou přítomny dva chromozómy Y (Y1 a Y2), které jsou tvořeny téměř výhradně heterochromatinem. Bylo prokázáno že tento heterochromatin je tvořen tandemovými repeticemi DNA. 81 U jahodníku (Fragaria elatior) a vrby (Salix viminalis) byly nalezeny DNA markery, které segregují pouze po samičí linii. Tato skutečnost zřejmě ukazuje na přítomnost heterogametního samičího a homogametního samčího pohlaví, stejně jako u ptáků nebo u některých zástupců hmyzu (genetická determinace pohlaví, kdy samičky mají sestavu pohlavních chromozómů ZW a samečci ZZ). 82 Kapitola VIII.: LIDSKÝ GENOM A EVOLUCE ČLOVĚKA 8.1. Struktura lidského genomu 8.1.1. Velikost a základní struktura 8.1.2. Genové rodiny v lidském genomu 8.1.3. Repetice – satelity a mobilní elementy 8.1.4. Pohlavní chromosomy – bizardní část genomu 8.1.5. Srovnání genomu člověka s genomem myši a šimpanze 8.2. Evoluce člověka 8.2.1. Nejstarší hominidi – Sahelanthropus, Orronin, Ardipithecus 8.2.2. Archaičtí hominidi – australopitékové, Paranthropus 8.2.3. Nejstarší příslušníci rodu Homo - H. habilis 8.2.4. Předmoderní člověk, H. erectus – první expanze do světa 8.2.5. Neandertálci 8.2.6. Původ moderního člověka – dvě teorie, H. sapiens 8.2.7. Floreský člověk – nedávno žijící Hobit 8.1. Struktura lidského genomu 8.1.1. Velikost a základní struktura Lidský genom je velký přibližně 3 200 Mb a je rozdělen do 22 párů autosomů a jednoho páru pohlavních chromosomů. Jejich velikost se pohybuje se v rozmezí 60-250Mb. Člověk má přibližně 20 000 – 25 000 genů. Jejich identifikace stále probíhá a počet genů se zpřesňuje. Situaci totiž komplikuje existence složených genů, které jsou často velmi dlouhé a rozdělené do mnoha exonů a intronů. Navíc u mnoha genů dochází k alternativnímu sestřihu. Geny nejsou na chromosomech rozděleny rovnoměrně. Některé chromosomy (např. autosomy 19 a 22) jsou bohaté na geny, jiné jsou genově chudé (např. pohlavní chromosom Y, autosomy 4 a 18). I v rámci chromosomů lze sledovat genově bohatší oblasti nacházející se převážně v euchromatinu, zatímco heterochromatin je většinou tvořen nekódujícími, převážně repetitivními, sekvencemi DNA. Někdy se mluví o genově chudých genomových „pouštích“ dlouhých několik milionů bází.Vysoká hustota genů je v subtelomerách. Shluky genů jsou často výsledkem duplikací nějakého původního genu následovanou jejich rozrůzněním. Není to však pravidlem, bylo zjištěno, že shlukování může souviset s koordinovanou expresí a funkcí skupiny genů a nemusí být jen důsledek duplikace. Většinu genomu tvoří nekódující repetitivní sekvence v podobě jednak tandemových repeticí, jednak rozptýlených repeticí. Rozptýlené repetice jsou představovány mobilními elementy, zvláště pak retroelementy. Mobilní elementy tvoří přibližně polovinu genomu. Předpokládá se, že jejich aktivita poklesla někde v evoluční linii hominidů, takže dnes představují vesměs neaktivní elementy. Podle některých prací dokonce explozivní amplifikace mobilních elementů vždy předcházely speciacím – oddělování jednotlivých linií hominidů. 83 Genová DNA Lidský jaderný genom Kódující DNA Nekódující DNA Pseudogeny Genové fragmenty Introny Negenová DNA Jedinečné sekvenceRepetice Tandemové repetice Rozptýlené repetice Satelitní DNA Minisatelitní DNA Microsatelitní DNA LTR elementy SINE elementy LINE elementy DNA transpozony Organizace lidského genomu Genetická informace je v lidských buňkách uložena kromě jádra také v mitochondriích. Mitochondriální genom je velký pouhých 16kb a obsahuje 37 genů. Je organizován velmi úsporně. Celých 93% mitochondriální DNA (mtDNA) tvoří kódující sekvence, geny nemají introny. Některé geny se dokonce překrývají. Jedno vlákno, tzv. těžký řetězec, kóduje 28 genů, zatímco komplementární vlákno, tzv. lehký řetězec, nese 9 genů. Většina genů kóduje RNA (22 tRNA a 2 rRNA) podílející se na tvorbě proteosyntetického aparátu mitochondrií. Zbývajících 13 genů kóduje polypeptidy důležité pro oxidativní procesy probíhající v mitochondriích. Tyto polypeptidy jsou syntetizovány na mitochondriálních ribozómech, strukturně podobných ribozómům prokaryot. Většina proteinů potřebných pro fungování mitochondrií je však kódována jadernými geny a importována do mitochondrií. 8.1.2. Geny a genové rodiny v lidském genomu, nekódující RNA Geny tvoří přibližně 30% lidského genomu zatímco většinu představují negenové oblasti. Z toho více než 90% je nekódujících a pouze 5-10% genových oblastí je kódujících a překládá se do struktury proteinů. Nekódující oblasti jsou tvořeny převážně introny, pseudogeny a genovými fragmenty. Průměrná velikost genů v lidském genomu je kolem 30kb, některé geny jsou velké pouze stovky bází, zatímco jiné i několik milionů bází. Na jejich velikosti se podílejí zejména introny, jejichž počet může být často vysoký. Extrémní příklady představuje gen pro dystrofin se 79 exony nebo gen pro kolagen typu 7 se 118 exony. Délky exonů jsou značně konservativní, kolem 170bp. Kuriózní jsou geny ležící v intronech jiných genů, příkladem je gen NF1 obsahující v jednom svém intronu dlouhém 40kb tři malé geny, každý z nichž se dvěma exony. Pozoruhodné jsou i komplexní geny kódující imunoglobuliny a receptory T buněk. Jsou tvořeny značným počtem subgenů, jejichž kombinování je zdrojem rozmanitosti protilátek. Tyto geny podléhají speciálnímu sestřihu na úrovni DNA, tzv. VDJC rekombinaci, a poté sestřihu na úrovni RNA. Značná část genů člověka je součástí genových rodin. Zatímco někteří členové rodin jsou totožní, jiní mohou představovat značně divergované a nefunkční pseudogeny či genové fragmenty. Někdy lze sledovat homologie pouze mezi silně konzervativními doménami (např. homeobox u homeotických genů) nebo mezi konzervativními sekvenčními motivy (např. DEAD box u genů pro helikázy). Ke klasickým rodinám patří geny pro tRNA a rRNA. Geny kódující 30 různých typů tRNA jsou členy různých vzájemně příbuzných rodin. Jednotlivé tRNA rodiny mají 10-100 84 členů a celá nadrodina tRNA včetně pseudogenů má přibližně 900 členů. Další významnou rodinu představují geny pro rRNA, jejichž produkty jsou součástí eukaryotických ribozómů. Tyto geny jsou shlukovány v dlouhých řadách a vytvářejí tzv. rDNA. Další rodiny tvoří geny pro malé jaderné RNA - snRNA (small nuclear RNA) a malé jadérkové RNA - snoRNA (small nucleolar RNA). Rodiny genů kódující jednotlivé typy histonů se vyznačují tím, že jejich členové vykazují vysokou vzájemnou identitu. Naopak členové některých jiných rodin se značně liší v sekvenci DNA, expresi a někdy také funkci. Ve velkých rodinách kódujících snRNA, účastnící se sestřihu RNA, se nachází značný počet pseudogenů a genových fragmentů. Pseudogeny jsou běžnými členy genových rodin. Může jít jednak o nefunkční kopie genů, které buď nejsou exprimovány anebo jsou exprimovány, ale jsou nefunkční. Jiné pseudogeny, tzv. retropseudogeny, vznikly reverzní transkripcí mRNA. V důsledku toho obsahují pouze exonové sekvence genů. Jsou součástí rozptýlených genových rodin. Pokud se retropseudogen včlení poblíž funkčního promotoru, může být transkribován. Transkribovány jsou i retropseudogeny vzniklé přepisem RNA polymerázou III, která používá k zahájení transkripce promotory ležící uvnitř genů. Zvláštní genetické entity představují úseky kódující malé molekuly RNA, které nejsou překládány do proteinů (tzv. non-coding RNA). Jejich funkční význam je však zřejmě obrovský. Malé RNA zřejmě představují svět paralelní světu proteinů, jež reguluje množství biologických procesů, tento fenomén se označuje jako „RNA interference“. Významným hráčem jsou tzv. microRNA, jichž kóduje lidský genom více než 800. Velkým překvapením plynoucím z projektu sekvenování lidského genomu je objev ultrakonzervativních elementů, úseků DNA vysoce konzervovaných mezi evolučně vzdálenými druhy. Lidský genom obsahuje asi 500 těchto oblastí, každý o délce přes 200bp. Je záhadou, jakou vysoce konzervativní úlohu tyto sekvence plní. Nyní se zdá, že jsou tvořeny několika překrývajícími se vazebnými místy pro transkripční faktory, tzv. zesilovači transkripce (enhancery). Jejich vysoká konzervativita se pak vysvětluje tím, že jakákoliv mutace by vedla k narušení funkce jednoho či více transkripčních faktorů. Segment lidského genomu 10kb exon LINE intron pseudogen 20kb 40kb 30kb 50kb SINE LTR element mikrosatelit DNA transposon 85 8.1.3. Repetice – satelity a mobilní elementy Repetitivní sekvence DNA v lidském genomu existují ve dvou základních typech organizace – jako tandemové repetice a jako rozptýlené repetice. Tandemové repetice se člení na satelity, minisatelity a mikrosatelity. Rozptýlené repetice představují především retroelementy, tedy mobilní elementy šířící se po genomu retrotranspozicí. Satelitní DNA tvoří úseky dlouhé stovky kilobází až několik megabází. Díky odlišnému obsahu bází oproti ostatní DNA vytvářejí satelitní DNA po centrifugaci v hustotním gradientu přidatný proužek, tzv. satelit. Nejznámější je alfa satelit (alfoidní DNA) nacházející se v centromerách všech chromosomů. Minisatelitní DNA tvoří bloky o délce stovek bází až stovek kilobází. Celkem je v genomu přes 1000 bloků minisatelitní DNA. Tyto sekvence jsou velmi polymorfní, čehož se využívá v genetickém mapování. Minisatelity jsou základem metody „otisků prstů DNA“ (DNA fingerprinting), umožňující identifikaci jedinců, např. v soudním lékařství. Předpokládá se, že minisatelity hrají roli jako horká místa pro rekombinaci. Významnou skupinou minisatelitní DNA je telomerická DNA nacházející se na koncích chromosomů. Opakováním základního monomeru TTAGGG vznikly úseky dlouhé 10-15kb. Hexanukleotid je syntetizován enzymem telomerázou a chrání konce chromosomů před degradací. Mikrosatelitní DNA tvoří krátké úseky jednoduchých sekvencí roztroušených po genomu, z nichž některé, např. CA, jsou velmi běžné. Mikrosatelity mohou vytvářet neobvyklé konformace DNA či struktury typu vlásenek, což možná stojí v pozadí mechanizmu jejich amplifikace (tzv. „slippage“ - „prokluzování“ DNA polymerázy). Ačkoliv se většinou nacházejí mimo geny, některé mikrosatelity leží v genech, kde jejich expanze může vést k řadě onemocnění jako Huntingtonova chorea (expanze CAG), fragilní chromosom X (expanze CGG) a mnohé další. Hlavní skupinou rozptýlených repetic v genomu člověka jsou tzv. SINE elementy (short interspersed nuclear elements) a LINE elementy (long interspersed nuclear elements). Jsou známy i další menší rodiny jako jsou lidské endogenní retroviry (HERV) nebo retrovirům podobné elementy (RTLV). Představitelem SINE elementů jsou Alu elementy, které jsou se svým více než 1 milionem kopií nejhojnější lidskou sekvencí, vyskytující se v průměru každé 3kb. Nacházejí se přednostně v GC-bohatých oblastech. Alu elementy vznikly jako pseudogen genu 7SLRNA. Jejich funkce není zatím známa, předpokládá se, že nějak podporují rekombinaci, výsledkem čehož jsou duplikace genů evolučně výhodné pro genom. Alu elementy se nacházejí pouze v genomech primátů. Představitelem LINE elementů je element L1. V lidském genomu je přítomen ve více než půl milionu kopiích nacházejících se převážně v euchromatinu. Základní element je dlouhý 6.1 kb a obsahuje dva geny, z nichž jeden kóduje reverzní transkriptázu. Těchto funkčních elementů je u člověka jen malá část, zatímco většina kopií je zkrácena na 5‘ konci a představuje tak defektní kopie. L1 elementy se nacházejí i v genomech jiných savců. Endogenní retroviry jsou sekvence podobné retrovirům, nejsou infekční, neboť jsou omezeny pouze na genom svého hostitele. Kódují reverzní transkriptázu a obsahují dlouhé koncové repetice, LTR. V lidském genomu se nacházejí většinou v podobě silně poškozených neúplných kopií, nejčastěji pouze jako solitérní LTR. Představují tak zřejmě otisky dávných retrovirových infekcí v genomech starobylých primátů. Rovněž DNA transposony, podobné bakteriálním transposonům představují neaktivní fosilie v lidském genomu. 8.1.4. Pohlavní chromosomy – bizardní část genomu Existence pohlavních chromosomů představuje jednu z nejpozoruhodnějších otázek evoluční biologie. Muž nese pár pohlavních chromosomů X a Y, žena dva chromosomy X. Chromosom Y je velký 60Mb a je tak nejmenší z lidských chromosomů. Více než 95% jeho délky je specifická pro muže, pouze na koncích jsou úseky totožné s chromosomem X, tzv. 86 pseudoautosomální oblast. Zatímco chromosom X obsahuje několik tisíc genů, chromosom Y jich nese méně než sto. Klíčovou roli hraje gen SRY, spouštějící vývoj varlat. Při sekvenování chromosomu Y se zpočátku zdálo, že obsahuje pouze repetitivní DNA, nakonec se však ukázalo, že se jedná o bizardní oblast genomu, kde se uplatňují pozoruhodné evoluční procesy. Bylo totiž zjištěno, že chromosom Y obsahuje ohromné palindromy – úseky DNA, které lze číst v obou směrech stejně. Palindromy dosahují délek až 3Mb a vykazují 99.9% vzájemnou identitu. Přítomnost palindromů u šimpanze ukázala, že se jedná o evolučně staré struktury. V oblastech palindromů se nachází většinou geny, které byly v evoluci přeneseny na chromosom Y z autosomů a poté získaly určitou samčí funkci. Je známo, že chromosom Y degeneruje. Příčinou degenerace je nemožnost rekombinace, která jinak funguje jako mechanismus opravy chyb. Geny na chromosomu Y se brání degeneraci tím, že nahrazují párování s chybějícím partnerem na chromosomu X tak, že se párují s partnerem ležícím v odpovídajícím palindromu na témže chromosomu a opravují se procesem genové konverze. Navíc samčí geny na chromosomu Y jsou zálohované, jsou přítomny ve 2-6 kopiích, jeden důležitý gen dokonce ve 35 kopiích. Srovnání genů ležících na chromosomech X a Y ukázalo, že na chromosomu X existují 4 evoluční vrstvy, přičemž každá z nich vznikla v důsledku postupných zástav rekombinace mezi X a Y způsobené inverzemi na chromosomu Y. 8.1.5. Srovnání genomu člověka s genomem myši a šimpanze Značný pokrok v poznání genomu myši a šimpanze umožňuje činit závěry týkají se obecných vlastností genomů savců a primátů. I přes značnou morfologickou odlišnost je zřejmá podobnost klíčových vývojových procesů i celkové struktury genomů savců. Z genetického hlediska jsou pro savce unikátní genomový imprinting a inaktivace chromosomu X. Srovnání genomu člověka a myši Myš je nejběžnějším modelovým druhem pro studium lidských nemocí, časná stadia embrya člověka a myši jsou velmi podobná. K oddělení obou linií došlo před přibližně 100 miliony let. Myš má podobně velký genom jako člověk. Jeho organizace do chromosomů je však zcela odlišná. Myš má 20 párů akrocentrických chromosomů. Počet genů je podobný 87 člověku, genové rodiny mají často odlišné počty genů. Pořadí genů většinou není konzervativní. Výjimkou je chromosom X se silnou konzervativitou uspořádání genů. Velikost i organizace genomů ostatních primátů se velmi podobá genomu člověka. Náš genom má mozaikovou strukturou. Většina oblastí našeho genomu je sice nejpříbuznější šimpanzům, avšak jeho nezanedbatelná část se nejvíce podobá gorilám. Rozdíl v genomech člověka a šimpanze činí asi 1.2%.Od oddělení větví vedoucích k šimpanzům (před 4-8 miliony let) a gorilám (před 5-8 miliony let) došlo v jejich genomech k četným přestavbám. Hlavní z nich byla fúze dvou chromosomů za vzniku lidského chromosomu 2 (šimpanz i gorila mají 24 párů, člověk 23 párů). Pořadí genů je značně konzervativní, v některých rodinách došlo k nedávným duplikacím či ztrátě genů, čímž vznikly geny specifické pro člověka nebo šimpanze. Pouze vysoce repetitivní DNA prošly rychlejší evolucí a jsou divergované. Pozoruhodným genem, často spojovaným s „lidstvím“, je gen FOXP2 (forkhead box P2), jehož lidská forma vznikla před nějakými 200 000 let, tedy v době vzniku H. sapiens (viz níže). Tento gen kóduje transkripční faktor a souvisí s rozvojem řeči, chápáním pojmů a kreativitou. Na jeho význam upozornily již problémy jedné britské rodiny, jejichž členové trpěli závažnými poruchami řeči a ukázalo se, že mají právě gen FOXP2 poškozen. U člověka se z nějakého důvodu právě transkripční faktory vyvíjely rychleji než u šimpanze. Geny důležité pro fungování mozku se u člověka měnily nejrychlejším tempem a jsou evolučně nejvybroušenější. Podobně rychlou evoluci vykazují i geny související s tvorbou spermií, což je logické, neboť každé zlepšení se projeví hned v příští generaci. Z genetického hlediska je člověk jedinečný mezi primáty svou nízkou variabilitou. Je to zřejmě důsledek redukce efektivní velikosti populace v minulosti (tzv. bottleneck effect), která vedla ke ztrátě původně větší variability. Co dělá člověka člověkem? Které geny nás dělají lidmi? Není známo, které geny nás předurčují k chůzi po dvou, mají na svědomí velký mozek či dorozumívání komplikovanou řečí nebo abstraktní myšlení. V pozadí mohou být pouze nepatrné změny v genech měnících expresi genů důležitých ve vývojových procesech a fungování nervového systému. Zdá se, že jde spíše o způsob fungování genomu, realizaci jeho informace, než o jeho pouhou strukturu. Je to jako zahrát na velmi podobné nástroje (například dva klavíry, z nichž jeden má o klávesu navíc a některé klávesy jsou přehozené) zcela odlišná preludia. 8.2. Evoluce člověka Vývojovou linii vedoucí k Homo sapiens (člověk moudrý) tvořili podle dnešních představ Sahelanthropus tchadensis, gracilní australopitékové (A. afarensis, A. africanus), H. habilis (člověk zručný) a H. erectus (člověk vzpřímený). H. habilis používal i uměl vyrobit nástroje ze dřeva, kamene a kosti a uměl udržovat oheň. H. erectus žil v jeskyních a jednoduchých příbytcích. Všeobecně je přijímána představa, že člověk vznikl v Africe, odkud pochází nejvíce nálezů. Na některých lokalitách žilo dokonce více druhů hominidů současně, např. u jezera Turkana ve východní Africe byl prokázán současný výskyt čtyřech druhů hominidů. Prvním člověkem, který opustil Afriku byl H. erectus, který osídlil Evropu, Asii i Austrálii před 1.8 milionem let. 8.2.1. Nejstarší hominidi – Sahelanthropus, Orronin, Ardipithecus Ještě před 8 miliony let byla většina Afriky pokryta hustým pralesem střídajícím se s jezery a řekami. V období mezi 8-5 miliony let došlo k dlouhodobému ochlazování a vysušování, kdy vlhkost byla shromažďována v polárních oblastech v podobě ledových příkrovů. Evoluce hominidů v Africe je spojena s touto změnou klimatu. Husté pralesy byly postupně nahrazeny otevřenou krajinou, lesy se střídaly s travnatými porosty, jezery a řekami. Časní hominidé byly adaptování jak na život na stromech tak i na zemi. Stromy poskytovaly 88 ochranu před predátory i zdroj potravy, jezera a řeky poskytovaly potravu v podobě ryb a měkkýšů. Nejstarším přímým předchůdcem člověka, po oddělení jeho vývojové větve od větví vedoucích k šimpanzům a gorile, byl podle současných poznatků Sahelanthropus tchadensis. Jeho pozůstatky byly nalezeny francouzským badatelem Michelem Brunetem v roce 2001 v Čadu, ve střední Africe v oblasti Sahel, ležící jižně od Saharské pouště. Jeho výskyt byl datován na dobu před 6-7 miliony let. Mozek S. tchadensis má velikost šimpanzího mozku, avšak horní část mozkovny má nadočnicové oblouky podobné těm, které byly nalezeny u mladších hominidů. Také dolní čelit je mnohem silnější ve srovnání s šimpanzem. Někteří badatelé však namítají, že S. tchadensis nebyl našim přímým předkem, podle jiných se jedná dokonce o fosilní gorilu. Pokud ale byl S. tchadensis skutečně hominid, pak jeho nález v centrální Africe svědčí o tom, že dávní hominidi obývali mnohem rozsáhlejší oblast, než se donedávna myslelo. Druhým nejstarším primitivním hominidem je Orronin tugenensis, který dostal jméno podle naleziště v Tugenských kopcích (Tugen Hills) v severní Keni. Jeho stáří bylo stanoveno draslíkovo-argonovou metodou na 6 milionů let. K prvnímu nálezu došlo v roce 1974 a k dalším pak v roce 2000. Přesto jsou nálezy O. tugenensis zatím velmi zlomkovité. Dalším potenciálním časným homonidem je Ardipithecus. Představuje dvě skupiny nálezů, jedna je datována na 5.5 milionů let a je označována jako A. kadabba, druhé nálezy patří A. ramidus starému 4.5 milionů let. Obě naleziště se nacházejí v Etiopii. Nálezy zahrnují části mozkovny, čelisti a zuby. Celkovým vzhledem však A. kadabba spíše připomíná šimpanze než moderního člověka. Je zajímavé, že až na výjimky neexistují fosilní nálezy šimpanzů. Vysvětluje se to jednak tím, že šimpanzi narozdíl od prvních hominidů žili v pralese, kde prakticky není žádná eroze a tudíž nedochází k odkryvům starších vrstev, v nichž se fosilie nacházejí. Podle jiného vysvětlení je v pralese vysoká koncentrace humusových kyselin, které rychle rozkládají všechny kosterní pozůstatky dříve, než mohou fosilizovat. 8.2.2. Archaičtí hominidi – australopitékové, Paranthropus Zatímco u předchozí skupiny nebylo ještě zcela jisté, že se jedná o naše přímé předky u následující skupiny to jisté je. Příslušníci této skupiny se již jednoznačně podobají více modernímu člověku než šimpanzům. Ještě však nemají změny velikosti a tvaru těla, čelisti nebo velikosti zubů takové, jaké jsou charakteristické pro příslušníky rodu Homo. Proto se označují jako archaičtí hominidi. Prvním z nich je Australopithecus afarensis. Žil asi půl milionu let po Ardipithecovi, tedy před asi 3-4 miliony let. Jeho pozůstatky byly poprvé objeveny roku 1978 v Laetoli v Tanzánii a v Hadaru v Etiopii. Bylo nalezeno několik dobře zachovaných lebek, mnoho dolních čelistí a kostí končetin, což umožnilo odhadnout velikost a váhu jejich těla. Nejznámějším nálezem byla slavná „Lucy“ z Hadaru (pojmenovaná podle toho, že, že v době objevu si archeologové pouštěli písničku Beatles „Lucy in the sky with diamonds“), téměř polovina kostry dospělé ženy. Její objevitel Don Johanson tam představil světu dosud nejzachovalejšího archaického hominida. Vážil přibližně 40-60 kg a jeho mozkovna měla velikost 400-500 cm3 , tedy větší než je průměrná velikost mozkovny šimpanze nebo Sahelanthropa (300-325cm3 ). Na lebce jsou patrné hominidní struktury, zejména velký týlní otvor i způsob jeho umístění na spodině lebeční. Řezáky měl menší než šimpanz, naopak stoličky měl větší, mající již lidský vzhled. To svědčí pro skutečnost, že se živil spíše tuhou potravou, kterou žvýkal. Tvar a velikost pánve a dolních končetin naznačuje, že Au. afarensis byl schopen vzpřímené chůze po dvou končetinách, avšak jen asi na malé vzdálenosti. Pozoruhodný byl objev nejstarších zachovaných otisků chodidel z doby před 3.6 miliony let objevených v Laetoli v Tanzanii Mary Leakeyovou. Byly nalezeny stopy dvou jedinců, 89 dospělého a mladého jedince na rovné pláni, která byla v době, kdy po ní tito jedinci kráčeli, pokryta vulkanickým popelem zvlhčeným deštěm. Vznikl tak materiál typu cementu, který se pak proměnil v tvrdou skálu a zachoval tak otisky chodidel podobně jako otisky nohou a rukou na slavné ulici v Hollywoodu. Tyto stopy jasně svědčí o tom, že Au. afarensis byl schopen bipední chůze. Australopithecové byly tedy nalezeni ve východní a centrální Africe v místech otevřené krajiny. Více než 50 let dříve, v roce 1924, byla v jižní Africe ve zcela jiném prostředí v jedné jeskyni odkryté během dolování v lokalitě Buxton Limeworks v Taungu - nalezena lebka dítěte. Význam tohoto objevu dalšího hominida docenil profesor Raymond Dart a pojmenoval jej Australopithecus africanus. Jeho článek v časopisu Nature v roce 1925 se však setkal s chladnou odezvou, jen málokdo si uvědomil, že byl nalezen důležitý spojovací článek mezi našimi předky a moderním člověkem. Au. africanus obýval jižní Afriku před 3-2 miliony let. Patří ke gracilním hominidům. Jeho lebka se podobá lebce Au. afarensis, v některých strukturách je patrné určité zjemnění a tvář byla plošší. Dartův pokračovatel, paleontolog Robert Broom dále prohledával jihoafrické jeskyně a až po deseti letech hledání našel pozůstatky archaických hominidů. Tyto fosilie označil jako Parathropus robustus. Další důkaz toho, že Parathropus je odlišný od australopitéka přinesl objev Mary a Loius Leakeyových, když v roce 1959 v Olduvajské rokli v Tanzanii našli1.9 milionů let staré zbytky mozkovny. Postupně bylo objeveno mnoho dalších pozůstatků tohoto hominida nejen v Olduvajské rokli, ale i v Etiopii, Keni a Malawi. Tento hominid se nyní označuje jako Parathropus boisei. Měl robustní tělo, velké stoličky zuby a malé řezáky a špičáky. Přestože měl velkou čelist, jeho mozkovna byla ještě malá (asi 450cm3 ), velikostí srovnatelná s mozkovnou australopitéků (Au. africanus). Samci vážili téměř dvakrát více (80kg) než samice (40kg). Množství nálezů dokonce dokládá, že v průběhu evoluce P. boisei docházelo k mírnému zvětšení mozkovny. Předpokládá se také, že P. boisei mohl vyrábět primitivní kamenné nástroje. Nejmladším archaickým hominidem je Kenyanthropus platyops objevený poměrně nedávno Meave Leakeyovou, jeho stáří se odhaduje na 3.3 - 3.5 miliony let. 8.2.3. Nejstarší příslušníci rodu Homo - H. habilis V roce 1960 nalezli Louis a Mary Leakey (více informací o této nejslavnější rodině hledačů pravěkého člověka na krásné stránce „www.leakey.com“) v Olduvajské rokli, nedaleko od dřívějšího nálezu lebky P. boisei, prvního hominida, který se jednoznačně podobal více modernímu člověku než archaickým hominidům a kterého později zařadili do rodu Homo. A to i přesto, že mozkovna byla ještě poměrně malá (asi 600-700cm3 ), vyznačovala se však již znaky moderního člověka. Původně se vědci domnívali, že tento hominid byl schopen řeči a to vzhledem k tomu, že jeho mozek obsahoval Brocovu oblast, o níž se předpokládalo, že je centrem řeči. Nyní je již známo, že funkce související s řečí jsou rozptýleny po více oblastech mozku. Nález splňoval funkční kriteria rodu Homo – tento hominid již vyráběl nástroje (oldowanského typu), měl vzpřímenou postavu a chodil po dvou. Badatelé se shodli na tom, že tento hominid, který obýval východní Afriku před 2.1 - 1.5 milionu let, představuje nový druh, byl označen jako Homo habilis, člověk zručný. Jeho nálezy pocházejí z mnoha dalších míst východní a jižní Afriky, největším nalezištěm je Koobi Fora v Keni. H. habilis byl ještě značně podobnější předchozím australopitékům, než jeho nástupci. Velikosti a tvar lebky, čelisti a zubů jsou značně variabilní, což vedlo některé autory k rozdělení druhu H. habilis na dva druhy – H. habilis v užším slova smyslu (sensu stricto) a H. rudolfensis. Přes veškerou svoji pokročilost je však H. habilis považován za přechodnou formu hominida, stále ještě velmi podobnou archaickým hominidům, spíše než modernímu člověku. 8.2.4. Předmoderní člověk, H. erectus – první expanze do světa 90 Prvním hominidem, který se již velmi podobal modernímu člověku je Homo ergaster. Někteří badatelé ho nepovažují za samostatný druh a mluví o „časném africkém“ H. erectus. Zuby i čelist H. ergaster je mnohem menší oproti archaickým hominidům. Vysvětluje se to odlišným způsobem stravování. H. ergaster totiž již zřejmě využíval oheň a tepelně upravoval potravu, třebaže ještě oheň neuměl vyrábět. O tom svědčí nálezy ohořelé země v okolí nálezů kamenných nástrojů tohoto hominida. Dolní končetiny se prodloužily a umožnily chůzi na velké vzdálenosti. Je záhadou, proč je mozek stále poměrně malý (800 cm3 ). Velký mozek se totiž objevuje až mnohem později v evoluci člověka. Snad by to vysvětloval omezení rizika v pozdějších stádiích těhotenství, kdy by velká hlavička těžko procházela porodním kanálem. Až do doby před dvěma miliony let jsou veškeré nálezy předchůdců člověka omezeny na Afriku. Nepřítomnost důkazů samozřejmě ještě není důkazem nepřítomnosti. Před necelými dvěma miliony let se objevil nový hominid označený jako Homo erectus. Jeho nálezy pocházejí nejen z Afriky, ale i z Asie – Číny a Indonésie. Byl tedy prvním hominidem, který opustil Afriku. Podle některých badatelů H. erectus dorazil do Indonésie již před 1.9 milionem let. Nálezy H. erectus jsou poměrně starého data, došlo k nim již v 19. století, v době, kdy byl z pravěkých lidů veřejnosti znám pouze neandertálec. První nálezy pocházejí z Jávy z oblasti Solo River a uskutečnil je od konce 19. století Eugene Dubois. Původně nově nalezený druh označil jako Pithecanthropus erectus, pozdějšími vědci byl zařazen do druhu H. erectus. Další nálezy H. erectus pocházejí z Číny, z oblasti Choukoutien (Zhhoukoudian) poblíž Pekingu a uskutečnili je Švédský paleontolog Andersson a jeho rakouský kolega Zdansky v roce 1921 a 1923. Jejich nálezy byly označeny jako Sinanthropus pekinensis. Podobně i tento druh byl později přiřazen do druhu H. erectus. Po druhé světové válce bylo nalezeno ještě mnoho fosilií H. erectus nejen na Jávě a Číně, ale i ve východní a jižní Africe (Swartkrans, Olduvajská rokle, Buia). H. erectus měl již velmi lidský vzhled. Mezi typické znaky patří velký, dopředu vystupující nadočnicový val, nízké a ustupující čelo, přední zuby vystupovaly i s čelistmi dopředu (alveolární prognatismus). Na žvýkací zuby byl již menší tlak, zato však zvýšený tlak působil na přední zuby, potřebné při kousání, trhání a chytání potravy. Jedním z kulturních znaků H. erectus byl pěstní klín. Zhotovil jej „poprvé“ před 1.5 milionem let v dnešní Keni a později všude tam, kde žil. Používání ohně k vytápění příbytků a úpravě pokrmů bylo jednou z nejvýznamnějších kulturních inovací, dovolujících rannému H. erectus vstup do chladnějších podnebných pásů. Zajímavé je i to, že počínaje člověkem vzpřímeným se zmenšily tělesné rozdíly mezi mužem a ženou (u australopitéků byli samci dvakrát větší než samice), možná v důsledku větší spolupráce anebo snížení soubojů mužů o ženy. 8.2.5. Neandertálci Nejznámějším členem spadajícím do kategorie předmoderního člověka je Homo neanderthalensis, známý jako neandertálec. Své jméno dostal podle nálezu v jeskyni Kleine Feldhofer Grotte v údolí Neander (Neanderthal) v Německu. K nálezu došlo v roce 1856. Nebyl to však první nález neandertálce, již dříve byly nalezeny jeho pozůstatky v belgickém Engis (1829) a na Gibraltaru (1848). Později přicházely zprávy o nálezech neandertálců z celé Evropy – příkladem je moravská jeskyně Šipka, chorvatská Krapina, Kiik-Koba na Krymu, ale i naleziště v západní Asii (Irák, Izrael, Sýrie). Neandertálec se vyznačuje charakteristickou morfologií související s jeho adaptací na chladné klima – robustní postavou (1.65m vysokou), velkou mozkovnou (1520cm3 , srovnatelnou s velikostí mozkovny dnešního člověka a větší oproti raným sapientům), velkými nosními otvory. Je zajímavé, že žádní neandertálci nebyli nalezeni ve Skandinávii, zřejmě kvůli velmi chladnému klimatu. Neandertálci byli zřejmě první skupinou hominidů, kteří pohřbívali svoje zesnulé. Byly nalezeny hroby dokládající existenci pohřebního obřadu, kdy tělo mrtvého bylo zasypáno květy léčivých bylin. Neandertálci byli také prvními lidmi, 91 kteří se věnovali umění. Jejich nástroje spadají do středně-paleolitické kultury označované jako mousterian, kterou později vystřídala aurignacianská kultura moderních lidí. Vedli se spory o tom, zda jsou neandertálci našimi předky. Dnes se předpokládá, že byli příliš specializovaní a našimi přímými předky nebyli. K tomuto odhalení velmi přispěly experimenty, v nichž byla extrahována a osekvenována část neandertálské mitochondriální DNA (mtDNA) a srovnána s mtDNA dnešních lidí. Badatel Svante Paabo z Leipzigu takto analyzoval dokonce mitochondriální DNA z více neandertálských jedinců. Ukázalo se jednak to, že neandertálská mtDNA je odlišná od mitochondriální DNA dnešních lidí a také to, že jejich variabilita je podobná variabilitě mezi náhodně vybranými jednici dnešních lidí. Zcela nedávno stejná vědecké skupina publikovala první milion bází genetické informace neandertálce, které získala pomocí revoluční sekvenční technologie nazývané „454“, a vytyčila si za cíl osekvenovat celý genom neandertálce. Neandertálci obývali Evropu před 350 000 – 30 000 lety a poté byli nahrazeni moderním člověkem. Jakou formou toto nahrazení proběhlo je nejasné. Otázkou zůstává i to, zda docházelo ke křížení neandertálců s moderními lidmi. Existují i spekulace, že ke křížení docházelo, ale potomstvo bylo neplodné. Pokud totiž došlo ke vzniku chromosomu 2 fúzi dvou autosomů primátů až po vzniku moderního člověka, mohl různý počet chromosomů (23 u moderních lidí a 24 párů u neandertálců) vést k neplodnému potomstvu. 8.2.6. Původ moderního člověka – dvě teorie, H. sapiens Vznik anatomicky moderních lidí je stále tak trochu záhadou. Existují dvě teorie o původu moderního člověka. Podle klasické představy označované jako multiregionální teorie (někdy se nazývá „polycentrická teorie“ nebo „teorie svícnu“) se H. erectus rozšířil do různých částí starého světa (Afrika, Evropa, Asie) a tam se z něj víceméně nezávisle vyvinul H. sapiens. To znamená, že například z neandertálce se v Evropě vyvinuli moderní Evropané, v Asii se z H. erectus vyvinuli dnešní asiaté. Podle extrémní varianty této teorie jsou pak dnešní geografické varianty (rasy) vlastně zvláštními druhy s odlišnou evoluční historií. Naopak podle umírněné varianty docházelo k toku genů mezi regionálními populacemi, čímž se jejich rozdíly stíraly. Původ moderního člověka (c) (a) teorie „Ven z Afriky“ (b) multiregionální teorie H. sapiens H. erectus H. erectus H. sapiens Evropa Afrika AsieEvropa AfrikaAsie 92 Alternativní teorie se nazývá „Ven z Afriky“ (také teorie „Noemovy archy“). Podle ní H. sapiens vznikl v Africe a poté se před 50 000 – 200 000 lety rozšířil do zbytku starého světa, kde plně nahradil potomky H. erectus. Významnou podporou této představy bylo nalezení pozůstatků moderního člověka v Africe (oblast řeky Omo v Etiopii) starých 200-150 tisíc let a především zavedení molekulárních metod umožňujících studium lidské proměnlivosti. V laboratoři Allana Wilsona (1987) si vybrali pro tato studia mitochondriální DNA, mtDNA. Mitochondriální DNA se dědí pouze po mateřské linii. Výhodou mitochondriální DNA je i to, že má vyšší rychlost mutací v průběhu evoluce, nemá reparační systémy a nepodléhá přestavbám procesem rekombinace podobně jako jaderná DNA. Srovnání mitochondriálních DNA z různých populací světa ukázalo, že mezi lidmi existují pouze malé rozdíly, přičemž největší rozdíly byly mezi africkými populacemi. To silně podpořilo nedávný africký původ člověka. Tak vznikla i populární představa africké „pramáti Evy“ žijící na pláních východní Afriky. K podobným závěrům vedlo i srovnání sekvencí na chromosomu Y, který se dědí po otcovské linii. Velikost zakladatelské populace se odhaduje na 10 000 jedinců. 8.2.7. Floreský člověk – nedávno žijící Hobit Roku 2003 upoutal pozornost vědecké i laické veřejnosti nález téměř kompletní kostry trpasličího člověka v jeskyni Liang Bua na indonéském ostrově Flores. Novináři ihned tohoto asi metr vysokého člověka označili jako „hobit“ z ostrova Flores. Kostra, o níž si vědci původně mysleli, že patří dítěti, patřila asi 30 letému dospělému jedinci. Zanedlouho byly nalezeny pozůstatky dalších osmi jedinců podobného vzrůstu, o hmotnosti přibližně 16kg a s lebkou o velikosti většího pomeranče. Mezi nejstarší a nejmladší kostrou bylo přitom časové rozpětí přes osmdesát tisíc let. Tito hobiti žili v jeskyni již před téměř sto tisící lety a obývali ji ještě před dvanácti tisící lety, kdy byl ostrov postižen obrovskou sopečnou erupcí. Nejpozoruhodnější na nálezu byl neobvykle malý mozek nalezených jedinců, nejvýše 380cm3 . Podle platných antropologických teorií velikost mozku poklesne na 85% pokud se tělo zmenší na polovinu. Například Pygmejové – příslušníci našeho druhu H. sapiens jsou sice malého vzrůstu ale mozek mají jen o něco menší než my. Floreský člověk by měl mít podle těchto představ mozkovnu velkou přibližně 750cm3 tedy dvojnásobnou, než skutečně má. Někteří skeptičtí vědci proto tvrdili, že se jedná o lidi našeho druhu postižené zmenšením mozku (mikrocefalií), tato vzácná choroba se projevuje trpasličím vzrůstem, deformacemi obličeje a čelistí i mentálními poruchami. Nálezy opracovaných kamenů a zvířecích kostí poukazovali na schopnosti lidí z ostrova Flores vyrábět nástroje a užívat oheň. To svědčí o značné inteligenci hobitů a zcela nabourává představu podle níž existuje vztah mezi inteligencí a velikostí mozku. Zastánci trpasličího člověka argumentovali tzv. ostrovním fenoménem. Podle něj některé druhy, které žijí v podmínkách izolace se zmenší, jiné se mohou naopak zvětšit. Na ostrovech tak často vznikají jak gigantické (vymřelí potkani, obří galapážské želvy) tak i trpasličí formy (vymřelý slon Stegodon). Hobit mohl lovit malé pralesní slony druhu Stegodon anebo se živit vyhynulými obřími hlodavci. Podle této představy je pak floreský člověk trpasličí formou H. erectus. Nejpravděpodobnější vysvětlení však považuje floreského člověka za zcela nový druh hominida, který se vyvinul z H. erectus kdysi dávno někde v Asii a poté doplul na indonéské ostrovy. Vzhledem k tomu, že H. sapiens zřejmě dorazil do této oblasti před přibližně 45 tisíci lety, je pravděpodobné, že se s hobity mohl potkat. Takové setkáni nemuselo být ničím výjimečným, vždyť i v Evropě se zřejmě H. sapiens potkal s neandertálci a v Africe žili ve stejných oblastech (např. u jezera Turkana) až čtyři druhy hominidů současně. Nabízí se otázka, zda třeba ještě někde v zapadlých oblastech ostrova Flores hobit nežije dodnes. Podle stále živých legend se totiž primitivní lidé ostrova Flores prý ještě před sto lety setkávali 93 s malými chlupatými lidmi, jež pojmenovali Ebu Gogo, což znamená „babička, která jí všechno“. Tito trpaslíci byli prý schopni vydávat nesrozumitelné šeptavé zvuky a napodobovat lidskou řeč. Je zajímavé, že i mnohé jiné národy mají mýty o trpasličích lidech. Pro dnešní lidstvo by bylo velkou výzvou a otázkou, jak se zachovat k jinému druhu člověka, pokud by se na Zemi náhodou nalezl. A co více, tento nález je dalším kamínkem do mozaiky znázorňující evoluci člověka jako bohatě rozkošatělou korunu stromu a ne jednoduchou přímku, jak se domnívali vědci dříve. Evoluci člověka, kterou si můžeme představit jako různě dlouhé a různě silné záblesky světélek odpovídající jednotlivým hominidům v časoprostoru naší modré planety.