Genetická informace a struktura nukleových kyselin Přednáška kurzu Bi4010, Základy molekulární biologie, 2018/2019 Jan Šmarda Ústav experimentální biologie PřF MU 2 DNA a geny DNA obsahuje genetickou informaci a tak tvoří hmotnou podstatu genů gen je nukleotidová sekvence, která je nezbytná pro syntézu funkčního genového produktu (polypeptidu nebo RNA) – nejde jen o kódující sekvenci, zahrnuje i promotory, sestřihová místa, apod. 3 r. 1868: objev nukleinu Johan Friedrich Miescher (1844-1895) švýcarský přírodovědec a lékař biochemický přístup: narušuje strukturu buněk a snaží se popsat uvolněné složky izoluje leukocyty z hnisu (na obvazech), jaderné proteiny rozkládá pepsinem (proteolytickým enzymem izolovaným ze žaludku prasat) v r. 1869 získává kyselou hmotu bohatou na dusík a fosfor, kterou nazval nuklein jeho výsledky nejsou přijaty k publikaci až do roku 1871 funkce nukleinu zůstává dlouho nejasná (polynukleotidové řetězce a jejich schopnost uchovávat genetickou informaci jsou objeveny až ve 40. letech 20. stol.) 4 Chromozomy a geny geny jsou umístěny na chromozomech chromozomy jsou tvořeny nukleovou kyselinou (DNA) a proteiny ve 40. a 50 . letech 20. stol. bylo jednoznačně prokázáno, že genetická informace je uložena v nukleových kyselinách a ne proteinech 5 Jaká molekula nese genetickou informaci? Odpověď se hledala obtížně: byl znám jen vertikální přenos genů z rodičů na potomstvo (Mendel, Morgan), kdy geny neopouštějí buňky a tím jsou nepřístupné chemické analýze pomohl objev horizontálního přenosu genů - transformace transformace je běžná u bakterií (nikoliv u savců) 6 Objev transformace Frederick Griffith (anglický bakteriolog) ve 20. letech 20. století zkoumá bakterii Streptococcus pneumoniae (pneumokok) návaznost na obrovskou epidemii španělské chřipky v r. 1918, často doprovázenou zápalem plic vyvolaným touto bakterií Ministerstvo zdravotnictví požaduje výzkum pneumokoka a vytvoření vakcíny Frederick Griffith (1879-1941) 7 Objev transformace Frederick Griffith (1928): existují 2 příbuzné kmeny Streptococcus pneumoniae, které se liší morfologicky a stupněm patogenicity kmen R tvoří drsné kolonie a není letální kmen S tvoří hladké kolonie, po injekci usmrcuje pokusné myši 8 Objev transformace Streptococcus pneumoniae: Kmen S: buňky obklopeny cukerným pláštěm, který usnadňuje únik imunitnímu systému, proto vysoká virulence Kmen R: buňky postrádají cukerný plášť, jsou méně nebezpečné 9 Griffithův experiment virulentní hladké bakterie injikuje myším: smrt virulentní hladké bakterie zabije teplem a pak provede injekci: přežívají injekce směsí zabitých virulentních bakterií s živými nevirulentními: smrt! pitva usmrcených myší: obsahují buňky virulentních bakterií S neškodné bakterie R se nějak „transformovaly“ na virulentní S 10 Závěr Griffithova experimentu existuje chemická látka schopná přenášet dědičné instrukce mezi organismy – „genová molekula“ zdrženlivý Griffith otálí s publikací tohoto revolučního závěru až v lednu 1928 na nátlak přátel svůj experiment publikuje v neznámém časopise Journal of Hygiene článek psán v omluvném stylu za otřes, který genetice způsobuje 11 Nositelkou genetické informace je DNA Oswald Avery Colin MacLeod Maclyn McCarty (40. léta 20. století) přímý důkaz: potvrzení Griffithova experimentu za transformaci bakterií Streptococcus pneumoniae zodpovídá DNA přidání purifikované DNA k bakteriím mění jejich vlastnosti (tvar kolonií, schopnost vyvolat onemocnění, apod.) získané vlastnosti se přenášejí do následných generací 12 Averyho pokus založen na transformaci bakterií R různými frakcemi inaktivovaných bakterií S transformaci vyvolává pouze DNA 13 Genetickým materiálem viru tabákové mozaiky (TMV) je RNA některé viry obsahují proteiny a RNA, ale žádnou DNA důkaz kódující funkce RNA: oddělení RNA a proteinů u dvou kmenů TMV (A a B, lišících se chemickým složením proteinových obalů) vytvoření virových částic smísením RNA (A) s proteinem (B) vznikl životaschopný virus, jehož potomstvo mělo fenotyp A po smísení RNA (B) s proteinem (A) vznikl virus s fenotypem B závěr: potomstvo virů je genotypově a fenotypově shodné s rodičovským virem, ze kterého pochází RNA 14 Struktura nukleových kyselin lineární polymery složené z podjednotek - nukleotidů Nukleotidy mají 3 složky: pětiuhlíkový cukr dusíkovou bázi zbytek kyseliny fosforečné 15 Cukerné složky nukleotidů ribóza u ribonukleových kyselin deoxyribóza u deoxyribonukleové kyseliny odlišnost je v přítomnosti/nepřítomnosti hydroxylové skupiny na 2´-uhlíku 16 Dusíkaté báze nukleotidů připojují se na uhlík 1 cukru kovalentní N-glykozidickou vazbou 17 Dusíkaté báze nukleotidů dva typy: pyrimidinové (cytozin, tymin, uracil) purinové (adenin, guanin) 18 Součástí nukleotidů je zbytek kyseliny fosforečné připojen k uhlíku 5 cukru esterovou vazbou poskytuje nukleotidu negativní náboj 19 Nukleosid není totéž co nukleotid 20 Deoxyribonukleotidy 21 Polymery nukleotidů tvoří nukleové kyseliny zbytek kyseliny fosforečné spojuje sousední cukry nukleotidů kovalentními fosfodiesterovými vazbami mezi uhlíky 5´a 3´cukerných jednotek pravidelné střídání motivu cukr-fosfát-cukr-fosfát... tvoří cukr-fosfátovou kostru řetězců nukleových kyselin řetězce mají chemickou polaritu: 1 konec obsahuje fosfát (5´-konec), druhý obsahuje hydroxylovou skupinu (3´-konec) 22 Dvě varianty nukleových kyselin: DNA a RNA DNA obvykle dvouvláknová molekula vlákna spojena vodíkovými vazbami mezi dvojicemi bází adenin - tymin a gunanin – cytozin RNA obvykle jednovláknová molekula místo tyminu uracil 23 Objev dvoušroubovice DNA 1953: James Watson a Francis Crick odvozují strukturu DNA na základě těchto údajů: chemická data: Erwin Chargaff koncentrace tyminu je v organizmech stejná jako koncentrace adeninu a koncentrace cytozinu je vždy stejná jako koncentrace guaninu fyzikální data: Maurice Wilkins a Rosalind Franklinová po vystavení purifikovaných molekul DNA rentgenovému záření, dochází k charakteristickému rozptylu paprsků, které signalizují způsob uspořádání složek DNA do šroubovice 24 Objev dvoušroubovice DNA 25 Trojrozměrná struktura DNA za fyziologických podmínek pravotočivá dvoušroubovice (B-forma) protilehlé řetězce jsou vázány vodíkovými vazbami mezi bázemi báze orientovány dovnitř dvoušroubovice, cukr-fosfátová kostra je na její vnější straně větší purinová báze se páruje s menší pyrimidinovou šroubovici stabilizují vazby nad sebou umístěných aromatických kruhů 26 Trojrozměrná struktura DNA adenin se spojuje s tyminem dvěma vodíkovými vazbami guanin s cytosinem třemi vodíkovými vazbami 27 Trojrozměrná struktura DNA báze se uvnitř dvoušroubovice orientují do energeticky nejvýhodnějšího uspořádání jedna otáčka šroubovice připadá na 10 párů bází, průměr 1,9 nm vinutí vytváří v šroubovici velký a malý žlábek obě vlákna dvoušroubovice jsou antiparalelní a plně komplementární 28 Alternativní formy DNA B-DNA: ve vodných roztocích a běžných koncentracích solí A-DNA: rovněž pravotočivá, s 11 pb na otáčku, objevuje se u dehydratovaných vzorků Z-DNA: levotočivá, s 12 pb na otáčku, výskyt u dvojšroubovic bohatých na páry GC, funkce v živých systémech nejasná 29 Uchování a exprese genetické informace v DNA pořadí nukleotidů v obou řetězcích představuje genetickou informaci, která se kopíruje před svým přenosem do dceřiné buňky komplementarita řetězců umožňuje odvození sekvence nukleotidů jednoho řetězce ze sekvence nukleotidů druhého řetězce – základ dědičnosti genetické informace odlišnost organismů vyplývá z odlišností v pořadí nukleotidů jejich DNA lineární sekvence nukleotidů v genech určuje lineární pořadí aminokyselin a trojrozměrnou strukturu proteinů trojrozměrná struktura proteinů zodpovídá za jejich funkci 30 Struktura DNA vysvětluje kopírování genetické informace komplementarita vláken dvoušroubovice usnadňuje kopírování a přenos genetické informace vodíkové vazby mezi vlákny dvoušroubovice jsou mnohem slabší než kovalentní vazby mezi nukleotidy uvnitř vláken: pomocí určitých enzymů lze dosáhnout oddělení vláken a jejich kopírování do komplementárního vlákna (replikace DNA) 31 DNA v chromozomech chromozom je komplex DNA a proteinů, které pomáhají udržovat jeho strukturu na chromozomu jsou v lineárním pořadí uspořádány geny oddělené regulačními a mezigenovými úseky 32 Chromozomy prokaryot kružnicové molekuly dvouřetězcové DNA nesou většinou několik tisíc genů intergenové úseky jsou velmi krátké, úspornost genomu skupiny sousedních genů s minimálními mezigenovými úseky (operóny) mohou sdílet jednu regulační oblast při replikaci se v určitém místě dvoušroubovice rozvolňuje a replikuje se oběma směry 33 Chromozomy vyšších živočichů a rostlin komplex lineární molekuly dvouřetězcové DNA a proteinů obsahují centromeru a koncové telomery nesou až 50 000 genů intergenové úseky jsou rozsáhlé eukaryota jsou obvykle diploidní: v každé buňce jsou chromozomové páry (u člověka 46 chromozomů, 23 párů, z toho jeden pár pohlavních chromozomů) ve světelném mikroskopu viditelné jen v době buněčného dělení karyotyp: úplná sada metafázových chromozomů v dané buňce/organismu – základ cytogenetických analýz 34 Sekvenování genomu úplná sekvence známá např. u mnoha virů, bakterií, kvasinek, octomilky, háďátka, myši, člověka, atd. nalezení dosud neznámých genů odhad počtu všech genů kódujících proteiny odhad funkcí nových genů srovnání mezi druhy – evoluční souvislosti velká část genomu vyšších eukaryot nekóduje mRNA v nekódujících oblastech DNA jsou podobné, ale nikoliv identické oblasti vysoká variabilita některých repetitivních sekvencí (specifické pro každého jedince) dříve se nekódující oblasti považovaly za bezúčelnou „junk“ DNA dnes se jim přisuzuje evoluční význam 35 Geny eukaryot obsahují introny a exony introny: nekódující sekvence exony: kódující sekvence evoluční tlak udržuje sekvence exonů u různých jedinců daného druhu ve stejné nebo velmi podobné struktuře změny struktury intronů, včetně úplné ztráty, se tolerují: malý funkční význam funkce většiny sekvencí intronů není známa – patrně přispívají k variabilitě proteinových struktur (alternativní sestřih), umožňují vazbu regulátorů, podílejí se na regulaci genové exprese 36 DNA mitochondrií a chloroplastů obsahuje geny kódující proteiny související s funkcí těchto organel (ale ne všechny) součást genomu daného organismu 37 Solitérní geny a genové rodiny 25-50% genů mnohobuněčných organismů kódujících proteiny jsou v haploidním genomu zastoupeny pouze 1x: solitérní geny např. gen kódující lysozym (enzym, který štěpí polysacharidy buněčné stěny bakterií, složka vaječného bílku, obsažen v slzách) genové rodiny: geny s velmi podobnou, ale ne zcela identickou strukturou, které kódují příbuzné proteiny (proteinové rodiny) např. rodiny imunoglobulinů nebo kináz mají stovky členů 38 Rodiny globinů rodina globinových genů kóduje proteiny podílející se na tvorbě hemoglobinu 2 identické polypeptidy ß-globinu vytvářejí komplex se dvěma identickými polypeptidy α-globinu + 4 hemové skupiny všechny hemoglobiny přenášejí kyslík v krvi, odlišují se však fyziologickými úkoly určité typy globinů se exprimují jen ve vyvíjejícím se plodu – vytvářejí hemoglobin s vyšší afinitou ke kyslíku než hemoglobin dospělých (snadněji získávají kyslík z krevního oběhu matky placentou) nižší afinita ke kyslíku je výhodnější u hemoglobinu dospělých organismů, protože usnadňuje jeho uvolnění v tkáních, především svalech, které mají při zátěži velkou spotřebu kyslíku 39 Vznik genových rodin: duplikace různé geny pro ß-globin vznikly duplikací původního genu během evoluce se v obou genech hromadily náhodné mutace mutace výhodné pro funkci přenosu kyslíku se fixovaly v oblasti ß-globinové rodiny se nacházejí pseudogeny pseudogeny se podobají původním genům (vznikly rovněž duplikací), ale jsou kvůli mutacím nefunkční pseudogeny nejsou škodlivé – pasivně se v genomu udržují 40 Tandemově opakované řady identických genů toto uspořádání mají především geny kódující RNA (např. rRNA nebo RNA fungující při sestřihu), po kterých je v buňce vysoká poptávka kódují zcela nebo téměř identické produkty geny jsou umístěny v mnohonásobném opakování bezprostředně za sebou 41 Otevřený čtecí rámec (ORF) úsek DNA, obsahující alespoň 100 kodónů, který začíná iniciačním a končí terminačním kodónem, o kterém není známo, zda má kódující funkci 42 Velikost genomu a biologická komplexita počet genů kódujících proteiny není přímo úměrný biologické komplexitě organismu (C. elegans má více genů než octomilka, člověk má jen o tisíc genů více genů než C. elegans) ze struktury genomu nelze biologickou komplexitu odvozovat přímo variabilitě přispívají: alternativní sestřih posttranslační modifikace regulace genové exprese 43 Genetické rozdíly mezi jednotlivci odlišnosti v počtu kopií opakujících se sekvencí využitelné pro profilování DNA (fingerprinting) používá se pro identifikaci zločinců od r. 1988 pravděpodobnost shody profilů dvou osob je zanedbatelná 1:109 44 Forenzní analýza pro profilování jsou vhodné dva typy polymorfismu DNA tandemové repetice variabilního počtu (VNTR), minisatelity, opakující se sekvence 10-80 pb krátké tandemové repetice (STR), mikrosatelity, opakující se sekvence o délce 2-10 pb počet jejich kopií je vysoce variabilní a proto ideální pro profilování v určitých oblastech genomu je počet opakování VNTR a STR snadno detekovatelný (restrikční analýza, PCR, elektroforéza) 45 Genetické rozdíly mezi jednotlivci 46 Strukturní organizace eukaryotických chromozomů velikost DNA monohonásobně přesahuje průměr buňky DNA se organizovaným způsobem sbaluje do komplexu s proteiny speciální části chromozomů tvoří centromery a telomery 47 Centromera zúžená oblast chromozomu v jeho střední části místo vazby mikrotobulů dělícího vřeténka nezbytná pro správnou segregaci chromozomů při anafázi mitózy a meiózy stejná funkce - podobná struktura u všech chromozomů obsahuje nukleotidové sekvence, na které se vážou proteiny (kinetochory) zprostředkovávající vazbu vřeténka 48 Telomery (z řečtiny: telos = konec, meros = část) Hermann J. Muller, 1938: první důkaz, že absence přirozených konců chromozomů drozofily (odstraněných rentgenovým zářením) znemožňuje přenos chromozomů do buněk potomstva Barbara McClintocková, 1948: konce přerušených chromozomů jsou lepivé a mají tendenci se spojovat za vzniku fúzních chromozomů; normální konce chromozomů tuto vlastnost nemají 49 Hlavní funkce telomer chrání konce lineárních molekul DNA před deoxyribonukleázami brání fúzi konců chromozomů s jinými molekulami DNA umožňují úplnou replikaci konců lineárních molekul DNA (spolu s enzymem telomerázou) Struktura: obsahují krátké opakující se nukleotidové sekvence počet opakování sekvencí s věkem klesá to neplatí pro embryonální kmenové buňky a buňky nádorové, kde se telomery nezkracují 50 Hayflickův limit Leonard Hayflick začátkem 60. let kultivoval lidské buňky in vitro po 50 – 70 cyklech zdvojování se buňky dělit přestávaly a přecházely do senescence, následně krize a odumíraly důsledek kritického zkrácení telomer korelace s celkovým stárnutím Leonard Hayflick (*1928) 51 Nádorové buňky dokážou prodloužit život buněk ztráta telomer je eliminována aktivace telomerázy alternativní prodlužování telomer rekombinací (bez účasti telomerázy) 52 Proteiny chromatinu šetrnou izolací DNA z jader eukaryotických buněk se získá nukleoproteinový komplex - chromatin chromatin = komplex DNA a proteinů 2 typy chromatinových proteinů: bazické (v neutrálním pH nesou kladný náboj) = histony kyselé (v neutrálním pH nesou záporný náboj) = nehistonové chromozomové proteiny 53 Histony hlavní strukturní úloha v chromatinu v buňkách přítomny v množství, které koreluje s množstvím DNA hlavní typy histonů: H1, H2a, H2b, H3, H4 v hojné míře zastoupeny bazické aminokyseliny s kladným nábojem arginin a lysin (20-30% histonových aminokyselin), které interagují s negativním nábojem fosfátových skupin DNA vysoce konzervativní struktura histonů, přítomny téměř ve všech buněčných typech 54 Složkami nukleozomů jsou čtyři typy histonů Nukleozomy primární strukturní jednotky chromatinu útvary vzniklé interakcí H2a, H2b, H3 a H4 s DNA o velikosti 146 pb podíl na správném složení DNA interakce mezi histony a DNA usnadňují elektrické náboje (DNA je polyanion, histony jsou díky bazickým aminokyselinám polykationty) při replikaci se DNA do nukleozomů sestavuje okamžitě pomocí chaperonů posttranslační modifikace histonů (např. acetylace) mohou ovlivnit kompaktnost chromatinu (rozvolnění, aktivace genů) 55 Nehistonové proteiny chromatinu různé u různých buněk (i v rámci téhož organizmu) nepodílí se na uspořádání DNA v chromozomech účast na regulaci genové exprese 56 Tři úrovně sbalení eukaryotických chromozomů: 1. nukleozom jádro nukleozomu tvoří oktamer histonů 2x(H2a+H2b+H3+H4) a nadšroubovicová DNA o velikosti 146 pb úplný nukleozom je stabilizován histonem H1 výsledkem je interfázové chromatinové vlákno o průměru 11 nm 57 Tři úrovně sbalení eukaryotických chromozomů: 2. solenoid solenoid (30 nm chromatinové vlákno) vzniká v důsledku interakcí mezi nukleozomy, způsobující vinutí chromatinového vlákna do velké šroubovice s 6 nukleozomy na jeden závit 58 3. stáčení 30 nm vlákna do smyček pomocí proteinového lešení ("scaffold") proteiny nehistonové povahy (např. proteiny HMG) tvoří proteinové lešení („scaffold“) lešení napomáhá složení 30 nm vlákna do kondenzovaného stavu nejvýraznější kondenzace chromozomů během mitózy EM: lidský metafázový chromozom po odstranění histonů Histonový kód N-konce aminokyselinových řetězců histonů jsou volné a přístupné posttranslačním modifikacím kombinace těchto modifikací v různých oblastech chromatinu vytvářejí kód, který ovlivňuje funkci chromatinu – hlavně tvorbou a odstraňováním vazebných míst pro specifické proteiny ovlivňuje se tak úroveň kondenzace chromatinu (rozhodující pro transkripci, replikaci reparaci DNA) kondenzovaný chromatin: heterochromatin rozvolněný chromatin: euchromatin 59 Heterochromatin zůstává ve značně kondenzovaném stavu i v interfázi typicky přítomen v oblasti centromery a telomer silně barvitelný barvivy vážoucími se na DNA transkripčně inaktivní 60 Euchromatin méně kompaktní v interfázi typicky přítomen v aktivně přepisovaných oblastech slabě barvitelný barvivy vážoucími se na DNA 61 Posttranslační modifikace histonů epigenetické mechanismy regulace genové exprese fosforylace H1: kondenzace chromozomů – ztížení transkripce acetylace histonů nukleozomového jádra: rozvolnění chromozomů – usnadnění transkripce zajištěno enzymaticky 62 63 Schéma skládání DNA v chromozomech