IV107 Bioinformatika I Přednáška 2 Katedra informačních technologií Masarykova Univerzita Brno Podzim 2018 Před týdnem Bioinformatika ► zpracování hromadních molekulárně-biologických dat ► posledních cca. 30 let ► data: genomika a proteomika ► sekvence ► struktury ► interakce a jiné funkce ► expresní data ► anotace cca 1000 prokaryotických genomů (http://www.cbs.dtu.dk/services/GenomeAtlas/) ► Galerie sekvenovaných genomů (h tt p ://w w w. g e n o m e n e ws n e t wo r k. o r g/) = DNA websites ► http://www.dnaftb.org/ ► http://www.dnalc.org/ ► http://www.dnai.org/ Hierarchie biologických struktur U.tíim im» 10nm |(* | jjm iflpim |[Kl|iiii 1 mm 1 -1- -1-' 7 T < Light microscope Electron microscope UptáS ,«3 T2 phage Small mtHetuies Chloroplas 5> Plarrt and Kl animal bacteria cm Ö.1 m Im im in i: v.; m 1km i nimi_i ijuiliI_j i u"-! i .......I ' i ■ > mil_i i 111 j i J_ una idea eye 3r Fish e39 Hummingbrrd Giant tree Human Outline Struktura DNA Z historie DNA je nosičem genetické informace DNA má strukturu antiparalelní spirály Genetický kód Primární struktura (Sekvence) Sekundární struktura Terciární struktura (domény) Kvartérní struktura (komplexy) Funkce proteinů Nástroje mol.biologie, genomiky a proteomiky Kořeny genetiky Gregor J. Mendel V pokusech s rostlinami si všiml, že potomství dvou rodičů nezávisí na jejich vzhledu /fenotyp/, nýbrž na jakýchsi symbolicky popsaných faktorech, které do značné míry odpovídají dnešnímu označení gen /genotyp/ j „450 raSTEVAnCANE i Molekula DNA ► Objevena 1869 , považována za příliš jednoduchou ► Polymerická molekula, monomerem je: ► deoxyribonukleotid /DNA/ ► ribonukleotid/RNA/ ► Symbolické značení A,C,G,T,U ► Spirálovitá prostorová struktura kleotidy □ i5P - = 1= >OQ,0 Zastoupení nukleotidů v různých organismech Organizmus %A %G %C %T A+G T+C A+T G+C E.coli 24.7 26.0 25.7 23.6 1.03 0.93 S.lutea 13.4 37.1 37.1 12.4 1.04 0.35 S.cerevisae 31.3 18.7 17.1 32.9 1.09 1.79 H.sapiens 30.9 19.9 19.8 29.4 1.00 1.52 Dedukce: Nukleotidy se vyskytují v párech From A.L.Lehninger (1970), Biochemistry, Worth Publishers, New York Difrakce na molekule DNA Difrakce krystalické DNA z roku 1952 od Rosalind Franklin Svědčí o periodicitě 0.3nm a 3.4nm Struktura DNA Tento obrázek a jedna stránka textu pomohli autorům k Nobelově ceně. Přínos Rosalind Franklin ve formě pečlivého zkoumání krystalů v té chvíli oceněn nebyl. Poštovní známka k 50. výročí objevení struktury DNA Struktura DNA □ i5P Struktura DNA Chnomosome Uspořádání DNA v jádře Uspořádání Počet nukleotidů Relativní délka k jádru Lineární 10000 600000 Plošné 25 mil 240 Prostorové 62.5 mld 0.1 Prostorové uspořádání DNA se 12000000 nukleotidy v jádře o rozměrech 0.0034 mm (rozměry jednoho páru nukleotidů dle modelu Watsona a Cricka jsou 1.36 x 0.34a?a?7). Outline Z historie DNA je nosičem genetické informace DNA má strukturu antiparalelní spirály Centrální dogma a genová exprese Genetický kód Primární struktura (Sekvence) Sekundární struktura Terciární struktura (domény) Kvartérní struktura (komplexy) Funkce proteinů Nástroje mol.biologie, genomiky a proteomiky Základní pravidla ► DNA RNA protein ► retroviry: RNA -» DNA ► jeden gen jeden protein ► RNA geny kódují RNA ► alternativní sestřih umožňuje tvorbu několika proteinů ► post-translační modifikace umožňují vznik různých forem jednoho typu proteinu genů protein synthesis (translation) Outline OUUrMUld L/1 Z historie DNA je nosičem genetické informace DNA má strukturu antiparalelní spirály Centrální dooma a oenová exorese Replikace DNA TV o kí o ki ki/^ô i rcuioKTipuc Translace Genetický kód Struktura proteinu Primární struktura (Sekvence) Sekundární struktura Terciární struktura (domény) Kvartérní struktura (komplexy) Funkce proteinů Nástroje mol.biologie, genomiky a proteomiky Replikace DNA Hlavní enzymy helikáza, DNA polymeráza Templát DNA Substrát deoxyribonukleotidy Produkt DNA Replikace DNA template strand A yfl 0: o ó 0 ft 0 O ó $~~^3' it! strand A '3 5' ;<5 "Ó";~"ÓT~^."6r"Ói ff" 0~~0~"<;3' new strand B & ;A: It iT iGi jci lei |a |g] t t |C] , lGi !t. |A |AJ ja |gj |S[ 3'^ 0 0 0 0 0 0 0 0 0 0 5' new strand A strand B v 5^ parent DNA double helix ■yy jO: O tf 6 & ó. Ď fr^^s' template strand B Outline OUUrMUld L/1 Z historie DNA je nosičem genetické informace DNA má strukturu antiparalelní spirály Transkripce Translace Genetický kód Struktura proteinu Primární struktura (Sekvence) Sekundární struktura Terciární struktura (domény) Kvartérní struktura (komplexy) Funkce proteinů Nástroje mol.biologie, genomiky a proteomiky Transkripce Hlavní enzymy RNA polymeráza Templát DNA Substrát ribonukleotidy Produkt RNA Transkripce přenáší část genetické informace z DNA na mobilní mRNA (a) m newly synthesized short region oí RNA iran&cript DNA/RNA heliu □ i5P Outline Z historie DNA je nosičem genetické informace DNA má strukturu antiparalelní spirály Translace Genetický kód Primární struktura (Sekvence) Sekundární struktura Terciární struktura (domény) Kvartérní struktura (komplexy) Funkce proteinů Nástroje mol.biologie, genomiky a proteomiky Translace Hlavní enzymy Templát Substrát Produkt ribozom RNA aminokyseliny protein (bílkovina, peptid) Translace probíhá na ribozomech Triplety nukleotidů kódují jednotlivé aminokyseliny Kód sprostredkováva tRNA attached amino jT\ acid (Phe) 5'end D loop 3' end h G ni Ti ' ir rnl T loop anticodon loop anticodon (A) (B) □ i5P Kontrolní otázky 1. DNA určitého organizmu obsahuje 17% tymínu (T). Jaký je obsah cytozínu (C)? 2. Jaká je komplementární sekvence k sekvenci S'-ACGT-S'? Co je na těchto sekvencích zajímavé? Jaké vlastnosti by mohl mít protein, který se váže na DNA s takovou sekvencí? = Outline oiruKiura uina Z historie DNA je nosičem genetické informace DNA má strukturu antiparalelní spirály 11 dl I o rvi IJJUc Translace Genetický kód Struktura proteinů Primární struktura (Sekvence) Sekundární struktura Terciární struktura (domény) Kvartérní struktura (komplexy) Funkce proteinů Nástroje mol.biologie, genomiky a proteomiky Struktura proteinů Primární sekvence aminokyselin Sekundární hlavně o-helix a /5-struktura Terciární 3-D uspořádání Domény jedna nebo víc na protein Kvartérní komplexy skládající se z více podjednotek Skládání proteinů a druhý kód Mnoho čerstvě syntetizovaných proteinů se poskládá do své finální podoby bez pomoci dalších faktorů. ► demonstrováno na konkrétním proteinu (Anfinsen, 1966, ribonukleáza A) ► terciární struktura je zakódována v primární struktuře (kód dodnes neobjeven!) Protein folding amino acid side chains unfolded protein FOLDING binding site Fyzikálně-chemické vlastnosti aminokyselin Amino Acids Hydroxylic Aliphatic Sulphur ^ Containing Aromatic Small Acidic J? Hydrophobic Positive (Basic) Charged A alanine (ala) R arginine (arg) N asparagine (asn) D aspartic acid ■,. ) C cysteine (cys) Q glutamine (gin) E glutamic acid (giu) G glycine (gly) H histidirie I isoleucine (ill.') L leucine (leu) K lysine (lys) M metioneine \ F phenyalanine (phe) P proline • S serine (ser) T threonine tt nm) kiiiv-iii □ rS1 ATPáza Kanál umožňuje iónům proniknout membránou Receptor cyklického AMP (dimer a DNA) Prion ve formě PrPc a PrPsc 43% a-ľielix 30% a-helix 43% ß-sheet s I Příště Nástroje mol.biologie, genomiky a proteomiky □ i5P Outline Příloha □ ig For Further Reading Projekt SIMAP http://www.czechnationalteam.cz/view.php7nazevclanku simap&cisloclanku=2007020002 http://www.rozhlas.cz/leonardo/priroda/_zprava/321214