IV107 Bioinformatika I Přednáška 2 Katedra informačních technologií Masarykova Univerzita Brno Podzim 2023 Před týdnem Bioinformatika ► zpracování hromadních molekulárně-biologických dat ► posledních cca. 30 let ► data: genomika a proteomika ► sekvence ► struktury ► interakce a jiné funkce ► expresní data ► Sbírka rostlinných genomů a anotací (https://phytozome-next.jgi.doe.gov/) ► Galerie sekvenovaných genomů (h tt p ://w w w. g e n o m e n e ws n e t wo r k. o r g/) = Hierarchie biologických struktur U.tíim im» 10nm |(* | jjm iflpim |[Kl|iiii 1 mm 1 -1- -1-' 7 T < Light microscope Electron microscope UptáS ,«3 T2 phage Small mtHetuies Chloroplas 5> Plarrt and Kl animal bacteria cm Ö.1 m Im im in i: v.; m 1km i nimi_i ijuiliI_j i u"-! i .......I ' i ■ > mil_i i 111 j i J_ una idea eye 3r Fish e39 Hummingbrrd Giant tree Human Outline Struktura DNA Z historie DNA je nosičem genetické informace DNA má strukturu antiparalelní spirály Genetický kód Primární struktura (Sekvence) Sekundární struktura Terciární struktura (domény) Kvartérní struktura (komplexy) Funkce proteinů Nástroje mol.biologie, genomiky a proteomiky Kořeny genetiky Gregor J. Mendel V pokusech s rostlinami si všiml, že potomství dvou rodičů nezávisí na jejich vzhledu /fenotyp/, nýbrž na jakýchsi symbolicky popsaných faktorech, které do značné míry odpovídají dnešnímu označení gen /genotyp/ j „450 raSTEVAnCANE i Molekula DNA ► Objevena 1869 , považována za příliš jednoduchou ► Polymerická molekula, monomerem je: ► deoxyribonukleotid /DNA/ ► ribonukleotid/RNA/ ► Symbolické značení A,C,G,T,U ► Spirálovitá prostorová struktura Zastoupení nukleotidů v různých organismech Organizmus %A %G %C %T A+G T+C A+T G+C E.coli 24.7 26.0 25.7 23.6 1.03 0.93 S.lutea 13.4 37.1 37.1 12.4 1.04 0.35 S.cerevisae 31.3 18.7 17.1 32.9 1.09 1.79 H.sapiens 30.9 19.9 19.8 29.4 1.00 1.52 Dedukce: Nukleotidy se vyskytují v párech From A.L.Lehninger (1970), Biochemistry, Worth Publishers, New York Difrakce na molekule DNA Difrakce krystalické DNA z roku 1952 od Rosalind Franklin Svědčí o periodicitě 0.3nm a 3.4nm Struktura DNA Tento obrázek a jedna stránka textu pomohli autorům k Nobelově ceně. Přínos Rosalind Franklin ve formě pečlivého zkoumání krystalů v té chvíli oceněn nebyl. Poštovní známka k 50. výročí objevení struktury DNA kleotidy Struktura DNA □ i5P = Struktura DNA Chnomosome Uspořádání DNA v jádře Uspořádání Počet nukleotidů Relativní délka k jádru Lineární 10000 600000 Plošné 25 mil 240 Prostorové 62.5 mld 0.1 Prostorové uspořádání DNA se 12000000 nukleotidy v jádře o rozměrech 0.0034 mm (rozměry jednoho páru nukleotidů dle modelu Watsona a Cricka jsou 1.36 x 0.34a?a?7). Interfázní jádro An Overview of Genome Organization and How We Got There: from FISH to Hi-C Jimri Ffi(*t." lain WJllllíťiiůiVJt Ytrúáy A. yiilüiHorr.1' Jcjirr Doillr* bfutmeni of Sochtmuty, jndCpooůVran Cit**? neteacnCwiw*, MrCM l.v>nmit>, Mom w*l OuCbK, Candid MAC Humon utrautiUh«, MBC knimxr t/Gentm jnd Mttscutii Wnf-cnc UnhmUyCtEdntxingh ĚdmĎujrfi. lAWlrd Akujdcm' □ i5P Interfázní jádro Outline Z historie DNA je nosičem genetické informace DNA má strukturu antiparalelní spirály Centrální dogma a genová exprese Genetický kód Primární struktura (Sekvence) Sekundární struktura Terciární struktura (domény) Kvartérní struktura (komplexy) Funkce proteinů Nástroje mol.biologie, genomiky a proteomiky Základní pravidla ► DNA RNA protein ► retroviry: RNA -» DNA ► jeden gen jeden protein ► RNA geny kódují RNA ► alternativní sestřih umožňuje tvorbu několika proteinů ► post-translační modifikace umožňují vznik různých forem jednoho typu proteinu Informace v sekvenci proteinů se neodráží v sekvenci DNA nebo RNA Informace v DNA určuje existenci proteinů v buňce genů protein synthesis (translation) Outline OUUrMUld L/1 Z historie DNA je nosičem genetické informace DNA má strukturu antiparalelní spirály Centrální dooma a oenová exorese Replikace DNA TV o kí o ki ki/^ô i rcuioKTipuc Translace Genetický kód Struktura proteinu Primární struktura (Sekvence) Sekundární struktura Terciární struktura (domény) Kvartérní struktura (komplexy) Funkce proteinů Nástroje mol.biologie, genomiky a proteomiky Replikace DNA Hlavní enzymy helikáza, DNA polymeráza Templát DNA Substrát deoxyribonukleotidy Produkt DNA Replikace DNA template strand A yfl 0: o ó 0 ft 0 O ó $~~^3' it! strand A '3 5' ;<5 "Ó";~"ÓT~^."6r"Ói ff" 0~~0~"<;3' new strand B & ;A: It iT iGi jci lei |a |g] t t |c] , lGi !t. |A |AJ |a |gj |S[ 3'^ 0 0 0 0 0 0 0 0 0 0 5' new strand A strand B v 5^ parent DNA double helix ■yy jO: O tf 6 & ó. Ď fr^^s' template strand B Outline OUUrMUld L/1 Z historie DNA je nosičem genetické informace DNA má strukturu antiparalelní spirály Transkripce Translace Genetický kód Struktura proteinu Primární struktura (Sekvence) Sekundární struktura Terciární struktura (domény) Kvartérní struktura (komplexy) Funkce proteinů Nástroje mol.biologie, genomiky a proteomiky Transkripce Hlavní enzymy RNA polymeráza Templát DNA Substrát ribonukleotidy Produkt RNA Transkripce přenáší část genetické informace z DNA na mobilní mRNA (a) m newly synthesized short region oí RNA iran&cript DNA/RNA heliu □ i5P Outline Z historie DNA je nosičem genetické informace DNA má strukturu antiparalelní spirály Translace Genetický kód Primární struktura (Sekvence) Sekundární struktura Terciární struktura (domény) Kvartérní struktura (komplexy) Funkce proteinů Nástroje mol.biologie, genomiky a proteomiky Translace Hlavní enzymy Templát Substrát Produkt ribozom RNA aminokyseliny protein (bílkovina, peptid) Translace probíhá na ribozomech Triplety nukleotidů kódují jednotlivé aminokyseliny Kód sprostredkováva tRNA attached amino jT\ acid (Phe) 5'end D loop 3' end h G ni Ti ' ir rnl T loop anticodon loop anticodon (A) (B) □ i5P = Kontrolní otázky 1. DNA určitého organizmu obsahuje 17% tymínu (T). Jaký je obsah cytozínu (C)? 2. Jaká je komplementární sekvence k sekvenci S'-ACGT-S'? Co je na těchto sekvencích zajímavé? Jaké vlastnosti by mohl mít protein, který se váže na DNA s takovou sekvencí? = Outline oiruKiura uina Z historie DNA je nosičem genetické informace DNA má strukturu antiparalelní spirály 11 dl I o rvi IJJUc Translace Genetický kód Struktura proteinů Primární struktura (Sekvence) Sekundární struktura Terciární struktura (domény) Kvartérní struktura (komplexy) Funkce proteinů Nástroje mol.biologie, genomiky a proteomiky Struktura proteinů Primární sekvence aminokyselin Sekundární hlavně o-helix a /5-struktura Terciární 3-D uspořádání Domény jedna nebo víc na protein Kvartérní komplexy skládající se z více podjednotek Skládání proteinů a druhý kód Mnoho čerstvě syntetizovaných proteinů se poskládá do své finální podoby bez pomoci dalších faktorů. ► demonstrováno na konkrétním proteinu (Anfinsen, 1966, ribonukleáza A) ► terciární struktura je zakódována v primární struktuře (kód dodnes neobjeven!) Protein folding amino acid side chains unfolded protein FOLDING binding site Fyzikálně-chemické vlastnosti aminokyselin Amino Acids Hydroxylic Aliphatic Sulphur ^ Containing Aromatic Small Acidic J? Hydrophobic Positive (Basic) Charged A alanine (ala) R arginine (arg) N asparagine (asn) D aspartic acid ■,. ) C cysteine (cys) Q glutamine (gin) E glutamic acid (giu) G glycine (gly) H histidirie I isoleucine (ill.') L leucine (leu) K lysine (lys) M metioneine \ F phenyalanine (phe) P proline • S serine (ser) T threonine 0°>O Aminokyseliny můžou být vůči sobě různě orientovány Torzní úhly: tt nm) kiiiv-iii ATPáza Kanál umožňuje iónům proniknout membránou Receptor cyklického AMP (dimer a DNA) Prion ve formě PrPc a PrPsc 43% a-ľielix 30% a-helix 43% ß-sheet S I □ i5P Příště Nástroje mol.biologie, genomiky a proteomiky □ i5P