Proteiny - struktura a fold Proteiny • molekulární stroje, stavební bloky • enzymatická katalýza • regulační proteiny (řídí genovou expresi), receptory (akceptují intracelulární signály), strukturní proteiny (mikrofilamenta, mikrotubuly), membránové proteiny (transmembránový transport) • enormní variabilita, vysoká specificita • pro pochopení funkce nutná znalost 3D struktury • složení buňky: 50% proteiny, 15% sacharidy, 15% nukleové kyseliny, 10% lipidy, 10% ostatní Úrovně proteinové struktury Primary ...-Gly-Val-Tyr-Gln-Ser-Ala-Ile-Asn- Secondary Tertiary Quaternary primárni - sekvence AK sekundární - pravidelná periodická konformace hlavního řetězce terciární - sbalení sekundárních struktur jednoho řetězce kvartem í - struktura tvořená více řetězci Aminokyseliny rozdělení: • NPo:nepolární boční řetězec •Ala, Val, Leu, Ne, Phe, Pro, Met, Gly, Trp, Tyr • CPo: nabitý polárni boční řetězec •Asp, Glu, His, Lys, Arg • UPo: nenabitý polární boční řetězec •Ser, Thr, Cys, Asn, Gin Aminokyseliny alifatický postranní řetězec iminokyselina síra v postranním řetězci aromatické jádro, hydroxyl. skupina (ostatní) n T ä „Y. o^Wo oW^Wo ^Aj*3 Val íle Leu Zastoupení AK v proteinech Amino Acid Freq. [%] Alanine (Ala, A) 8.1 Arginine (Arg, R) 5.1 Asparagine (Asp, D) 5.2 Aspartic acid (Asn, N) 4.0 Cysteine (Cys, C) 1.2 Glutamine (Gin, Q) 3.8 Glutamic acid (Glu, E) 6.5 Glycine (Gly, G) 7.2 Histidine (His, H) 2.2 Isoleucine (He, I) 6.8 Leucine (Leu, L) 103 Lysine (Lys, K) 5.9 Methionine (Met, M) 2.5 Phenylalanine (Phe, F) 4.2 Proline (Pro, P) 4.3 Serine (Ser, S) 6.2 Threonine (Thr, T) 5.1 Tryptophan (Trp, W) 1.1 Tyrosine (Tyr, Y) 3.2 Valine (Val, V) 6.9 Aminokyseliny jsou chirální (kromě Gly) v proteinech se vyskytuje pouze L-forma Amino Acid Structure R-group (variant) R H \ é l: C* d N O Peptidová vazba je planární a má charakter 0 ca částečné dvojné vazby i / - zajištěno sp2 hybridizací / \ elektronů na atomech NaC Kovalentní vazby - za normální teploty pevné, nevibrují Kovalentní úhly - méně rigidní, vibrují za normální teploty, ale málo (cca 5 deg.) Dihedrální úhly - rotace kolem kovalentních vazeb, určují flexibilitu proteinů Dihedrální úhly Dihedrální úhly oj ' ^ oj C-N C'^^N řa trans oj=180° Cn cis oj=0° r energeticky je cis konformace nevýhodná (Ca si překážejí) c° výjimka - prolin ^'-n c-n - trans zvýhodněna jen málo Ca C01 C& - globulární prot.: 90% trans, 10% cis <- 2.8 Á Dihedrální úhly na rozdíl od N-C, rotace kolem Ca-C a N- Ca mají nízkou bariéru, a mohou tedy volně rotovat Ramachandranovy grafy - korelace úhlu cp (N- Ca) a úhlu qj (Ca-C) - rotace kolem cp je obtížnější než rotace kolem qj 2.9Ä<^mm(C-C) = 3.0Á 2.9Á>rmin(N-N) = 2.7Á ^2.9Á^ ^2.9Ä^ CC N N w / \ í: N — Ca C* — C Ramachandranovy grafy obecný glycin Figure 3.2. This is how Ramachandran plots of the disallowed (■). strained (□), and fully Figure 3.3. Th* imp of disallowed {■) and allowed (□} i> toofemvuiont of &eint (Gly) allowed (□) (0, ifr) conformations of the fragment CaC'N—C"—C'NC" would look, pro- in die protein chain vided all these atoms had no other atoms attached (right) and atoms of residues i — I and i I had no interactions. Ramachandranovy grafy alanin cystein 3 180. -^-- -180 n Figure 3.4. The map of allowed (□) 4>. 'A conformations of alanine (Ala) in the protein chain; (□), regions allowed for Gly only; (■), regions disallowed by main-chain interactions for all residues. 5' Figure 3.5. The map of disallowed (■) and allowed (□, □) <}>, -ji conformations of larger residues in the protein chain. (□), the region where all side-chain x 1 conformations are allowed; (□), the region where some x 1 conformations are disallowed. Sekundární struktura y. P Figure 7.1. The secondary structures of a polypeptide chain {a-helix and a strand of £-sheet) and the tertiary structure of a protein globule. Usually, taken together, a- and ^-structures make up about a half of the chain in a globular protein. a-helix • obecně: pravotočivý, levotočivý • stabilizace pomocí H-vazeb (mezi C=0 a H-N jednoho řetězce) - existence řady helixů: 27, 310, 413(=a), 516(tt) Residue number 0 1 2 3 4 5 N-end — N —C5 — C — N — Ca ~X ~ N — Č*^ľ — N^Tf^^^C' - ^^::::^5^C, — N — C3 — C — C-end H H * H *H Helices: no 27 310 413 = a 5i6= h Figure 7.3. Hydrogen bonds (shown with arrows) typical of different helices. The chain residues are numbered from the N- to the C-end of the chain. Typy helixů v proteinech pouze aR-helix je hluboko v oblasti povolených geometrií (ostatní buď na hraně, či povoleny jen pro Gly) aL-helixy nejsou v proteinech pozorovány 27 - velký úhel mezi N-H a 0=C je nevýhodný pro H-vazby TT-helix - otáčky příliš široké, energeticky nevýhodné, vznik děr 310R (310L možný jen pro Gly) v proteinech přítomné, pouze ale na krátkých fragmentech (3-4 AK) J SO I SO -180 0 ß-struktura paralelní nebo antiparalelní (nebo smíšená) stabilizace pomocí H-vazeb mezi jednotlivými řetězci (3-struktury rit H D II 0 11 0 N-cnd — N—Ca —C —N-C1- C—N — c—c .....N -c-e — N -C1—c —N— c—e — H 0 II 0 11 0 li 0 II 0 II 0 N-cnd — N—C — C — N-C1- C"-N -ca-c .....N -c-c — N -Ca-Cľ -N — C"-C- H 0 II o II 0 li 0 II o II Ü N-cnd — N—C — C — N-C1- C"-N -c—c .....N -C-C — N -C1—c —N— c-c- H 0 i Ej 0 II 0 1 ü H 0 II O u C-cnd -C'-C-N-C'-C1- ■ N - C —C—N -C" -C*—N —C -C-N — C - -Ca— N — 0 II 0 II 0 II Ii 0 II o n O N-cnd — N—C —C — N-C1- C"-N — C —C .....N -C-C — N — C1—C —N— c-e- H 0 II 0 II 0 H O II 0 II 0 N-cnd — N— Ca — C — N-C1- C—N -ca—c .....N —c-c — N -C1—c —N— c—e — H 0 1 i Ej i 0 1 II 0 1 1 1 Ü H 1 0 1 m O I II C-cnd —C—C*-N-C'-Ca- ■ N - C —C-N — C — C1—N —C —C-N — C- -Ca-N- 0 11 0 II 0 II C-cnd Figure 7.6. Chain pathway and location of hydrogen bonds in the parallel antiparallel (/it j) and mixed (/iff!) ,3-structures. As shown, in each ^-strand, the H-bonds (light blue) of one residue are directed oppositely to those of its neighbor in the chain. I IMitrogan \ Ox/gen i Hydrogen Dept Biol Penn Stale £2002 Figure 7.7. The $-sheet surface is pleated. The side-chains (shown as short red rods) are at the pleats and directed accordingly; i.e., the upward and downward side-chains alternate along the ^-strand. The H-bonds are shown in light-blue. Adapted from [12], Rozdělení protei - tvoří veliké, obvykle dehydratované agregáty, struktura bohatá na H -vazby, pravidelná, drží díky interakcím mezi řetězci - umístěny v membráně (dehydr.), pravidelná intramembránová část s vysokým podílem H-vazeb, omezení velikostí tloušťky membrány - rozpustné ve vodě, méně pravidelné, strukturu stabilizují především meziřetězcové interakce Experimentální rozlišení sekundárních struktur UV CD spektrum IR spektrum v D20 r...random coil a...a-helix ß... ß-structure J_I_L 190 200 210 220 230 240 250 Wavelength (nm) CA 1700 1600 Frequency (cm ) Systém s mnoha stupni volnosti • buď systém obsahující velké množství molekul, nebo systém tvořený jednou velkou a flexibilní molekulou • nutný přístup pomocí statistické fyziky • velké množství konfigurací • entropie - kolik konfigurací (mikrostavů) odpovídá pozorovanému makrostavu • teplota - úzce spojená s entropií Určení teploty velkého systému (termostatu) Ex E} + dE Energy Modrá křivka ukazuje závislost entropie S na energii systému E. Gradient dS/dE určuje teplotu T odpovídající energii E. M(E) je počet mikrostavu s energií E. Fx Ex Energy směrnice: S - S(E.,) = (E - E^/T-, E - T^S = E1 -T^E^ E1 - T1S(E1) ... volná energie systému při teplotě T1 (konst. podél směrnice) Protože je křivka S(E) konvexní (pod směrnicí), odpovídá kontaktní bod minimu volné energie při teplotě T1 Konformační změny: 1) pozvolná změna r, proces je pomalý Malou rychlost procesu mohou způsobovat: • pomalá difúze při vysoké viskozite • nutnost překonání bariéry volné energie Bariéra volné energie pasti" na křivce volné energie v podobě lokálních minim Denaturace proteinů • in vitro: pomocí vysoké (nízké) teploty, denaturačních činidel apod. • in vivo: umožňuje např. přechod přes membránu • nejstabilnější formou proteinu nemusí být nativní forma • protein nemusí mít fixovanou 3D strukturu (pouze při vazbách ligandů, DNA, RNA, apod.) • denaturace: fázový přechod „všechno nebo nic" =^> pozorovatelnými kvantitami pouze nativní a denaturovaný stav • renaturace je možná, pokud došlo pouze k mírným odchylkám od nativní struktury a protein není příliš velký • reverzibilita procesu znamená, že informace o sekundární a terciární struktuře proteinu je obsažena již v sekvenci aminokyselin Denaturace proteinů varľt Hoffovo kritérium: AE = AH / N AE...teplo spotřebované jednou „tající jednotkou", AH...teplo spotřebované N molekulami Tání celého proteinu probíhá jako fázový přechod „všechno nebo nic" • AE < AH / N ... tající jednotka je menší než celý protein, protein taje po částech • AE > AH / N ... tající jednotka je větší než celý protein, protein taje jako agregát molekul „Molten globule" • představuje skoro nativní konformaci proteinu • univerzální intermediát při sbalování a rozbalování proteinu (foding, unfolding) • sekundární struktura je velmi blízká nativní formě proteinu • malé uspořádání bočních řetězců • méně kompaktní než nativní protein (jádro je však stejně kompaktní jak v nativním proteinu) native globule molten globule • výskyt solventu uvnitř globule „Molten globule" Protože je tání proteinu fázový přechod 1. řádu, má mnohem vyšší energii a entropii než nativní stav (mez i řetězcové interakce jsou mnohem slabší a mobilita řetězce mnohem vyšší) Většina stupňů volnosti proteinového řetězce spojena s malými fluktuacemi bočních řetězců, jejich osvobození je pro MG termodynamicky výhodné a vede k mírnému zvětšení MG (v porovnání s nativním proteinem) - Density ->■ Zvětšení objemu =^> * ^^^=T^^ bez- významný pOkleS VDW (barrier state) *%N. interakcí, nárůst volné energie Volume Denaturace proteinů 0.7 0.8 Density U X o o c o J-H C o c o u o COIL -,' ~ ■ •* <. * * * \ \ \ \ \ \ \ \ 1 t NATIVE \ i i i ili' W f \ é \ é \ * \ * \ \ MOLTEN ■ i i i l 1 i i l 3 h 9 - 1 h denaturovaný stav nativní stav 0 20 40 60 Temp (°C) Fázový diagram konformačních stavů v lysozymu. Čárkovaně přechodové zóny. Protein folding Levinthalův paradox • pokud by pro každé reziduum existovaly 2 možné konformace, pak pro řetězec se 100 rezidui existuje 2100 alternativních struktur, a protože přechod z jedné konformace do druhé nemůže být rychlejší než 1 ps, prohledávání prostoru potenciální energie by trvalo nejméně ~2100 ps (~1010let) Otázka: Jak se dokáže protein sbalit do nativní formy během krátké doby (s-min)? Nativní forma proteinu je určena kineticky spíše než termodynamicky a jde cestou hledání snadno dosažitelného lokálního minima, než hledání globálního minima volné energie. Folding funnel Native state ensemble Kinetika x termodynamika • kinetika: velká rychlost foldingu, termodynamika: nejstabilnější struktura • termodynamická kritéria: - folding je reverzibilní, probíhá jako fázový přechod 1. druhu - denaturovaný stav je nejčastěji náhodné klubko (random coil) - i za normálních podmínek je nativní stav proteinu jen o několik kcal/mol stabilnější než nesbalený Nativní stav: nízká energie x Náhodné klubko: velká entropie Kinetika x termodynamika Požadavky na rychlost foldingu: • velká energetická mezera mezi nízkoenergetickými stavy a špatně uspořádanými (misfolded) stavy • celý proces nesmí mít moc kroků • nesmí obsahovat příliš vysoké energetické bariéry Požadavky kinetiky i termodynamiky mohou být splněny současně: lze předpokládat, že v biologických procesech našly uplatnění právě ty proteiny, které se takto formovat dokáží.