Logo1me •Základy proteomiky • •Proč právě proteomika? • • • •Jan Hejátko Logo1me §Zdrojová literatura k první přednášce: §Plant Functional Genomics, ed. Erich Grotewold, 2003, Humana Press, Totowa, New Jersey §Wang, L. and Wessler, S.R. (1998) Inefficient reinitiation is responsible for upstream open reading frame-mediated translational repression of the maize R gene. Plant Cell, 10, (1733) •Základy proteomiky •zdrojová literatura §Friml, J. and Palme, K. (2002) Polar auxin transport. Old questions and new concepts?. Plant Mol. Biol., 49, 273-284 §Mello, C.C. and Conte Jr., D. (2004) Revealing the world of RNA interference. Nature, 431, 338-342 §Surpin, M. and Raikhel, N. (2004) Traffic jams affect plant development and signal transduction. Nature Reviews/Molecular Cell Biology 5,100-109 •Monografie a učebnice •Publikace v mezinárodních časopisech §Proteome Research: New Frontiers in Functioonal Genomics, ed. Wilkins, M.R., Wiliams, K.L., Appel, R.D., Hochstrasser, D.F., 1997, Springer-Verlag, Berlin, Heidelberg §Dubová J. , Hejátko J., Friml J. (2005) Reproduction of Plants, in Encyclopedia of Molecular Cell Biology and Molecular Medicine (ed, R. A. Meyers), pp. 249 – 295. Wiley-VCH, Weinheim, Germany Logo1me •Proč právě proteomika? §Postgenomová éra a co s informacemi, které neumíme číst §Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování §Od genu k proteinu a zpět Logo1me §PROTEOME = PROTEins expressed by genOME (konference 2-D ELFO, Siena, 1994) §Proč vůbec studovat proteiny, když máme tolik genetických dat? (sekvence genomů, expresní profily genů, fenotypy mutantů,…?) •Na konci je vždy BIOLOGICKÝ PROBLÉM !!!! §DNA: GENOME, HAPLOME, EPIGENOME §RNA: TRANSCRIPTOME §PROTEIN: ORFEOME, PROTEOME, LOCALISOME, INTERACTOME, METABOLOME, PHENOME, … • •V koncovém výsledku, tedy fenotypu, se vždy projeví regulace na všech úrovních, od genu po protein a jeho modifikaci • •PHENOME: kombinace různých dat, zahrnujících fenotyp, expresní data různých (ideálně všech) genů daného organismu a proteinová data (interakce, jednotlivé vlastnosti proteinů, …) •Proč právě proteomika? The actual term 'genomics' is thought to have been coined by Dr. Tom Roderick, a geneticist at the Jackson Laboratory (Bar Harbor, ME) over beer at a meeting held in Maryland on the mapping of the human genome in 1986. (Wikipedia, http://en.wikipedia.org/wiki/Genomics). Logo1me •Postgenomová éra a co s informacemi, které neumíme číst §dnes k dispozici v databázích více než 700 000 záznamů (nr databáze) různých organizmů §Získané informace lze zpracovat pomocí bioinformatiky •Genome Project at NCBI •Anotace genů a odhad aminokyselinových sekvencí předpokládaných proteinů Logo1me Adobe Systems Adobe Systems §promotor §počátek transkripce §5´UTR §počátek translace §místa sestřihu §stop kodon §3´UTR §polyadenylační signál • •TATA •ATG….ATTCATCAT • •ATTATCTGATATA • • •5´UTR •3´UTR •….ATAAATAAATGCGA • • • • • • • • Struktura genů •AGGAGGT AGGAGGT - Shine/Dalgarno sequence, 5-10 bp upstream of AUG Logo1me •Postgenomová éra a co s informacemi, které neumíme číst •Anotace genů a odhad aminokyselinových sekvencí předpokládaných proteinů §dnes k dispozici v databázích více než 700 000 záznamů (nr databáze) různých organizmů §Získané informace lze zpracovat pomocí bioinformatiky Logo1me •Proč právě proteomika? §Postgenomová éra a co s informacemi, které neumíme číst §Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování Logo1me monarch_caterpillar monarch_imago •Gen •Transkript •Protein •Fenotyp • • • •Danaus plexippus (monarch) •Genom vs. Proteom Logo1me •Možná analogie s textem a jeho interpretací •Kdyžadoperbtabijsemdfjfwůcsaknclůsnínjxldalnxckjcnbychcxmasizdciksrdceasnanazxcnlsdlaň. •DNA: •RNA: •Když----------------jsem---------s----------ní-----dal----------bych-------si------srdce-------na- -------dlaň. •Když----------------jsem---------snídal-----------------------------------------------srdce. •Když----------------je-------------s----------ní-----dal----------by----------si------srdce------- na--------dlaň. •PROTEIN: •Když jsem s ní, dal bych si srdce na dlaň. •Když jsem s ní, dala by si srdce na dlaň. •Když jsem snídal srdce. •Když je s ní, dal by si srdce na dlaň. •Kdyžadoperbtabijsemdfjfwůcsaknclůsnínjxldalnxckjcnbychcxmasizdciksrdceasnanazxcnlsdlaň. Logo1me •Proč právě proteomika? §Postgenomová éra a co s informacemi, které neumíme číst §Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování §Od genu k proteinu a zpět Logo1me •Základní mechanismy regulace genové exprese • §regulace transkripce Logo1me •Základní mechanismy regulace genové exprese • §regulace transkripce SRBs (suppressor of RNA polymerase B) are proteins interacting with DNA polymerase II. These proteins were isolated in a screen for mutations rescuing the deletion mutants lacking the carboxy-terminal repeat in yeast. Logo1me •Základní mechanismy regulace genové exprese • §sestřih RNA SRBs (suppressor of RNA polymerase B) are proteins interacting with DNA polymerase II. These proteins were isolated in a screen for mutations rescuing the deletion mutants lacking the carboxy-terminal repeat in yeast. Logo1me • • • •identifikace mutanta s bodovou mutací (tranzice G→A) přesně v místě sestřihu na 5‘ konci 4. exonu •analýza pomocí RT PCR prokázala přítomnost fragmentu kratšího než by odpovídalo cDNA po normálním sestřihu •sekvenace tohoto fragmentu pak ukázala na alternativní sesřih s využitím nejbližšího možného místa sestřihu v exonu 4 RTPCR_EN • • •existence podobných obranných mechanizmů prokázána i u jiných organizmů (např. nestabilita mutantní mRNA se vznikem předčasného stopkodonu (> 50-55 bp před normálním stop kodonem) u eukaryot, viz doporučená studijní literatura, Singh and Lykke-Andersen, 2003) •Regulace sestřihu RNA jako vývojová adaptace Logo1me •Přeskupování subgenů při produkci protilátek §protilátky variabilní oblast (V) a konstantní oblast (C) a lehký (L) a těžký (H) řetězec §každá z V oblastí L řetězce u myší je kódována 2 subgeny (V a J) §každá z V oblastí H řetězce u myší je kódována 3 subgeny (V, J a D) Ab7 V oblasti jsou kódovány jednotlivými subgeny, kdežto C oblasti jsou kódovány pouze C geny. Obrázek ukazuje mechanismus přeskupování subgenů pro lehký řetězec. Logo1me •Přeskupování subgenů při produkci protilátek §v zárodečných liniích myších B-lymfocytů dochází k tzv. kombinatorické diversifikaci (přeskupování) subgenů (místně-specifickou rekombinací) §L řetězec (κ): cca 300 V sub-genů a 4 J subgeny (300 x 4 = 1200 možností) §H řetězec: cca 500 V sub-genů, 4 J subgeny a 12 D subgenů (500 x 4 x 12 = 24000 možností) §celkové množství kombinací u myší: cca 1200 x 24000 = 28 mil. různých V oblastí (protilátek rozpoznávající různé antigeny) MBC_01 §antigen indukuje tzv. afinitní dozrávání mechanismem somatické hypermutace §po aktivaci B-lymf. pomocnými T-lymf. dochází ke zvýšenému výskytu mutací ve V oblastech (1 mutace/V oblast/generaci, cca 1 mil. X vyšší než je obvyklé (např. u tzv. „house-keeping“ genů) a selekci protilátek se zvýšenou afinitou k antigenu V oblasti jsou kódovány jednotlivými subgeny, kdežto C oblasti jsou kódovány pouze C geny. Obrázek ukazuje mechanismus přeskupování subgenů pro lehký řetězec. Logo1me §regulace transkripce §sestřih RNA •Základní mechanismy regulace genové exprese §translační represe Logo1me §Translační represe prostřednictvím krátkých ORF v 5‘UTR §Identifikováno např. u kukuřice (Wang and Wessler, 1998, viz doporučená lit.) §V případě CKI1 pokus prokázat tento způsob regulace genové exprese pomocí transgenních linií nesoucích uidA pod kontrolou dvou verzí promotoru, zatím nepotvrzeno fig_1 • • •ATGaaaagagcttttTAG •M K R A F . • • •ATGaaaagagcttttTAG •M K R A F . •ATGatggtgaaagttaca…. •M M V K V T … •ATGatggtgaaagttaca…. •Regulace genové exprese mechanismem translační represe • • •ATGatggtgaaagttaca…. •M M V K V T … Logo1me §regulace transkripce §sestřih RNA •Základní mechanismy regulace genové exprese §translační represe §posttranskripční umlčování mechanismem RNAi Logo1me •Mechanismus RNA interference §RNAi objevena u Coenorhabditis elegans §umlčování bylo indukováno jak sense tak antisense RNA (pravď. kontaminace obou při in vitro transkripci) §dsRNA indukovala umlčování cca 10-100x účinněji §dsRNA indukce je závislá na vlastních genech-gen. vyhledávání •RNAi •rnai Logo1me •Genomika III. •mechanismus RNA interference §Molekulární podstata posttranskripčního umlčování genů (PTGS) §RNAi objevena u Coenorhabditis elegans §je to přirozený mechanismus regulace genové exprese u všech eukaryot §podstatou je tvorba dsRNA, která může být spuštěna několika způsoby: §přítomnost cizí „aberantní“ DNA §specifické transgeny obsahující obrácené repetice částí cDNA §transkripce vlastních genů pro shRNA (short hairpin RNA) nebo miRNA (micro RNA, endogenní „vlásenková“ RNA) §dsRNA je procesována enzymovým komplexem (DICER), což vede k tvorbě siRNA (short interference RNA), která se pak váže buď na enzymový komplex RITS (RNA-induced transcriptional silencing complex) nebo RISC (RNA-induced silencing komplex) §RISC zprostředkovává buď degradaci mRNA (v případě úplné similarity siRNA a cílové mRNA) nebo vede pouze k zastavení translace (v případě neúplné homologie jako je tomu např. v případě miRNA §RITS zprostředkovává reorganizaci genomové DNA (tvorba heterochromatinu a inhibice transkripce) Logo1me •RNA-dependent RNA polymerase •short hairpin RNA •micro RNA •Mello and Conte, Nature (2004) •Mechanism of RNA interference •+ tasiRNAs •21-24 bp It has been found that dsRNA might be either an intermediate or a trigger in PTGS. In the first case, dsRNA is formed by the action of RNA-dependent RNA polymerases (RdRPs), which use specific transcripts as a template. It is still not clear, how these transcripts are recognized, but it might be e.g. abundant RNA that is a result of viral amplification or transcription of foreign DNA. It is not clear, how the foreign DNA might be recognized, possibly, lack of bound proteins on the foreign “naked” DNA and its subsequent “signature” (e.g. by specific methylation pattern) during packing of the foreign DNA into the chromatin structure might be involved. The highly abundant transcripts might be recruited to the RdRPs by the defects in the RNA processing, e.g. lack of polyadenylation. In the case when dsRNA is a direct trigger, there are two major RNA molecules involved in the process: Short interference RNA (siRNA) and micro RNA (miRNA), both encoded by the endogenous DNA. These two functionally similar molecules differ in their origin: siRNAs are dominantly product of the cleavage of the long dsRNA that are produced by the action of cellular or viral RdRPs. However, there are also endogenous genes, e.g. short hairpin RNAs (shRNAs) allowing production of the siRNA (see the figure). miRNAs are involved in the developmental-specific regulations and are product of transcription of endogenous genes encoding for small dsRNAs with specific structure (see the figure). In addition to siRNAs, there are trans-acting siRNAs (tasiRNAs) that are a special class of siRNAs that appear to function in development (much like miRNAs) but have a unique mode of origin involving components of both miRNA and siRNA pathways. Developmental regulations via miRNAs are more often used in animals then in plants. The dsRNAs of all origins and pre miRNAs are cleaved by DICER or DICER-like (DCL) enzyme complexes with RNAse activity, leading to production of siRNAs and miRNA, respectively. These small RNAs are of 21-24 bp long and bind either to RNA-induced transcriptional silencing complex (RITS) or RNA-induced silencing komplex (RISC). Logo1me •The Nobel Prize in Physiology or Medicine 2006 •"for their discovery of RNA interference - gene silencing by double-stranded RNA" • Andrew Z. Fire Craig C. Mello USA USA Stanford University School of Medicine Stanford, CA, USA University of Massachusetts Medical School Worcester, MA, USA b. 1959 b. 1960 Andrew Z. Fire Craig C. Mello Logo1me •Regulace vývoje květů u Arabidopsis prostřednictvím miRNA §ABC model vývoje květních orgánů u rostlin §během vývoje květních orgánů dochází k určování identity jednotlivých květních orgánů kombinací exprese tzv. homeiotických genů §homeiotické geny kódují většinou rostlinné homolgy MADS-box transkripčních faktorů §mezi jednotlivými homeiotickými geny dochází k tzv. katastrálním interakcím, kdy exprese jednoho genu inhibuje expresi dalšího §např. AP1 je nejprve aktivní v celém květním meristému, po indukci exprese AG pak AG inhibuje expresi AP1 ve vnitřních dvou kruzích) § •Od genu k proteinu a zpět •posttranskripční umlčování mechanizmem siRNA §výjimkou je exprese genu AP2, jehož mRNA je přítomná v celém květním meristému, ale exprese AP2 je regulována na úrovni translace prostředictvím miRNA (gen miRNA 172) •wt •ap2 •35S::miRNA 172 •in situ lokalizace miRNA172 v 3. a 4. kruhu Logo1me •Základní mechanismy regulace genové exprese §regulace transkripce §Sestřih RNA §posttranskripční umlčování mechanizmem siRNA §směřování proteinů •Od genu k proteinu a zpět • §translační represe Logo1me §Intracelulární lokalizace proteinů §v rostlinných buňkách dochází k velice dynamickým procesům, zprostředkovávaným zejména tzv. endomembránovým transportem (viz film, GFP směřované do ER) §endomembránový transport je důležitým regulačním mechanismem při přenosu signálu a regulaci buněčných procesů secretion_pthways • •Od genu k proteinu a zpět •směřování (cílování) proteinů •CV, central vacuole; DV, dense vesicle; ER, endoplasmic reticulum; GA, Golgi apparatus; LV, lytic vacuole; N, nucleus; PAC, precursor-accumulating compartment; PB, protein body; PCR, partially coated reticulum; PSV, protein-storage vacuole; PVC, pre-vacuolar compartment; SV, secretory vesicle. Surpin and Raikhel, 2004. • §Pro funkci proteinů v buňkách je zásadní jejich správná lokalizace prostřednictvím tzv. signálních sekvencí Logo1me •Od genu k proteinu a zpět •směřování (cílování) proteinů §Cyklování auxinových přenašečů u Arabidopsis §auxin je rostlinný hormon se silným morfogenním účinkem §proteiny podílející se na transportu proteinů jsou tzv. PIN proteiny, polárně lokalizované v bunňkách kořene u Arabidopsis §v přítomnosti inhibitorů endocytózy (BFA) dochází k akumulaci těchto proteinů v intracelulárních kompartmentech…. §….čímž je zároveň negativně ovlivněn gravitropizmus u rostlin • • §PIN proteiny cyklují v endomembránovém systému rostlinné buńky Logo1me •Základní mechanismy regulace genové exprese §regulace transkripce §sestřih RNA §posttranskripční umlčování mechanizmem siRNA §směřování proteinů §posttranslační modifikace proteinů •Od genu k proteinu a zpět • §translační represe Logo1me •Význam posttranslačních modifikací proteinů §regulace enzymové aktivity §regulace interakcí proteinu s dalšími proteiny nebo jinými biomolekulami §přenos signálu •Od genu k proteinu a zpět •postranslační modifikace proteinů • §lokalizace proteinu v buňce §změna mechanických vlastností proteinu Logo1me •Typy posttranslačních modifikací proteinů §přidání glykosylfosfatidylinositolové (GPI) kotvy §fosforylace §N-myristolyace •Od genu k proteinu a zpět •postranslační modifikace proteinů • §sulfonace §glykosylace §N-metylace §hydroxylace §karboxylace §prenylace §…. Logo1me •Přenos signálu a regulace genové exprese prostřednictvím fosforylace §přenos cytokininového signálu u rostlin § •Od genu k proteinu a zpět •postranslační modifikace proteinů • FGP_logo_color Signal Transduction via TCS NUCLEUS Adobe Systems PM AHK sensor histidine kinases • AHK2 • AHK3 • CRE1/AHK4/WOL REGULATION OF TRANSCRIPTION INTERACTION WITH EFFECTOR PROTEINS HPt Proteins • AHP1-6 Response Regulators • ARR1-24 Recent Model of the CK Signaling via TCS Pathway D’Agostino et al., Plant Physiol, 2000 CK primary response genes - Type-A ARRs expression Logo1me •Přenos signálu a regulace genové exprese prostřednictvím fosforylace §přenos signálu prostřednictvím TGFβ (Transforming Growth Factor) u živočichů § •Od genu k proteinu a zpět •postranslační modifikace proteinů • • Logo1me •Proč právě proteomika? •Shrnutí §Postgenomová éra a co s informacemi, které neumíme číst §Genotyp vs. fenotyp, aneb co všechno se děje při vyjadřování §Od genu k proteinu a zpět