CG020 Genomika Bi7201 Základy genomiky Přednáška 2 Identifikace genů Jan Hejátko Funkční genomika a proteomika rostlin, Mendelovo centrum genomiky a proteomiky rostlin, Středoevropský technologický institut (CEITEC), Masarykova univerzita, Brno hejatko@sci.muni.cz, www.ceitec.muni.cz §Zdrojová literatura ke kapitole 2 §Plant Functional Genomics, ed. Erich Grotewold, 2003, Humana Press, Totowa, New Jersey §Majoros, W.H., Pertea, M., Antonescu, C. and Salzberg, S.L. (2003) GlimmerM, Exonomy, and Unveil: three ab initio eukaryotic genefinders. Nucleic Acids Research, 31(13). §Singh, G. and Lykke-Andersen, J. (2003) New insights into the formation of active nonsensemediated decay complexes. TRENDS in Biochemical Sciences, 28 (464). §Wang, L. and Wessler, S.R. (1998) Inefficient reinitiation is responsible for upstream open reading frame-mediated translational repression of the maize R gene. Plant Cell, 10, (1733) §de Souza et al. (1998) Toward a resolution of the introns earlyylate debate: Only phase zero introns are correlated with the structure of ancient proteins PNAS, 95, (5094) §Feuillet and Keller (2002) Comparative genomics in the grass family: molecular characterization of grass genome structure and evolution Ann Bot, 89 (3-10) §Frobius, A.C., Matus, D.Q., and Seaver, E.C. (2008). Genomic organization and expression demonstrate spatial and temporal Hox gene colinearity in the lophotrochozoan Capitella sp. I. PLoS One 3, e4004 § § Literatura §Identifikace genů ab initio §příprava genově obohacených knihoven pomocí technologie metylačního filtrování §EST knihovny §přímá a reverzní genetika §Experimentální identifikace genů §genomová kolinearita a genová homologie §struktura genů a jejich vyhledávání §Postupy „přímé“ a reverzní genetiky §rozdíly v myšlenkových přístupech k identifikaci genů a jejich funkcí Osnova §Postupy „přímé“ a reverzní genetiky §rozdíly v myšlenkových přístupech k identifikaci genů a jejich funkcí Osnova mut_1 mut_2 3 : 1 Přístupy „klasické“ genetiky „Reverzně genetický“ přístup ? mut4 inzerční mutageneze 5‘TTATATATATATATTAAAAAATAAAATAAAAGAACAAAAAAGAAAATAAAATA….3‘ Přímá vs. reverzní genetika Revoluce v chápání pojmu genu • Předpokládaný přenašeč signálu u dvoukomponentního signálního systému Arabidopsis Identifikace role genu ARR21 NUCLEUS Adobe Systems PM AHK sensor histidine kinases • AHK2 • AHK3 • CRE1/AHK4/WOL REGULATION OF TRANSCRIPTION INTERACTION WITH EFFECTOR PROTEINS HPt Proteins • AHP1-6 Response Regulators • ARR1-24 Recent Model of the CK Signaling via Multistep Phosphorelay (MSP) Pathway Identifikace role genu ARR21 • Předpokládaný přenašeč signálu u dvoukomponentního signálního systému Arabidopsis • Mutant identifikován vyhledáváním v databázi inzerčních mutantů (SINS-sequenced insertion site) pomocí programu BLAST Identifikace role genu ARR21 §vyhledávání v databázi inzerčních mutantů (SINS) §lokalizace inzerce dSpm v genomové sekvenci ARR21 pomocí sekvenace PCR produktů Identifikace role genu ARR21 – izolace inz. mutanta • Předpokládaný přenašeč signálu u dvoukomponentního signálního systému Arabidopsis • Mutant identifikován vyhledáváním v databázi inzerčních mutantů (SINS-sequenced insertion site) pomocí programu BLAST • Exprese ARR21 u standardního typu a Inhibice exprese u inzerčního mutanta potvrzena na úrovni RNA Identifikace role genu ARR21 Standardní typ Inzerční mutant Identifikace role genu ARR21 – analýza exprese • Předpokládaný přenašeč signálu u dvoukomponentního signálního systému Arabidopsis • Mutant identifikován vyhledáváním v databázi inzerčních mutantů (SINS-sequenced insertion site) pomocí programu BLAST • Exprese ARR21 u standardního typu a Inhibice exprese u inzerčního mutanta potvrzena na úrovni RNA • Analýza fenotypu inzečního mutanta Identifikace role genu ARR21 Fig 5 •Analýza citlivosti k regulátorům růstu rostlin §2,4-D a kinetin §etylén §světlo různých vlnových délek •Doba kvetení i počet semen nezměněn Identifikace role genu ARR21 – analýza fenotypu mutanta • Funkční redundance v rámci genové rodiny? Identifikace role genu ARR21 – příčiny absence fenotypu ARR-tree Identifikace role genu ARR21 – příbuznost ARR genů • Funkční redundance v rámci genové rodiny? • Fenotypový projev pouze za velmi specifických podmínek (?) Identifikace role genu ARR21 – příčiny absence fenotypu §Gen ARR21 identifikován pomocí srovnávací analýzy genomu Arabidopsis §Byla prokázána místně specifická exprese genu ARR21 na úrovni RNA §Inzerční mutageneze v případě identifikace funkce genu ARR21 ve vývoji Arabidopsis byla neúspěšná, pravděpodobně v důsledku funkční redundance v rámci genové rodiny §Na základě analýzy sekvence byla předpovězena jeho funkce Identifikace role genu ARR21 – shrnutí §Identifikace genů ab initio §struktura genů a jejich vyhledávání §Postupy „přímé“ a reverzní genetiky §rozdíly v myšlenkových přístupech k identifikaci genů a jejich funkcí Osnova Logo1me Adobe Systems Adobe Systems §promotor §počátek transkripce §5´UTR §počátek translace §místa sestřihu §stop kodon §3´UTR §polyadenylační signál TATA ATG….ATTCATCAT ATTATCTGATATA 5´UTR 3´UTR ….ATAAATAAATGCGA Struktura genů Sestřih RNA §zanedbání 5‘ a 3‘ UTR § §identifikace počátku translace (ATG) a stop kodonu (TAG, TAA, TGA) §nalezení donorových (většinou GT) a akceptorových (AG) míst sestřihu §většina ORF není skutečně kódujícími sekvencemi – u Arabidopsis je asi 350 mil. ORF na každých 900 bp (!) §využití různých statistických modelů (např. Hidden Markov Model, HMM, viz doporučená studijní literatura, Majoros et al., 2003) k posouzení a ohodnocení váhy identifikovaných donorových a akceptorových míst Identifikace genů ab initio §programy pro predikci míst sestřihu (specificita přibližně 35%) § ¨ GeneSplicer (http://www.tigr.org/tdb/GeneSplicer/gene_spl.html) ¨ SplicePredictor (http://deepc2.psi.iastate.edu/cgi-bin/sp.cgi) Predikce míst sestřihu Predikce míst sestřihu Predikce míst sestřihu §programy pro predikci míst sestřihu (specificita přibližně 35%) § ¨ GeneSplicer (http://www.tigr.org/tdb/GeneSplicer/gene_spl.html) ¨ SplicePredictor (http://deepc2.psi.iastate.edu/cgi-bin/sp.cgi) Identifikace genů ab initio ¨ NetGene2 (http://www.cbs.dtu.dk/services/NetGene2/) Predikce míst sestřihu > Predikce míst sestřihu Logo1me Proteomika 2011 §odchylky rozpoznávání míst sestřihu u rostlin v praxi - příklad vývojové plasticity (nejen) rostlin •identifikace mutanta s bodovou mutací (tranzice G→A) přesně v místě sestřihu na 5‘ konci 4. exonu Sestřih RNA a adaptace Logo1me Proteomika 2011 •identifikace mutanta s bodovou mutací (tranzice G→A) přesně v místě sestřihu na 5‘ konci 4. exonu •analýza pomocí RT PCR prokázala přítomnost fragmentu kratšího než by odpovídalo cDNA po normálním sestřihu RTPCR_EN Sestřih RNA a adaptace Logo1me Proteomika 2011 Identifikace genů ab initio §odchylky rozpoznávání míst sestřihu u rostlin v praxi - příklad vývojové plasticity (nejen) rostlin •identifikace mutanta s bodovou mutací (tranzice G→A) přesně v místě sestřihu na 5‘ konci 4. exonu •analýza pomocí RT PCR prokázala přítomnost fragmentu kratšího než by odpovídalo cDNA po normálním sestřihu •sekvenace tohoto fragmentu pak ukázala na alternativní sesřih s využitím nejbližšího možného místa sestřihu v exonu 4 Logo1me Proteomika 2011 •existence podobných obranných mechanizmů prokázána i u jiných organizmů (např. nestabilita mutantní mRNA se vznikem předčasného stopkodonu (> 50-55 bp před normálním stop kodonem) u eukaryot, viz doporučená studijní literatura, Singh and Lykke-Andersen, 2003) Identifikace genů ab initio §odchylky rozpoznávání míst sestřihu u rostlin v praxi - příklad vývojové plasticity (nejen) rostlin •identifikace mutanta s bodovou mutací (tranzice G→A) přesně v místě sestřihu na 5‘ konci 4. exonu •analýza pomocí RT PCR prokázala přítomnost fragmentu kratšího než by odpovídalo cDNA po normálním sestřihu •sekvenace tohoto fragmentu pak ukázala na alternativní sesřih s využitím nejbližšího možného místa sestřihu v exonu 4 §programy pro predikci exonů Identifikace genů ab initio q 4 typy exonů (podle polohy): • iniciační • vnitřní • terminální • jednoduché ¨ Genescan (http://genes.mit.edu/GENSCAN.html) qprogramy kromě rozpoznávání míst sestřihu zohledňují i strukturu jednotlivých typů exonů ¨ GeneMark.hmm (http://opal.biology.gatech.edu/GeneMark/) • iniciační: • interní: ¨ MZEF (http://rulai.cshl.org/tools/genefinder/) Základy genomiky II, Identifikace genů Identifikace genů ab initio > Základy genomiky II, Identifikace genů Identifikace genů ab initio Explanation Gn.Ex : gene number, exon number (for reference) Type : Init = Initial exon (ATG to 5' splice site) Intr = Internal exon (3' splice site to 5' splice site) Term = Terminal exon (3' splice site to stop codon) Sngl = Single-exon gene (ATG to stop) Prom = Promoter (TATA box / initation site) PlyA = poly-A signal (consensus: AATAAA) S : DNA strand (+ = input strand; - = opposite strand) Begin : beginning of exon or signal (numbered on input strand) End : end point of exon or signal (numbered on input strand) Len : length of exon or signal (bp) Fr : reading frame (a forward strand codon ending at x has frame x mod 3) Ph : net phase of exon (exon length modulo 3) – the position of the intron towards the ORF of the exon (0, 1 or 2) I/Ac : initiation signal or 3' splice site score (tenth bit units) Do/T : 5' splice site or termination signal score (tenth bit units) CodRg : coding region score (tenth bit units) P : probability of exon (sum over all parses containing exon) Tscr : exon score (depends on length, I/Ac, Do/T and CodRg scores) Comments The SCORE of a predicted feature (e.g., exon or splice site) is a log-odds measure of the quality of the feature based on local sequence properties. For example, a predicted 5' splice si te with score > 100 is strong; 50-100 is moderate; 0-50 is weak; and below 0 is poor (more than likely not a real donor site). The PROBABILITY of a predicted exon is the estimated probability under GENSCAN's model of genomic sequence structure that the exon is correct. This probability depends in general on global as well as local sequence properties, e.g., it depends on how well the exon fits with neighboring exons. It has been shown that predicted exons with higher probabilities are more likely to be correct than those with lower probabilities. What are the suboptimal exons? Under the probabilistic model of gene structural and compositional properties used by GENSCAN, each possible "parse" (gene structure description) which is compatible with the sequence is assigned a probability. The default output of the program is simply the "optimal" (highest probability) parse of the sequence. The exons in this optimal parse are referred to as "optimal exons" and the translation products of the corresponding "optimal genes" are printed as GENSCAN predicted peptides. (All the data in our J Mol Biol paper and on the other GENSCAN web pages refer exclusively to the optimal parse/optimal exons.) Of course, the optimal parse does not always correspond to the actual (biological) parse of the sequence, that is, the actual set of exons/genes present. In addition, there may be more than one parse which can be considered "correct", for example, in the case of a gene which is alternatively transcribed, translated or spliced. For both of these reasons, it may be of interest to consider "suboptimal" ("near-optimal") exons as well, i.e. exons which have reasonably high probability but are not present in the optimal parse. Specifically, for every potential exon E in the sequence, the probability P(E) is defined as the sum of the probabilities under the model of all possible "parses" (gene structures) which contain the exact exon E in the correct reading frame. (This quantity is calculated as described on the GENSCAN exon probability page.) Given a probability cutoff C, suboptimal exons are those potential exons with P(E) > C which are not present in the optimal parse. Suboptimal exons have a variety of potential uses. First, suboptimal exons sometimes correspond to real exons which were missed for whatever reason by the optimal parse of the sequence. Second, regions of a prediction which contain multiple overlapping and/or incompatible optimal and suboptimal exons may in some cases indicate alternatively spliced regions of a gene (Burge & Karlin, in preparation). The probability cutoff C used to determine which potential exons qualify as suboptimal exons can be set to any of a range of values between 0.01 and 1.00. The default value on the web page is 1.00, meaning that no suboptimal exons are printed. For most applications, a cutoff value of about 0.10 is recommended. Setting the value much lower than 0.10 will often lead to an explosion in the number of suboptimal exons, most of which will probably not be useful. On the other hand, if the value is set much higher than 0.10, then potentially interesting suboptimal exons may be missed. Základy genomiky II, Identifikace genů Identifikace genů ab initio Explanation Gn.Ex : gene number, exon number (for reference) Type : Init = Initial exon (ATG to 5' splice site) Intr = Internal exon (3' splice site to 5' splice site) Term = Terminal exon (3' splice site to stop codon) Sngl = Single-exon gene (ATG to stop) Prom = Promoter (TATA box / initation site) PlyA = poly-A signal (consensus: AATAAA) S : DNA strand (+ = input strand; - = opposite strand) Begin : beginning of exon or signal (numbered on input strand) End : end point of exon or signal (numbered on input strand) Len : length of exon or signal (bp) Fr : reading frame (a forward strand codon ending at x has frame x mod 3) Ph : net phase of exon (exon length modulo 3) – the position of the intron towards the ORF of the exon (0, 1 or 2) I/Ac : initiation signal or 3' splice site score (tenth bit units) Do/T : 5' splice site or termination signal score (tenth bit units) CodRg : coding region score (tenth bit units) P : probability of exon (sum over all parses containing exon) Tscr : exon score (depends on length, I/Ac, Do/T and CodRg scores) Comments The SCORE of a predicted feature (e.g., exon or splice site) is a log-odds measure of the quality of the feature based on local sequence properties. For example, a predicted 5' splice si te with score > 100 is strong; 50-100 is moderate; 0-50 is weak; and below 0 is poor (more than likely not a real donor site). The PROBABILITY of a predicted exon is the estimated probability under GENSCAN's model of genomic sequence structure that the exon is correct. This probability depends in general on global as well as local sequence properties, e.g., it depends on how well the exon fits with neighboring exons. It has been shown that predicted exons with higher probabilities are more likely to be correct than those with lower probabilities. What are the suboptimal exons? Under the probabilistic model of gene structural and compositional properties used by GENSCAN, each possible "parse" (gene structure description) which is compatible with the sequence is assigned a probability. The default output of the program is simply the "optimal" (highest probability) parse of the sequence. The exons in this optimal parse are referred to as "optimal exons" and the translation products of the corresponding "optimal genes" are printed as GENSCAN predicted peptides. (All the data in our J Mol Biol paper and on the other GENSCAN web pages refer exclusively to the optimal parse/optimal exons.) Of course, the optimal parse does not always correspond to the actual (biological) parse of the sequence, that is, the actual set of exons/genes present. In addition, there may be more than one parse which can be considered "correct", for example, in the case of a gene which is alternatively transcribed, translated or spliced. For both of these reasons, it may be of interest to consider "suboptimal" ("near-optimal") exons as well, i.e. exons which have reasonably high probability but are not present in the optimal parse. Specifically, for every potential exon E in the sequence, the probability P(E) is defined as the sum of the probabilities under the model of all possible "parses" (gene structures) which contain the exact exon E in the correct reading frame. (This quantity is calculated as described on the GENSCAN exon probability page.) Given a probability cutoff C, suboptimal exons are those potential exons with P(E) > C which are not present in the optimal parse. Suboptimal exons have a variety of potential uses. First, suboptimal exons sometimes correspond to real exons which were missed for whatever reason by the optimal parse of the sequence. Second, regions of a prediction which contain multiple overlapping and/or incompatible optimal and suboptimal exons may in some cases indicate alternatively spliced regions of a gene (Burge & Karlin, in preparation). The probability cutoff C used to determine which potential exons qualify as suboptimal exons can be set to any of a range of values between 0.01 and 1.00. The default value on the web page is 1.00, meaning that no suboptimal exons are printed. For most applications, a cutoff value of about 0.10 is recommended. Setting the value much lower than 0.10 will often lead to an explosion in the number of suboptimal exons, most of which will probably not be useful. On the other hand, if the value is set much higher than 0.10, then potentially interesting suboptimal exons may be missed. • Funkční význam sestřihu v nepřekládaných oblastech - důležitá regulační součást genů §Translační represe prostřednictvím krátkých ORF v 5‘UTR §Identifikováno např. u kukuřice (Wang and Wessler, 1998, viz doporučená lit.) §V případě CKI1 pokus prokázat tento způsob regulace genové exprese pomocí transgenních linií nesoucích uidA pod kontrolou dvou verzí promotoru, zatím nepotvrzeno ATGaaaagagcttttTAG M K R A F . ATGaaaagagcttttTAG M K R A F . ATGatggtgaaagttaca…. M M V K V T … ATGatggtgaaagttaca…. Regulace transkripce • Funkční význam sestřihu v nepřekládaných oblastech - důležitá regulační součást genů §V případě CKI1 pokus prokázat tento způsob regulace genové exprese pomocí transgenních linií nesoucích uidA pod kontrolou dvou verzí promotoru, zatím nepotvrzeno Regulace transkripce fig_1 §programy pro genové modelování § ¨ Genescan (http://genes.mit.edu/GENSCAN.html) velice dobrý pro predikci exonů v kódujích oblastech (testováno na genu PDR9, identifikoval všech 23 (!) exonů ¨ GeneMark.hmm (http://opal.biology.gatech.edu/GeneMark/) qzohledňují také další parametry, např. návaznost ORF Genové modelování Základy genomiky II, Identifikace genů Predikce funkce genů in silico vyhledávání genů Identifikace genů ab initio Základy genomiky II, Identifikace genů Predikce funkce genů in silico vyhledávání genů Identifikace genů ab initio Základy genomiky II, Identifikace genů Predikce funkce genů in silico vyhledávání genů Identifikace genů ab initio §vyhledávání genů podle homologií §porovnávání s EST databázemi § ¨ BLASTN (http://www.ncbi.nlm.nih.gov/BLAST/, http://workbench.sdsc.edu/) ¨ BLASTX (http://www.ncbi.nlm.nih.gov/BLAST/, http://workbench.sdsc.edu/) §porovnávání s proteinovými databázemi ¨ Genewise (http://www.ebi.ac.uk/Wise2/) §porovnávání s homologními genomovými sekvencemi z příbuzných druhů ¨ VISTA/AVID (http://www.lbl.gov/Tech-Transfer/techs/lbnl1690.html) porovnávají proteinovou sekvenci s genomovou DNA (po zpětném překladu), je nutná znalost aminokyselinové sekvence Genové homologie §Identifikace genů ab initio §genomová kolinearita a genová homologie §struktura genů a jejich vyhledávání §Postupy „přímé“ a reverzní genetiky §rozdíly v myšlenkových přístupech k identifikaci genů a jejich funkcí Osnova §genomy příbuzných druhů se přes značné odlišnosti vyznačují podobnostmi v uspořádání i sekvencích, možnost využití při identifikaci genů u příbuzných organizmů pomocí vyhledávání v databázích § ¨ mapování malých genomů s využitím nízkokopiových DNA markerů (např. RFLP) §obecné schéma postupu při využívání geonomové kolinearity (také „komparativní genomika“) při experimentální identifikaci genů příbuzných organizmů: ¨využití těchto markerů k identifikaci orthologních genů (genů se stejnou nebo podobnou funkcí) příbuzného organizmu ¨malý genom (např. rýže, 466 Mbp) může sloužit jako vodítko, kdy jsou identifikovány molekulární nízkokopiové markery (např. RFLP) ve vazbě s genem zájmu a tyto oblasti jsou pak použity jako sonda při vyhledávání v BAC knihovnách při identifikaci orthologních oblastí velkých genomů (např. ječmene nebo pšenice, 5000, resp. 16000 Mbp) Genomová kolinearita Genomová kolinearita Feuillet and Keller, 2002 Obrázek “file:///C:/Documents%20and%20Settings/hejatko/My%20Documents/teaching/pics/comp_gen_grasses.jpeg” nelze zobrazit, protože obsahuje chyby. §zejména využitelné u trav (např. využití příbuznosti u ječmene, pšenice, rýže a kukuřice) § §malé geonomové přestavby (dalece, duplikace, inverze a translokace menší než několik cM) jsou pak detekovány podrobnou sekvenční komparativní analýzou § §během evoluce dochází u příbuzných druhů k odchylkám především v nekódujících oblastech (invaze retrotranspozonů atd.) § Genomová kolinearita Obrázek “file:///C:/Documents%20and%20Settings/hejatko/My%20Documents/teaching/pics/comp_gen_grasses.jpeg” nelze zobrazit, protože obsahuje chyby. §Genomová kolinearita HOX genů u živočichů §Transkripční faktory řídící organizaci těla v anterio-posteriorní ose §Pozice genů v genomu odpovídá i prostorové expresi během vývoje § Frobius et al.. 2008 Genomová kolinearita §Identifikace genů ab initio §příprava genově obohacených knihoven pomocí technologie metylačního filtrování §Experimentální identifikace genů §genomová kolinearita a genová homologie §struktura genů a jejich vyhledávání §Postupy „přímé“ a reverzní genetiky §rozdíly v myšlenkových přístupech k identifikaci genů a jejich funkcí Osnova §příprava genově obohacených knihoven pomocí technologie metylačního filtrování §geny jsou (větsinou!) hypometylované, kdežto nekódující oblasti jsou metylované ¨ McrBC rozpoznává v DNA metylovaný cytozin, který předchází purin (G nebo A) §využití bakteriálního RM systému, který rozpoznává metylovanou DNA pomocí rest. enzymů McrA a McrBC ¨pro štěpení je nutná vzdálenost těchto míst z 40-2000 bp Metylační filtrování §příprava genově obohacených knihoven pomocí technologie metylačního filtrování §schéma postupu při přípravě BAC genomových knihoven pomocí metylačního filtrování: ¨ příprava genomové DNA bez příměsí organelární DNA (chloroplasty a mitochondrie) ¨ fragmentace DNA (1-4 kbp) a ligace adaptorů ¨ příprava BAC knihovny v mcrBC+ kmeni E. coli ¨ selekce pozitivních klonů §omezené využití: obohacení o kódující DNA o pouze cca 5-10 % Metylační filtrování §Identifikace genů ab initio §příprava genově obohacených knihoven pomocí technologie metylačního filtrování §Experimentální identifikace genů §genomová kolinearita a genová homologie §EST knihovny §struktura genů a jejich vyhledávání §Postupy „přímé“ a reverzní genetiky §rozdíly v myšlenkových přístupech k identifikaci genů a jejich funkcí Osnova Základy genomiky II, Identifikace genů §příprava EST knihoven §izolace mRNA §RT PCR §ligace linkerů a syntéza druhého řetězce cDNA §klonování do vhodného bakteriálního vektoru §transformace do bakterií a izolace DNA (amplifikace DNA) §sekvenace s použitím primerů specifických pro použitý plasmid §uložení výsledků sekvenace do veřejné databáze TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT TTTTTTTTTT AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA AAAAAAAAAA Adobe Systems AAAAAAAAAA TTTTTTTTTTT Adobe Systems cctacgattatacccccaa ggatgctaatatgggggttatacaagtgtt AAAAAAAAAA EST knihovny §Identifikace genů ab initio §příprava genově obohacených knihoven pomocí technologie metylačního filtrování §EST knihovny §přímá a reverzní genetika §Experimentální identifikace genů §genomová kolinearita a genová homologie §struktura genů a jejich vyhledávání §Postupy „přímé“ a reverzní genetiky §rozdíly v myšlenkových přístupech k identifikaci genů a jejich funkcí Osnova §Změna fenotypu po mutagenezi §Genetika přímá § §Identifikace inzerčního mutanta a analýza jeho fenotypu §Genetika reverzní § §Analýza exprese daného genu a jeho časoprostorové specifity § §Principy experimentální identifikace genů prostřednictvím přímé a reverzní genetiky Přímá a reverzní genetika §Změna fenotypu po mutagenezi §Genetika přímá §Principy experimentální identifikace genů prostřednictvím přímé a reverzní genetiky Přímá a reverzní genetika - shrnutí FGP_logo LMFR_con Hormonal regulations of plant development Cloning of CKI1 ¨CKI1 was identified via activation mutagenesis in Arabidopsis §Overexpresion of CKI1 leads to CK-like response in the hypocotyl explants §CKI1 encodes a protein with similarity to bacterial histidine klinases Kakimoto, Science (1996) NO hormones t-zeatin ctrl1 ctrl2 plasmid rescue Pro35S::CK1 CKI1_scheme_01.tif FGP_logo LMFR_con Hormonal regulations of plant development Signal Transduction via MSP NUCLEUS Adobe Systems PM AHK sensor histidine kinases • AHK2 • AHK3 • CRE1/AHK4/WOL REGULATION OF TRANSCRIPTION INTERACTION WITH EFFECTOR PROTEINS HPt Proteins • AHP1-6 Response Regulators • ARR1-24 Recent Model of the CK Signaling via Multistep Phosphorelay (MSP) Pathway FGP_logo LMFR_con Hormonal regulations of plant development §Změna fenotypu po mutagenezi §Genetika přímá § §Identifikace inzerčního mutanta a analýza jeho fenotypu §Genetika reverzní §Principy experimentální identifikace genů prostřednictvím přímé a reverzní genetiky Přímá a reverzní genetika FGP_logo LMFR_con Hormonal regulations of plant development foot_prints Identification of insertional cki1 mutant allele FGP_logo LMFR_con Hormonal regulations of plant development CKI1 Regulates Female Gametophyte Development ¨CKI1 is necessary for proper megagametogenesis in Arabidopsis CKI1/CKI1 CKI1/cki1-i Hejátko et al., Mol Genet Genomics (2003) FGP_logo LMFR_con Hormonal regulations of plant development BCgelA A. ♂ wt x ♀ CKI1/cki1-i B. ♂ CKI1/cki1-i x ♀ wt C. ♂ wt x ♀ CKI1/cki1-i D. ♂ CKI1/cki1-i x ♀ wt CKI1 specific primers (PCR positive control) cki1-i specific primers CKI1 and megagametogenesis ¨cki1-i is not transmitted through the female gametophyte FGP_logo LMFR_con Hormonal regulations of plant development FG 0 FG 1 FG 2 FG 3 FG 4 CKI1 and megagametogenesis c:\chap10\10_10.jpg FGP_logo LMFR_con Hormonal regulations of plant development cki1-i CKI1 mut3 mut4 late FG5 FG6 FG7 24 HAE 48 HAE CKI1 and megagametogenesis Hejátko et al., Mol Genet Genomics (2003) FGP_logo LMFR_con Hormonal regulations of plant development §Změna fenotypu po mutagenezi §Genetika přímá § §Identifikace inzerčního mutanta a analýza jeho fenotypu §Genetika reverzní § §Analýza exprese daného genu a jeho časoprostorové specifity § §Principy experimentální identifikace genů prostřednictvím přímé a reverzní genetiky Přímá a reverzní genetika FGP_logo LMFR_con Hormonal regulations of plant development CKI1 is Expressed Throughout Megagametogenesis Hejátko et al., Mol Genet Genomics (2003) FGP_logo LMFR_con Hormonal regulations of plant development 12 HAP (hours after pollination) 24 HAP 48 HAP 72 HAP ♀ wt x ♂ ProCKI1:GUS Paternal CKI1 is Expressed in the Arabidopsis Sporophyte Early after Fertilization 24 HAP Hejátko et al., Mol Genet Genomics (2003) FGP_logo LMFR_con Hormonal regulations of plant development §Změna fenotypu po mutagenezi §Genetika přímá § §Identifikace inzerčního mutanta a analýza jeho fenotypu §Genetika reverzní § §Analýza exprese daného genu a jeho časoprostorové specifity § §Principy experimentální identifikace genů prostřednictvím přímé a reverzní genetiky Přímá a reverzní genetika - shrnutí §Identifikace genů ab initio §příprava genově obohacených knihoven pomocí technologie metylačního filtrování §EST knihovny §přímá a reverzní genetika §Experimentální identifikace genů §genomová kolinearita a genová homologie §struktura genů a jejich vyhledávání §Postupy „přímé“ a reverzní genetiky §rozdíly v myšlenkových přístupech k identifikaci genů a jejich funkcí Shrnutí Diskuse