MUTANTI A JEJICH VYUŽITÍ V GENOMICE Metody v genomice a proteomice (CG080) Genomika – lekce 6 jaro 2017 Mgr. Markéta Žďárská, Ph.D. Obsah Transgenní rostliny a funkční genomika Mutageneze, typy mutagenů Přístupy přímé genetiky EMS mutageneze Poziční klonování Sekvenování Přístupy reverzní genetiky Tilling Reportérové geny 2 Transgenní organismy transgen – gen (genetický mat.) přenesen přirozeně nebo gen. inženýr. technik z jednoho organismu na druhý syntetické, modifikované nebo cizorodé geny mohou být vnášeny do živočichů a rostlin „non-native“ segment DNA zachová si schopnost produkce RNA/proteinu v transgenním organismu může změnit norm. funci v genetickém kódu transgen. organismu transgenní organismy slouží ke studiu funkcí genů 3 Transgenní organismy GloFish are a type of transgenic zebrafish (Danio rerio) that have been modified through the insertion of a green fluorescent protein (gfp) gene. 4 Funkční genomika  cíl: hledání genů a určení jejich funkce v genomu  2 různé přístupy: › přímá genetika „forward genetics“  fenotyp → gen › reverzní genetika „reverse genetics“  sekvence DNA (gen) → fenotyp 5 Mutageneze mutanti – nástrojem obou přístupů různé typy mutagenů 1. chemické 2. fyzikální (záření) velký počet náhodných mutací, zasáhne všechny geny 3. biologické • moderní • inzerční mutageneze, menší počet mutací, zanechávají molekulární značku 6 klasické Chemické mutageny  způsobují bodové mutace 1. při replikaci DNA ale i v nereplikující se DNA › alkylační látky (vnáší alkylovou sk. na báze; náhodné)  yperit (hořtičný plyn; Ch. Auberbach)  ethylnitrosomočovina (ENU)  ethylová sk. ENU reaguje většinou s thyminem  Bill Russell (1951) myší kmen („T-test stock) pro testování různých mutagenů  ethylmethansulfonát (EMS)  ethylová sk. EMS reaguje s guaninem v DNA, vytvoří O-6-ethylguanin (místo G:C vznikají A:T)  Maple J. & Moller SG, 2007 - Mutagenesis in Arabidopsis › HNO2 (deaminace aminoskupin) 7 Chemické mutageny 2. pouze při replikaci › analogy bází: 5-bromuracil, 2- aminopurin  způsobují chybné párování › akridinová barviva: proflavin, akridinová oranž  způsobují adice či delece 1-více bazí → změna čtecího rámce → nefunkční genové produkty › hydroxylamin  specifická – indukuje tranzice pouze ve směru G:C → A:T 8 Fyzikální mutageny  ionizující: RTG, gama záření, radioaktivní uhlík 14C › způsobují zlomy  neionizující: UV záření 254nm je absorbováno bázemi −> pyrimidinové dimery (naruší cukr-fosfátovou kostru)  způsobují rozsáhlejší inzerce a přestavby chromozomů  mohou odstranit i více genů nebo vnést nové regulační sekvence  nevhodné pro přesnou mutagenezi 9 Biologické mutageny  inzerční mutageneze 1. T-DNA › Agrobacterium tumefaciens je schopna vnést do rostlinného genomu část své DNA › důsledky začlenění T-DNA do genomu jsou různé, dáno povahou inzertu a místem, kde se integruje › způsobuje:  inaktivaci genu  aktivace (nese promotor, zesilovač) 2. Transpozony – transponovatelné genetické elementy › pohyblivé genetické elementy, nejsou tak stabilní jako T-DNA › mohou se přemístit z místa původní inzerce −> obnovení normálního fenotypu › v místě inzerce zůstává stopa i po opuštění genomu, nevhodné pro rozsáhlou mutagenezi (Petersen et al, 2000) 10 T-DNA a transpozony  inzerční mutageneze  inzerce do: › kódující oblasti › nekódující oblasti – ovlivnění sestřihu intronů, genové exprese   výhody: › reverzibilní mutace › snadno se mapuje a region se lehce klonuje   nevýhody: › inzerce není náhodná 11 Jak obecně hledat mutaci? 1. menší mutace  nové jednonukleotidové polymorfismy (SNP) ve vytipované oblasti  změněný transkripční profil  komplementace mutace transgenozí různých  kandidárních genů ve WT formě 2. chromozomíální přestavby  přestavby rozsáhlé → in situ hybridizace na metafázních chromozomech – rozlišení 5 Mbp  přestavby menší → komparativní genomová hybridizace (CGN)  „DNA microarrays“ se sondami pokrývající různé části genomu  hybridizace s genomickou DNA – rozlišení desítky Mbp 12 The upper DNA molecule differs from the lower DNA molecule at a single base-pair location (a C/A polymorphism). Přímá „saturační“ genetika  založena na saturační mutagenezi „saturation screen“ › působení mutagenu na organismus −> analýza potomstva na určitý fenotyp › identifikace mutantů −> třídění do komplement. skupin › mapování do obecných chromozomál. lokalizací pomocí známých markerů (značek) a klonování, sekvenování  existuje mutace pro každý lokus −> možnost určit skupinu genů odpovědných za daný znak  cílem je dosažení saturačního bodu −> odhalit všechny geny odpovědné za fenotyp  mutageny (RTG, EMS, transpozony) › Příklady: › rostliny bez reakce na světlo › neschopnost bakterií růst v přítomnosti určitých cukrů,.. 13 Identifikace mutovaného genu u mutantní linie vybrané na základě fenotypového projevu  na základě genetické mapy 1. mapování - (ko)segregační analýza › nalezení přibližné pozice genu v genetické mapě, na základě genové vazby s genetickými markery (znaky, které vykazují polymorfismus = jsou rozdílné mezi rodičovskými genotypy) 2. nalezení konkrétní sekvence nesoucí mutaci › chromosom „walking“ › sekvenace, srovnání s WT sekvencí 14 = znak se známou (snadno dohledatelnou) polohou v genetické mapě, který vykazuje polymorfismus (je rozdílný mezi rodičovskými genotypy) 1. Morfologické 2. Molekulární DNA markery – detekovatelné rozdíly v sekvenci DNA se známou či určitelnou polohou v genomu dobře detekovatelné lokusy se známou pozicí na chromozomu jednonukleotidové polymorfismy (SNP) ideálně co nejvíce a rovnoměrně rozmístěny Typy genetických markerů 15 Přirozená morfologická variabilita Arabidopsis – ekotypy „accessions“ Fig. 1: Geographical distribution of Arabidopsis thaliana (green area on the world map) and overall phenotype of the rosette of a subset of accessions grown under 3 contrasted environment scenario. http://www.mpipz.mpg.de/102840/reymond 16 DNA molekulární markery (= proužek na elektroforéze či blotu)  SSLP (Simple Sequence Length Polymorphism) › délka genomu (PCR produktů) amplif. pomocí spec. primerů  RFLP (Restriction fragment length polymorfism) + Southern › délka restrikčních fragmentů úseku genomu, PCR po naštěpení genomové DNA a ligaci adaptorů  RAPD (Random amplified polymorphism detection) › délka náhodně amplif. úseků genomu (krátké primery 8-10bp  AFLP (Amplified fragment length polymorphism) › délka fragmentů genomu, PCR po naštěpení genomové DNA a ligaci adaptorů 17 Other Markers Acronym Variable Number Tandem Repeat VNTR Oligonucleotide Polymorphism OP Inverse Sequencetagged Repeats ISTR Inter-retrotransposon Amplified Polymorphism IRAP DNA molekulární markery Arabidopsis thaliana křížení dvou jeho ekotypů: Columbia a Landsberg erecta (Col X Ler) rekombinační mapa obsahovala původně 67 markerů (Lister & Dean, 1993) dnes přes 1300 markerů (Hou et al, 2010) Arabidopsis thaliana physical map with indication of the positions of the markers. 18 Poziční klonování (positional cloning, map-based cloning) izolace genu pouze na základě znalosti jeho pozice na mapě nemusí být známa funkce genu (mechanismus působení, biochemická, podstata produktu) mapování genu na základě jeho genetické vazby s molekulárním markerem a následnou izolaci tohoto genu díky známé pozici na chromozomu potřeba standardní linie, která je zkřížena s mutantní linií, aby mohla být provedena rekombinační analýza s markery cíl pozičního klonování: gen s požadovanou mutací lokalizovaný v intervalu mezi dvěma nejbližšími markery úsek dostatečně malý −> vybrat kandidátní gen, v němž je pak možné různými způsoby identifikovat mutaci obecně složité a časově náročné 19 Lukowitz et al, 2000 Poziční klonování - schéma 1. Křížení mutantní linie se standardní linii odlišného, genetického pozadí a vytvořeni segregující generace (většinou F2) −> mapovací populace 2. Přibližná lokalizace mutantního lokusu rekombinační analýzou s genetickými markery (20-30 rostlin) › „bulk segregation analysis“ a) analýza směsi DNA všech vzorků z rostlin určitého fenotypu najednou pro jednotlivé markery −> snížení množství potřebných PCR reakci (Lukowitz et al., 2000) b) stanovení vazby je multiplex PCR s použitím fluorescenčně značených primerů (všechny markery najednou u jednotlivých vzorků) (Ponce et al, 1999) 20Lukowitz et al, 2000 Poziční klonování - schéma 3. identifikace dvou markerů vzdálených od sebe <10% rekombinace a definující genetický interval obsahující mutaci (cca 100 rostlin) 4. rozšířená analýza markerů (1000 rostlin) a selekce rostlin, kde došlo k rekombinaci 5. rekombinační analýzy ke zúžení definované oblasti na interval < 1% rekombinace (250 kb) identifikace mutantního genu ve vymezené oblasti 21Lukowitz et al, 2000 Poziční klonování - aplikace 22  Arabidopsis › mapa pozičně klonovaných genů obsahující 620 mutantních genů s fenotypovým projevem (Meinke et al, 2003) › počet genů Arabidopsis izolovaných metodou pozičního klonování každým rokem narůstá → objasnění dalších funkcí genů modelové rostliny  Pšenice (Tritium aestivum)- zemědělské plodiny › molekulár.markery:  SSR (Simple Sequence Repeat)  SCAR (Sequence – Characterised Amplified Region) › izolování genů s markery komplikovanější – hexaploid › nedostatečná znalost genů kódujících zemědělsky užitečné znaky (zatím cca 20), např. plísně a rezistence k nim  Geny chorob › Huntingtonova choroba -je vzácné dědičné neurodegenerativní onemocnění mozku charakteristické nekoordinovanými trhavými pohyby těla a snížením mentálních schopností › Cystická fibróza (CF) je smrtelná lidská dědičná nemoc, která postihuje převážně dýchací a trávicí soustavu Identifikace mutantního genu nalezení konkrétní sekvence nesoucí mutaci  test na alelismus, tj. zkřížení testované mutantní linie s linií s „knock-out“ kandidátním genem a sledování, zda zůstane mutantní fenotyp  molekulární komplementace (u recesivních mutací) › transformace mutantní rostliny sekvencemi standardní DNA z vymezeného úseku a určení, která obnoví standardní fenotyp  analýza celé sekvence DNA vymezeného genetického intervalu −> hledat změny, které způsobily mutaci › SSCP(Single Stranded Conformational Polymorphism) › HMA (Heteroduplex Mobility Assay) › DGGE (Denaturing Gradient Gel Electrophoresis) › dHPLC (denaturing High Performance Liquid Chromatography) › hybridizace na čipech › pyrosekvencovani › „chromozome walking“  sekvenování 23 „Chromosome walking“ nalezení optimálně dvou markerů obklopujících mutovaný gen knihovny velkých fragmentů genomové DNA (redundantní, náhodné): YACs, BACs = yeast (bacterial) arteficial chromosome, ~ 300 (100) kbp hledání překryvů na základě hybridizace koncové sekvence Mutovaný gen X 24 Genomic DNA is shown in blue. Selected clones from a library of cloned genomic DNA fragments are shown in red. The initial probe, probe a, is specific to gene A or exon A and allows identification of clones 1 and 2. A new probe, probe b, is prepared from one end of clone 2 and used to isolate new clones 3 and 4 from the genomic library. Probe c, prepared from clone 4 is used to identify clone 5, etc. The orientation of the clones is determined by restriction mapping of the clones. Clone 6 contains the desired gene B or exon B. Sekvenování - klasické - Sanger  enzymatická metoda je založena na sekvenaci pomocí detekce ukončení prodlužujícího se vlákna DNA  sekvenaci předchází příprava DNA knihovny › DNA sestřižena na kratší úseky › naklonována do DNA vektorů › amplifikována in vivo (v bakteriálních buňkách, ze kterých jsou plazmidy nesoucí klonované fragmenty následně extrahovány)  sekvenace probíhá ve čtyřech nezávislých reakcích  vznikají fragmenty DNA o různé délce zakončené značenými dideoxynukleotidy  díky délce čtených úseků, které dosahují 700 až 800 bp stále nejpoužívanější a nejpřesnější 25 Sekvenování - klasické - Sanger 26 Pyrosekvenace – „Next-generation sequencing“ na sekvenaci syntézou komplementární DNA liší se způsobem, jak je detekováno začlenění daného nukleotidu −> nevyžaduje elfo vyvinul v roce 1996 ve Stockholmu profesor Pål Nyrén se svým studentem Mostafou Ronaghi Reakční směs: DNA polymeráza,ATP sulfuryláza, luciferáza a apyráza; substráty adenosinfosfosulfát a luciferin do směsi jsou postupně vkládány nukleotidy různých typů (dATP, dGTP, dCTP, dTTP) světelné záření −> začlenění 1 nebo více nukleotidů do vznikajícího řetězce světlo vzniká v důsledku enzymatické reakce, na jejímž začátku je uvolnění pyrofosfátu z nově začleněného nukleotidu a na jejímž konci je spotřeba vzniklého ATP luciferázou k oxidaci luciferinu před přidáním dalšího nukleotidu je původní nukleotid (již obsažený v roztoku) rozložen 27 „Next-generation sequencing“ 28 29 „Next-generation sequencing“ „Next-generation sequencing“ 30 „Next-generation sequencing“ 31 „Next-generation sequencing“ 32 „Next-generation sequencing“ 33 Mnohonásobné prosekvenování jednoho úseku DNA kompenzuje vyšší chybovost sekvenačních metod nové generace. Využití sekvenačních metod nové generace  celé genomy › resekvenování −> hledání sekvenčních variant v lidské populaci › de novo sekvenování −> nemodelové organismy  transkriptom (RNA-seq) › Identifikace dosud neznámých transkiptů › míra transkripce jednotlivých genů - přesnější než „microarrays“  cílené −> určitá část genomu, skupiny genů › náhodné oblasti genomu −> na základě délky po restrikčním štěpení genomové DNA (RAD-seq) › hybridizace k cca 100bp próbám se vyberou fragmenty DNA, kt. se sekvenují (Hyb-seq) 34 Využití sekvenačních metod nové generace 35 Velkokapacitní náhodná mutageneze a „screening“ systematická mutageneze –postupné EMS mutageneze místo hledání urč. fenotypu (přímá), kdy se hledá gen zájmu se změnami v nukleotidech běžně „screen“ 1000 nebo 10000 jedinců využití PCR genu zájmu −> hledání drobných změn v migraci PCR produktu na gelu či koloně všechny změny nevyřadí („knockout“) gen, některé se neprojeví -„silent“, na neesenciálních AMK pozicích metody běžně užívané: DHPLC –“Denaturing High Performance Liquid Chromatography“ DGGE – „Denaturing Gradient Gel Electrophoresis“ SSCP – „Single-Stranded Conformation Polymorphism“ 36 Příklad využití EMS mutageneze (Feraru et al, 2010) A fluorescence imaging-based forward genetic screen“ As a tool for the screening to identify novel components of plant intracellular trafficking, they used a well characterized plant cargo, the auxin efflux carrier PIN1 (Petrasek et al., 2006). With this strategy,they aimed to identify novel regulators at different stages of subcellular protein trafficking. EMS-mutagenized PIN1pro:PIN1-GFP (for green fluorescent protein) population using epifluorescent microscopy for seedlings displaying aberrant PIN1-GFP distribution in the root. From 1500 M1 families, they identified several protein affected trafficking (pat) mutants defining three independent loci (mapping with simple sequence length polymorphism (SSLP) and cleaved amplified polymorphic sequence (CAPS and dCAPS) markers The At3G55480 candidate gene was sequenced and a point mutation that caused a stop codon was found at the position 705 downstream of ATG) 37 Příklad využití EMS (Feraru et al, 2010) 38 Figure 1. The pat2 Mutant Displays Ectopic Intracellular Protein Accumulation. (A) to (D) Both PIN1-GFP ([A] and [B]) and aleurain-GFP ([C] and [D]) accumulate intracellularly in pat2-1 (B) or pat2-2 (D) root cells compared with control ([A] and [C]). •pat2 mutant lytic vacuoles display altered morphology and accumulation of proteins • unlike other mutants affecting the vacuole, pat2 is specifically defective in the biogenesis, identity, and function of lytic vacuoles but shows normal sorting of proteins to storage vacuoles • PAT2 encodes a putative b-subunit of adaptor protein complex 3 (AP-3) •AP-3 b functions in mediating lytic vacuole performance and transition of storage into the lytic vacuoles independently of the main prevacuolar compartment-based trafficking route Nepřímá „reverse“ genetika dnes −> post-genomická éra známe geny (sekvence) neznáme funkce genů většinou >50% predikovaných genů u eukaryot fenotypy, které způsobí mutace v těchto genech 39 TILLING (Targeting induced local lesions in genomes)  získání (nalezení) bodových mutací ve vybraném genu  bodové mutace › potenciální změny regulace, interakce, …  představena na Arabidopsis thaliana (McCallum et al, 2000)  Princip › náhodná indukce bodových mutací (EMS) › následné hledání linií s mutací v cílovém genu pomocí PCR a heteroduplexní analýzy (McCallum et al, 2000) 40 TILLING – detekce mutací, strategie amplifikace cílového fragmentu (koncově značené primery) reasociace s wt DNA štěpení heteroduplexu (ss nuclease-CEL I) elektroforéza (separace podle velikosti na různých platformách; LI-COR ) vizualizace koncově značených fragmentů Metoda pracuje s amplifikovanými fragmenty o velikosti kolem 1 kb a mutaci je schopna analyzovat s přesností na 10 bp (Henikoff et al, 2004). 41 ATP http://tilling.fhcrc.org TILLING: A five step process 1. You decide whether your gene is worth TILLING. ”I have an insertion in my gene but the knockout phenotype is lethal.” ....TILLING can provide the sub-lethal phenotypes you want. “The knockout phenotype is interesting.”.....TILLING can provide an allelic series that may help you better ascertain the function of your gene. “I have an insertion in my gene that knocks out gene function but my plants have no phenotype.”.....TILLING is not for you. In this scenario, a gain-of-function mutation is needed to investigate the potential in vivo role of this gene.The large majority of phenotypes arising from our populations will cause full or partial loss of function. ”I have a candidate gene and I want to know the knockout phenotype.”....There are very good reasons why you should start by insertional mutagenesis rather than by TILLING. First, only a small percentage of EMS-induced mutations will yield a change likely to truncate the protein (~5%). Second, the Arabidopsis community has access to excellent insertional mutagenesis resources. Third, if a knockout mutation causes no phenotype, then the TILLING allelic series is not expected to either. 42 ATP http://tilling.fhcrc.org/ TILLING: A five step process 2. You find the best the region to be targeted and place your order. 3. ATP screens the region for mutations. 4. ATP sequences the mutation and enters it in our public database. 5. ATP sends you a mutant report and you order seed. 43 44 TILLING centres Several TILLING centers exists over the world that focus on agriculturally important species: Rice – UC Davis (USA) Maize – Purdue University (USA) Brassica napus – University of British Columbia (CA) Brassica rapa – John Innes Centre (UK) Arabidopsis – Fred Hutchinson Cancer Research Soybean – Southern Illinois University (USA) Lotus and Medicago – John Innes Centre (UK) Wheat – UC Davis (USA) Pea, Tomato - INRA (France) Tomato - University of Hyderabad (India) 45 Rostliny s inzercí v určitém genu veřejně dostupné kolekce mutantů na různých místech genomu inzerce ve většině genů Arabidopsis thaliana výběr in silico, objednání semen rostlin s inzercí v určitém genu Gen1 Gen2 Gen3 = místa inzerce T-DNA v jednotlivých mutantních liniích 1 2 3 4 5 6 7 8 číslo linie 46 Reportérové geny gen připojený k regulač. sekvenci genu zájmu (bakterie, rostliny, živoč., buněč. kultury) reportéry – k detekci exprese genu v organismu, nemohou se přirozeně vyskytovat ve studovaném org. fluorescentní (GFP) β-galactosidaza (GUS) 47 TCS::GFP 48(Zurcher et al, 2013) GUS systém 49 (Mason et al, 2004) Děkuji za pozornost  Central European Institute of Technology c/o Masaryk University Žerotínovo nám. 9 601 77 Brno, Czech Republic www.ceitec.eu | info@ceitec.cz This work was supported by the Program of „Employment of Newly Graduated Doctors of Science for Scientific Excellence“ (grant number CZ.1.07/2.3.00/30.0009) co-financed from European Social Fund and the state budget of the Czech Republic.