Genotypizace – stanovení genotypu •stanovení formy (alely, haplotypu) určitého úseku DNA („genetického markeru) • 1)izolace celkové DNA z tkání 2)amplifikace požadovaného úseku DNA (PCR-based methods) 3)studium variability daného úseku (lokus = marker = znak) 4) Typy genetických markerů Př.: chromozóm 1 „single-locus“ „multi-locus“ Typy genetických markerů •dominantní markery – odliší pouze přítomnost (či nepřítomnost) daného znaku; tj. neodliší obě jeho formy na homologních chromozómech • •kodominantní markery – identifikace homologních alel, tj. je možno rozlišit homozygotní a heterozygotní stav (umožňují stanovit frekvenci alel) Typy genetických markerů Single locus Codominant PCR assay Overall variability Nuclear multilocus Minisatellite DNA fingerprints No No No High RAPD No No Yes High AFLP No No Yes High Nuclear single locus Alozymy Yes Yes No Low-medium Mikrosatelity Yes Yes Yes High SINE (LINE) Yes Yes Yes Low SNPs (sekvence) Yes Yes Yes Low-high Single-locus genetic markers •kodominantní – možno stanovovat frekvence alel (= lze odlišit homo- a heterozygota) • •allozymy a jiné funkční geny - MM • •mikrosatelity – délkový polymorfismus • •SNPs (single nucleotide polymorphisms) – sekvenční polymorfismus • •SINE, LINE – inzerce (tj. délkový polymorfismus) Mikrosatelity http://seq.mc.vanderbilt.edu/DNA/images/mma.jpg Mikrosatelity byly (a pro něco stále budou) velmi užitečné markery v molekulární ekologii (i když genotypizační metody se budou měnit) Mikrosatelity •VNTR („variable number of tandem repetitions“), SSR („simple sequence repeats“) •jednotlivé alely se liší délkou • TTCAGGCACACACATCTCTAGCTTCGA 27 bp TTCAGGCACACATCTCTAGCTTTGA 25 bp genotyp diploidního jedince: 25/27 Mikrosatelity •1-6 (nejč. 2-4) bp motiv •početné po celém genomu •vysoká úroveň polymorfismu (běžně 15 alel v populaci) •Mendelovská dědičnost (autosomy) - kodominance •ideální pro studium populační struktury a příbuzenských vztahů Mikrosatelity - postup analýzy • •Izolace DNA • •PCR • •Detekce → gelová elektroforéza • → sekvenátor (fragmentační analýza) CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTC CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT tools_1a lox8uka Př. 5 různých alel se liší délkou gelloadingphoto lox8uka pcr pahylkresleny CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTT GAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAA primer primer GAAAGAAAGAAAGAAA primer primer elektroforéza: agaróza (20 bp) → PAGE (4 bp) → kapilára (1 bp) Př.: lokus č. 1 Kapilární eletroforéza ~ Fragmentační analýza (denaturující polymer POP7 – ssDNA, jeden značený primer) Well controlled electrophoresis parameters, high sensitivity CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTT GAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAA primer primer GAAAGAAAGAAAGAAA primer primer Msat paternita - Sekerak + - 125 bp 131 bp HEX HEX krátké -------------- dlouhé (rychlé) ------------ (pomalé) ROX – Size standard NED – studovaný znak 300 bp 350 bp 340 bp 326.66 bp 342.61 bp Genotyp mikrosatelitu na lokusu NED = 326/342 nebo 327/343 Programy: GeneMapper, Genotyper, Geneious, GeneMarker, ... Čas 298 304 302 294 296 „stutters“ – chyby v důsledku „sklouznutí“ polymerázy při PCR - často odlišují mikrosatelity od nespecifických PCR produktů - rozdíl mezi alelou a „stutter“ je délka repetice (zde 2 bp) Genotyp 298/304 CTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCT - alely a jejich stuttery jsou černě (rozdíl mezi nimi je 2 bp) - bílé píky jsou tzv. „mínus A-alely“ a jejich stuttery = výsledek jiné chyby polymerázy, a to nepřidání koncového adeninu - rozdíl mezi černým a sousedním bílým píkem je 1 bp (tj. chybějící adenin) - pattern daného lokusu je vždy specifický a často záleží na PCR podmínkách 162 174 173 171 169 161 159 157 172 170 160 158 Genotyp 162/174 Srovnání různých jedinců – analýzy příbuznosti Msat paternita - Sekerak Elektroforetogramy čtyř různých heterozygotů 3 bp repetice PCR produkty 125-134 bp + - Ind. 1 Ind. 2 Ind. 3 Ind. 4 směr elektroforézy 125/131 131/134 125/134 131/137 Př. Analýza příbuzenských vztahů Msat paternita - barvy Genotyp (bp) Matka: 125/131 Otec: 131/134 Potomek 1: 125/134 Potomek 2: 131/137 Sledovaný otec mohl zplodit potomka 1, ale zcela jistě není otcem potomka 2 + - ? Různé značení různých znaků • •Snížení časových a finančních nákladů •= „multiplex set“ •Až 4 různé barvy (+ 5. barva jako velikostní standard) – analýza až 4 lokusů o stejné velikosti alel • 3LOKCELE Lokus 1 Lokus 3 Lokus 2 Mikrosatelity - omezení •nalezení lokusů (navržení primerů) je pracné a nákladné u volně žijících druhů (genomová knihovna, klonování, screening, sekvencování) TTCAGGCACACACATCTCTAGCTTCGA Př.: chromozóm 1 „flanking regions“ – ohraničují repetici a zde musí být navrženy primery pro PCR Štěpení, obohacení, klonování, screening a sekvenování Genomická DNA po rozštěpení a obohacení na repetice sekvenování inzertů (repetitivní DNA + flanking regions design primerů a testování polymorfismu izolace vektorů s inzertem screening klonů obsahujících repetice (hybridizace se sondou) Každý klon obsahuje jednu sekvenci vector = plasmid Obohacená genomická knihovna ligace do plasmidu, transformace Alternativa: cross-species amplification n„cross-amplification“ – úspěšnost klesá s fylogenetickou vzdáleností n nnulové alely (mutace v primerových sekvencích) → vyšší proporce „homozygotů“ TTCAGGCACACACATCTCTAGCTTCGA TTCAGGCACACATCTCTAGCTTTGA x PCR OK no PCR Nulové alely a genotypizační chyby komplikují analýzy příbuznosti • lokus 1 lokus 2 • null alleles genotyping error • •Matka 100 150 300 350 • •Samec 1 100 100 300 367 • •Mládě 150 150 350 365 • • • • • • Samec 1 je vždy opravdovým otcem, ale jednoduchá „exclusion“ metoda ho vždy vyloučí Optimalizace mikrosatelitů v současnosti = NGS n„next-generation sequencing“ – velice rychlá sekvenace stovek tisíců fragmentů z jakéhokoliv genomu n nvyhledání repetitivních sekvencí vhodným softwarem a navržení primerů n nidentifikace nových mikrosatelitů rychle, elegantně a relativně levně (1500 EUR ?) • http://www.biotechniques.com/multimedia/archive/00042/BTN_A_000113084_O_F0_42481b.jpg Abedlkrim et al. 2009 Využití mikrosatelitů •identifikace jedinců a analýzy příbuznosti (zejména rodičovství) •populační genetika (conservation genetics, landscape genetics, etc.) •fylogeografie a analýzy historické demografie (omezeně – nutno znát mutační model) •fylogenetika, tj. vzdálenější příbuzní – téměř vůbec, vysoké riziko homoplázií Teoretické mutační modely (nutno definovat pro analýzy vyžadující údaj o podobnosti alel, např. při analýzách historické demografie) •IAM – infinitive allele model Při mutaci ztráta nebo získání libovolného počtu opakování. Vzniká nová alela, která doposud v populaci nebyla - každá alela vznikne pouze jednou a pak už se nemění. Není možno určit podobnost (similarity) alel, ale pouze identitu. • • •SMM – stepwise mutation model (Mutace způsobeny pouze ztrátou nebo získáním jediného opakování motivu. Mutací může vzniknout alela, která je již v populaci přítomna – tzv. homoplázie. Je možno odhadnout podobnost (similarity) alel. CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTT CTTTCTTT CTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTCTTTCTTT Pravda bude někde mezi ... = Two-phase model (TPM) Indels •inzerce nebo delece 1bp či delších úseků – použití pouze pro populačně-genetické analýzy vyžadující „identity“ (nepoužitelné pro modely vyžadující „similarity“) TTCAGGCACACACATCTCTAGCTTCGA TTCAGGCACACACACATCTCTAGCTTCGA SMM model – možno kvantifikovat podobnost („similarity) alel 27 bp 27 → 29 bp TTCAGGCACACACATCTCGTAGCTTCGA TTCAGGCACACGACATCTCTAGCTTCGA TTCAGGCACACCATCTCTAGCTTCGA TTCAGGCACACACATCTCTAGTTCGA 27 → 28 bp 27 → 28 bp 27 → 26 bp 27 → 26 bp „Indels“ – pouze pro analýzy, kde je vyžadována „identity“ a nikoliv podobnost Další nepravidelnosti (tj. možné komplikace při analýzách) MS Development „složený mikrosatelit“ – rovněž není možné aplikovat jednoduchý mutační model Proč je tolik alel? (microsatellite instability) •Nerovnoměrný (Unequal) crossing-over (díky špatnému alignmentu) • •Sklouznutí polymerázy při replikaci Slip-strand mispairing (při replikaci nejprve polymeráza sklouzne a vyrobí odlišný počet opakujícího se motivu mikrosatelitu, při alignmentu je pak část opakování vykloněna mimo dvoušroubovici, flanking regions tedy párují) http://www.nature.com/scitable/content/33289/10.1038_nrmicro734-f1_large_2.jpg Bias (skutečná data) •Kratší mikrosatelity (s malým počtem opakování motivu) mají zřejmě tendenci se spíše prodlužovat (slabě převládají adice nad delecemi) • •Delší mikrosatelity se spíše zkracují (náchylnější k velkým delecím) • •Delší mikrosatelity rychleji mutují (díky více opakováním je vyšší pravděpodobnost pro sklouznutí polymerázy (SSM) – mají více alel) Mikrosatelity - závěry •Homoplasie – nevhodné pro fylogenetické analýzy • •Stepwise mutation model (SMM) platí jen omezeně – obtížně aplikovatelné v analýzách evoluční historie (pokud se uplatňují mutace) • •= nevýhoda v populační genetice (jsou rychle nahrazovány jinými markery, např. SNPs) • •= tolik nevadí při identifikaci jedinců a pro analýzy příbuznosti (paternity) – zde se budou používat ještě hodně dlouho SINE, LINE, etc. (Shedlock et al. 2004, TREE; Ray et al. 2007, MolEcol) •Transposable elements • •Vytváří kopie (většinou) • •Kopie integrovány na nová místa v genomu • •Obvykle nejsou specificky odstraňovány • •Molekulární fosílie – neexistují homoplasie !!! • •Nesmírně početné • •Člověk – víc jak polovina genomu (ost. druhy – 40-90%) • Objev DNA transpozonů u kukuřice: Barbara McClintock Barbara McClintock, 1947 Barbara McClintock Typy transposabilních elementů •Kódující své proteiny, autonomní, 1-10 kb –DNA transposony (cut-and-paste) –transposasa –Retrotransposony (copy-and-paste) –LINE 1-2 proteiny, kopie přes RNA –LTR retrotransposony 5-6 proteinů, také přes RNA – •Nekódují proteiny, neautonomní, 100-1000 bp paraziti předešlých, např. SINE (člověk Alu – více než 1 milion kopií) – nejčastěji používané v populačních a fylogenetických studiích • • LINE – mechanismus transpozice •Kopie přes RNA • •Reversní transkriptáza • •Mašinerii využívají SINE (jsou to „paraziti“), Alu (SINE) a L1 (LINE) se stejně rychle množí DNA RNA Zpět na DNA Nové místo v genomu • LTR retrotransposony – opět přes RNA, složitější proces Velmi nízké riziko homoplázií → SINE = vhodné fylogenetické markery (spíše historicky, před rozvojem sekvenování) „single-locus marker“ - PCR amplifikace daného úseku a elektroforéza SINE prezence/absence SINE (nikoliv póly elektroforézy) Neexistují zpětné mutace = výhoda oproti sekvenačním datům Příklad aplikace: kytovci vs. sudokopytníci (hroch je bratr velryby) http://www.talkorigins.org/faqs/molgen/fig4.gif http://www.izun.eu/sites/default/files/uvodniky/10-2012/hroch2.jpg http://upload.wikimedia.org/wikipedia/commons/a/ae/Physeter_macrocephalus1.jpg http://www.biolib.cz/IMG/GAL/44616.jpg