Genotypizace – stanovení genotypu •stanovení formy (alely, haplotypu) určitého úseku DNA („genetického markeru) • 1)izolace celkové DNA z tkání 2)amplifikace požadovaného úseku DNA (PCR-based methods) 3)studium variability daného úseku (lokus = marker = znak) 4) Typy genetických markerů Př.: chromozóm 1 „single-locus“ „multi-locus“ Typy genetických markerů •dominantní markery – odliší pouze přítomnost (či nepřítomnost) daného znaku; tj. neodliší obě jeho formy na homologních chromozómech • •kodominantní markery – identifikace homologních alel, tj. je možno rozlišit homozygotní a heterozygotní stav (umožňují stanovit frekvenci alel) Typy genetických markerů Single locus Codominant PCR Celková variabilita Jaderné více-lokusové („nuclear multi-locus“) Minisatelitový DNA fingerprints No No No High RAPD No No Yes High AFLP No No Yes High Jaderné jedno-lokusové („nuclear single locus“) Alozymy Yes Yes No Low-medium Mikrosatelity Yes Yes Yes High SINE (LINE) Yes Yes Yes Low SNPs (sekvence) Yes Yes Yes Low-high Single-locus genetic markers •kodominantní – možno stanovovat frekvence alel (= lze odlišit homo- a heterozygota) • •allozymy a jiné funkční geny - MM • •mikrosatelity – délkový polymorfismus • •SNPs (single nucleotide polymorphisms) – sekvenční polymorfismus • •SINE, LINE – inzerce (tj. délkový polymorfismus) Mikrosatelity http://seq.mc.vanderbilt.edu/DNA/images/mma.jpg Mikrosatelity byly (a pro něco stále budou) velmi užitečné markery v molekulární ekologii (i když genotypizační metody se budou měnit) Mikrosatelity •VNTR („variable number of tandem repetitions“), SSR („simple sequence repeats“) •jednotlivé alely se liší délkou • TTCAGGCACACACATCTCTAGCTTTGA 27 bp TTCAGGCACACATCTCTAGCTTTGA 25 bp genotyp diploidního jedince: 25/27 Mikrosatelity •1-6 (nejč. 2-4) bp motiv •početné po celém genomu •vysoká úroveň polymorfismu (běžně 15 alel v populaci) •Mendelovská dědičnost (autosomy) - kodominance •ideální pro studium populační struktury a příbuzenských vztahů Mikrosatelity - postup analýzy • •Izolace DNA • •PCR • •Detekce → gelová elektroforéza • → sekvenátor (fragmentační analýza) CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTC CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT tools_1a lox8uka Př. 5 různých alel se liší délkou gelloadingphoto lox8uka pcr pahylkresleny CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTT GAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAA primer primer GAAAGAAAGAAAGAAA primer primer elektroforéza: agaróza (20 bp) → PAGE (4 bp) → kapilára (1 bp) Př.: lokus č. 1 Kapilární eletroforéza ~ Fragmentační analýza (denaturující polymer POP7 – ssDNA, jeden značený primer) Well controlled electrophoresis parameters, high sensitivity CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTT GAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAA primer primer GAAAGAAAGAAAGAAA primer primer Msat paternita - Sekerak + - 125 bp 131 bp HEX HEX krátké -------------- dlouhé (rychlé) ------------ (pomalé) ROX – Size standard NED – studovaný znak 300 bp 350 bp 340 bp 326.66 bp 342.61 bp Genotyp mikrosatelitu na lokusu NED = 326/342 nebo 327/343 Programy: GeneMapper, Genotyper, Geneious, GeneMarker, ... Čas 298 304 302 294 296 „stutters“ – chyby v důsledku „sklouznutí“ polymerázy při PCR - často odlišují mikrosatelity od nespecifických PCR produktů - rozdíl mezi alelou a „stutter“ je délka repetice (zde 2 bp) Genotyp 298/304 CTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCT - alely a jejich stuttery jsou černě (rozdíl mezi nimi je 2 bp) - bílé píky jsou tzv. „mínus A-alely“ a jejich stuttery = výsledek jiné chyby polymerázy, a to nepřidání koncového adeninu - rozdíl mezi černým a sousedním bílým píkem je 1 bp (tj. chybějící adenin) - pattern daného lokusu je vždy specifický a často záleží na PCR podmínkách 162 174 173 171 169 161 159 157 172 170 160 158 Genotyp 162/174 Srovnání různých jedinců – analýzy příbuznosti Msat paternita - Sekerak Elektroforetogramy čtyř různých heterozygotů 3 bp repetice PCR produkty 125-134 bp + - Ind. 1 Ind. 2 Ind. 3 Ind. 4 směr elektroforézy 125/131 131/134 125/134 131/137 Př. Analýza příbuzenských vztahů Msat paternita - barvy Genotyp (bp) Matka: 125/131 Otec: 131/134 Potomek 1: 125/134 Potomek 2: 131/137 Sledovaný otec mohl zplodit potomka 1, ale zcela jistě není otcem potomka 2 + - ? Různé značení různých znaků • •Snížení časových a finančních nákladů •= „multiplex set“ •Až 4 různé barvy (+ 5. barva jako velikostní standard) – analýza až 4 lokusů o stejné velikosti alel • 3LOKCELE Lokus 1 Lokus 3 Lokus 2 Identifikace jedinců u lidí https://tools.lifetechnologies.com/content/sfs/prodImages/high/4473287_and_4473289_FINAL650x600.jpg http://www.cstl.nist.gov/strbase/kits/Identifiler.JPG http://www.bodetech.com/wp-content/uploads/2011/01/analyze-the-samples.png 16 lokusů = spolehlivá identifikace jedinců (v euro-americké populaci) Mikrosatelity - omezení •nalezení lokusů (navržení primerů) je pracné a nákladné u volně žijících druhů (genomová knihovna, klonování, screening, sekvencování) TTCAGGCACACACATCTCTAGCTTCGA Př.: chromozóm 1 „flanking regions“ – ohraničují repetici a zde musí být navrženy primery pro PCR Štěpení, obohacení, klonování, screening a sekvenování Genomická DNA po rozštěpení a obohacení na repetice sekvenování inzertů (repetitivní DNA + flanking regions design primerů a testování polymorfismu izolace vektorů s inzertem screening klonů obsahujících repetice (hybridizace se sondou) Každý klon obsahuje jednu sekvenci vector = plasmid Obohacená genomická knihovna ligace do plasmidu, transformace Alternativa: cross-species amplification n„cross-amplification“ – úspěšnost klesá s fylogenetickou vzdáleností n nnulové alely (mutace v primerových sekvencích) → vyšší proporce „homozygotů“ TTCAGGCACACACATCTCTAGCTTCGA TTCAGGCACACATCTCTAGCTTTGA x PCR OK no PCR Nulové alely a genotypizační chyby komplikují analýzy příbuznosti • lokus 1 lokus 2 • null alleles genotyping error • •Matka 100 150 300 350 • •Samec 1 100 100 300 367 • •Mládě 150 150 350 365 • • • • • • Samec 1 je vždy opravdovým otcem, ale jednoduchá „exclusion“ metoda ho vždy vyloučí Optimalizace mikrosatelitů v současnosti = NGS n„next-generation sequencing“ (= HTS, „high-throughput sequencing“) – velice rychlá sekvenace velkého množství DNA fragmentů z jakéhokoliv genomu n nvyhledání repetitivních sekvencí vhodným softwarem a navržení primerů n nidentifikace nových mikrosatelitů v genomu rychle, elegantně a relativně levně Další firmy: GenoScreen Ecogenics StarSeq Využití mikrosatelitů •identifikace jedinců a analýzy příbuznosti (zejména rodičovství) •populační genetika (conservation genetics, landscape genetics, etc.) •fylogeografie a analýzy historické demografie (omezeně – nutno znát mutační model) •fylogenetika, tj. vzdálenější příbuzní – téměř vůbec, vysoké riziko homoplázií Teoretické mutační modely (nutno definovat pro analýzy vyžadující údaj o podobnosti alel, např. při analýzách historické demografie) •IAM – infinitive allele model Při mutaci ztráta nebo získání libovolného počtu opakování. Vzniká nová alela, která doposud v populaci nebyla - každá alela vznikne pouze jednou a pak už se nemění. Není možno určit podobnost (similarity) alel, ale pouze identitu. • • •SMM – stepwise mutation model (Mutace způsobeny pouze ztrátou nebo získáním jediného opakování motivu. Mutací může vzniknout alela, která je již v populaci přítomna – tzv. homoplázie. Je možno odhadnout podobnost (similarity) alel. CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTT CTTTCTTT CTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTTCTTTCTTT Pravda bude někde mezi ... = Two-phase model (TPM) Indels •inzerce nebo delece 1bp či delších úseků – použití pouze pro populačně-genetické analýzy vyžadující „identity“ (nepoužitelné pro modely vyžadující „similarity“) TTCAGGCACACACATCTCTAGCTTCGA TTCAGGCACACACACATCTCTAGCTTCGA SMM model – možno kvantifikovat podobnost („similarity) alel 27 bp 27 → 29 bp TTCAGGCACACACATCTCGTAGCTTCGA TTCAGGCACACGACATCTCTAGCTTCGA TTCAGGCACACCATCTCTAGCTTCGA TTCAGGCACACACATCTCTAGTTCGA 27 → 28 bp 27 → 28 bp 27 → 26 bp 27 → 26 bp „Indels“ – pouze pro analýzy, kde je vyžadována „identity“ a nikoliv podobnost Další nepravidelnosti (tj. možné komplikace při analýzách) MS Development „složený mikrosatelit“ – rovněž není možné aplikovat jednoduchý mutační model Proč je tolik alel? (microsatellite instability) •Nerovnoměrný (Unequal) crossing-over (díky špatnému alignmentu) • •Sklouznutí polymerázy při replikaci Slip-strand mispairing (při replikaci nejprve polymeráza sklouzne a vyrobí odlišný počet opakujícího se motivu mikrosatelitu, při alignmentu je pak část opakování vykloněna mimo dvoušroubovici, flanking regions tedy párují) http://www.nature.com/scitable/content/33289/10.1038_nrmicro734-f1_large_2.jpg Bias (skutečná data) •Kratší mikrosatelity (s malým počtem opakování motivu) mají zřejmě tendenci se spíše prodlužovat (slabě převládají adice nad delecemi) • •Delší mikrosatelity se spíše zkracují (náchylnější k velkým delecím) • •Delší mikrosatelity rychleji mutují (díky více opakováním je vyšší pravděpodobnost pro sklouznutí polymerázy (SSM) – mají více alel) Mikrosatelity - závěry •Homoplasie – nevhodné pro fylogenetické analýzy • •Stepwise mutation model (SMM) platí jen omezeně – obtížně aplikovatelné v analýzách evoluční historie (pokud se uplatňují mutace) • •Potřeba neustálé standardizace při genotypizacích - i v populační genetice jsou rychle nahrazovány jinými markery, např. SNPs • •Tolik to nevadí při identifikaci jedinců a pro analýzy příbuznosti (paternity), kde je možno zanedbat mutace – zde se budou používat ještě hodně dlouho SINE, LINE, etc. (Shedlock et al. 2004, TREE; Ray et al. 2007, MolEcol) •Transposable elements • •Vytváří kopie (většinou) • •Kopie integrovány na nová místa v genomu • •Obvykle nejsou specificky odstraňovány • •Molekulární fosílie – neexistují homoplasie !!! • •Nesmírně početné • •Člověk – víc jak polovina genomu (ost. druhy – 40-90%) • Objev DNA transpozonů u kukuřice: Barbara McClintock Barbara McClintock, 1947 Barbara McClintock Typy transposabilních elementů •Kódující své proteiny, autonomní, 1-10 kb –DNA transposony (cut-and-paste) –transposasa –Retrotransposony (copy-and-paste) –LINE 1-2 proteiny, kopie přes RNA –LTR retrotransposony 5-6 proteinů, také přes RNA – •Nekódují proteiny, neautonomní, 100-1000 bp paraziti předešlých, např. SINE (člověk Alu – více než 1 milion kopií) – nejčastěji používané v populačních a fylogenetických studiích • • LINE – mechanismus transpozice •Kopie přes RNA • •Reversní transkriptáza • •Mašinerii využívají SINE (jsou to „paraziti“), Alu (SINE) a L1 (LINE) se stejně rychle množí DNA RNA Zpět na DNA Nové místo v genomu • LTR retrotransposony – opět přes RNA, složitější proces Velmi nízké riziko homoplázií → SINE = vhodné fylogenetické markery (spíše historicky, před rozvojem levného sekvenování) „single-locus marker“ - PCR amplifikace daného úseku a elektroforéza SINE prezence/absence SINE (nikoliv póly elektroforézy) Neexistují zpětné mutace = výhoda oproti sekvenačním datům Příklad aplikace: kytovci vs. sudokopytníci (hroch je bratr velryby) http://www.talkorigins.org/faqs/molgen/fig4.gif http://www.izun.eu/sites/default/files/uvodniky/10-2012/hroch2.jpg http://upload.wikimedia.org/wikipedia/commons/a/ae/Physeter_macrocephalus1.jpg http://www.biolib.cz/IMG/GAL/44616.jpg