Genotypizace – stanovení genotypu •stanovení formy (alely, haplotypu) určitého úseku DNA („genetického markeru) • 1)izolace celkové DNA z tkání 2)amplifikace požadovaného úseku DNA (PCR-based methods) 3)studium variability daného úseku (lokus = marker = znak) 4) Typy genetických markerů • • • • • • • •Př.: chromozóm 1 •„single-locus“ •„multi-locus“ Typy genetických markerů •dominantní markery – odliší pouze přítomnost (či nepřítomnost) daného znaku; tj. neodliší obě jeho formy na homologních chromozómech • •kodominantní markery – identifikace homologních alel, tj. je možno rozlišit homozygotní a heterozygotní stav (umožňují stanovit frekvenci alel) Typy genetických markerů Single locus Codominant PCR assay Overall variability Nuclear multilocus Minisatellite DNA fingerprints No No No High RAPD No No Yes High AFLP No No Yes High Nuclear single locus Alozymy Yes Yes No Low-medium Mikrosatelity Yes Yes Yes High SINE (LINE) Yes Yes Yes Low SNPs (sekvence) Yes Yes Yes Low-high Single-locus genetic markers •kodominantní – možno stanovovat frekvence alel (= lze odlišit homo- a heterozygota) • •allozymy a jiné funkční geny - MM • •mikrosatelity – délkový polymorfismus • •SNPs (single nucleotide polymorphisms) – sekvenční polymorfismus • •SINE, LINE – inzerce (tj. délkový polymorfismus) • Mikrosatelity http://seq.mc.vanderbilt.edu/DNA/images/mma.jpg •Mikrosatelity jsou a budou stále velmi užitečné markery v molekulární ekologii •(i když genotypizační metody se budou měnit) Mikrosatelity •VNTR („variable number of tandem repetitions“), SSR („simple sequence repeats“) •jednotlivé alely se liší délkou • •TTCAGGCACACACATCTCTAGCTTCGA •27 bp •TTCAGGCACACATCTCTAGCTTTGA •25 bp •genotyp diploidního jedince: 25/27 Mikrosatelity •1-6 (nejč. 2-4) bp motiv •početné po celém genomu •vysoká úroveň polymorfismu (běžně 15 alel v populaci) •Mendelovská dědičnost (autosomy) - kodominance •ideální pro studium populační struktury a příbuzenských vztahů Mikrosatelity - postup analýzy • •Izolace DNA • •PCR • •Detekce → gelová elektroforéza • → sekvenátor (fragmentační analýza) •CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT •CTTTCTTTCTTTCTTTC •CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT •CTTTCTTTCTTTCTTTCTTTCTTT •CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT tools_1a lox8uka •Př. 5 různých alel se liší délkou gelloadingphoto lox8uka pcr pahylkresleny •CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT •CTTTCTTTCTTTCTTT •GAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAA •primer •primer •GAAAGAAAGAAAGAAA •primer •primer • • •elektroforéza: •agaróza (20 bp) → PAGE (4 bp) → kapilára (1 bp) •Př.: lokus č. 1 Kapilární eletroforéza ~ Fragmentační analýza (denaturující polymer POP7 – ssDNA, jeden značený primer) •Well controlled electrophoresis parameters, high sensitivity •CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT •CTTTCTTTCTTTCTTT •GAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAA •primer •primer •GAAAGAAAGAAAGAAA •primer •primer Msat paternita - Sekerak •+ •- •125 bp •131 bp HEX HEX •krátké -------------- dlouhé •(rychlé) ------------ (pomalé) •ROX – Size standard •NED – studovaný znak •300 bp •350 bp •340 bp •326.66 bp •342.61 bp •Genotyp mikrosatelitu na lokusu NED = 326/342 nebo 327/343 •Programy: GeneMapper, Genotyper, Geneious, GeneMarker, ... •Čas •298 •304 •302 •294 •296 •„stutters“ – chyby v důsledku „sklouznutí“ polymerázy při PCR • - často odlišují mikrosatelity od nespecifických PCR produktů - rozdíl mezi alelou a „stutter“ je délka repetice (zde 2 bp) •Genotyp 298/304 •CTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCT •- alely a jejich stuttery jsou černě (rozdíl mezi nimi je 2 bp) - bílé píky jsou tzv. „mínus A-alely“ a jejich stuttery = výsledek jiné chyby polymerázy, a to nepřidání koncového adeninu - rozdíl mezi černým a sousedním bílým píkem je 1 bp (tj. chybějící adenin) - pattern daného lokusu je vždy specifický a často záleží na PCR podmínkách •162 •174 173 171 169 161 159 157 •172 •170 •160 •158 •Genotyp 162/174 Srovnání různých jedinců – analýzy příbuznosti Msat paternita - Sekerak •Elektroforetogramy čtyř různých heterozygotů • •3 bp repetice • • •PCR produkty •125-134 bp •+ •- •Ind. 1 •Ind. 2 •Ind. 3 •Ind. 4 •směr elektroforézy •125/131 •131/134 •125/134 •131/137 •Př. Analýza příbuzenských vztahů Msat paternita - barvy •Genotyp (bp) •Matka: 125/131 •Otec: 131/134 •Potomek 1: 125/134 •Potomek 2: 131/137 •Sledovaný otec mohl zplodit potomka 1, ale zcela jistě není otcem potomka 2 •+ •- • •? Různé značení různých znaků • •Snížení časových a finančních nákladů •= „multiplex set“ •Až 4 různé barvy (+ 5. barva jako velikostní standard) – analýza až 4 lokusů o stejné velikosti alel • 3LOKCELE • • • • • • • • • •Lokus 1 •Lokus 3 • •Lokus 2 • Mikrosatelity - omezení •nalezení lokusů (navržení primerů) je pracné a nákladné u volně žijících druhů (genomová knihovna, klonování, screening, sekvencování) •TTCAGGCACACACATCTCTAGCTTCGA • •Př.: chromozóm 1 •„flanking regions“ – ohraničují repetici a zde musí být navrženy primery pro PCR Štěpení, obohacení, klonování, screening a sekvenování •Genomická DNA po rozštěpení •a obohacení na repetice • •sekvenování inzertů •(repetitivní DNA + flanking regions • •design primerů a testování polymorfismu • •izolace vektorů s inzertem • •screening klonů obsahujících repetice (hybridizace se sondou) • • •Každý klon obsahuje jednu sekvenci • •vector = plasmid •Obohacená genomická knihovna •ligace do plasmidu, transformace Alternativa: cross-species amplification n„cross-amplification“ – úspěšnost klesá s fylogenetickou vzdáleností n nnulové alely (mutace v primerových sekvencích) → vyšší proporce „homozygotů“ •TTCAGGCACACACATCTCTAGCTTCGA •TTCAGGCACACATCTCTAGCTTTGA •x •PCR OK •no PCR Nulové alely a genotypizační chyby komplikují analýzy příbuznosti • lokus 1 lokus 2 • null alleles genotyping error • •Matka 100 150 300 350 • •Samec 1 100 100 300 367 • •Mládě 150 150 350 365 • • • • • • •Samec 1 je vždy opravdovým otcem, ale jednoduchá „exclusion“ metoda ho vždy vyloučí • Optimalizace mikrosatelitů v současnosti = NGS n„next-generation sequencing“ – velice rychlá sekvenace stovek tisíců fragmentů z jakéhokoliv genomu n nvyhledání repetitivních sekvencí vhodným softwarem a navržení primerů n nidentifikace nových mikrosatelitů rychle, elegantně a relativně levně (1500 EUR ?) • http://www.biotechniques.com/multimedia/archive/00042/BTN_A_000113084_O_F0_42481b.jpg •Abedlkrim et al. 2009 Využití mikrosatelitů •identifikace jedinců a analýzy příbuznosti (zejména rodičovství) •populační genetika (conservation genetics, landscape genetics, etc.) •fylogeografie a analýzy historické demografie (omezeně – nutno znát mutační model) •fylogenetika, tj. vzdálenější příbuzní – téměř vůbec, vysoké riziko homoplázií Teoretické mutační modely (nutno definovat pro analýzy vyžadující údaj o podobnosti alel, např. při analýzách historické demografie) •IAM – infinitive allele model Při mutaci ztráta nebo získání libovolného počtu opakování. Vzniká nová alela, která doposud v populaci nebyla - každá alela vznikne pouze jednou a pak už se nemění. Není možno určit podobnost (similarity) alel, ale pouze identitu. • • •SMM – stepwise mutation model (Mutace způsobeny pouze ztrátou nebo získáním jediného opakování motivu. Mutací může vzniknout alela, která je již v populaci přítomna – tzv. homoplázie. Je možno odhadnout podobnost (similarity) alel. •CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT •CTTTCTTTCTTTCTTT •CTTTCTTT •CTTTCTTTCTTTCTTT •CTTTCTTTCTTTCTTTCTTT •CTTTCTTTCTTTCTTTCTTTCTTT •CTTTCTTTCTTTCTTTCTTTCTTTCTTT •CTTTCTTTCTTTCTTTCTTTCTTT •Pravda bude někde mezi ... •= Two-phase model (TPM) Indels •inzerce nebo delece 1bp či delších úseků – použití pouze pro populačně-genetické analýzy vyžadující „identity“ (nepoužitelné pro modely vyžadující „similarity“) •TTCAGGCACACACATCTCTAGCTTCGA •TTCAGGCACACACACATCTCTAGCTTCGA •SMM model – možno kvantifikovat podobnost („similarity) alel •27 bp •27 → 29 bp •TTCAGGCACACACATCTCGTAGCTTCGA •TTCAGGCACACGACATCTCTAGCTTCGA •TTCAGGCACACCATCTCTAGCTTCGA •TTCAGGCACACACATCTCTAGTTCGA •27 → 28 bp •27 → 28 bp •27 → 26 bp •27 → 26 bp •„Indels“ – pouze pro analýzy, kde je vyžadována „identity“ a nikoliv podobnost • Další nepravidelnosti (tj. možné komplikace při analýzách) MS Development •„složený mikrosatelit“ – rovněž není možné aplikovat jednoduchý mutační model Proč je tolik alel? (microsatellite instability) •Nerovnoměrný (Unequal) crossing-over (díky špatnému alignmentu) • •Sklouznutí polymerázy při replikaci Slip-strand mispairing (při replikaci nejprve polymeráza sklouzne a vyrobí odlišný počet opakujícího se motivu mikrosatelitu, při alignmentu je pak část opakování vykloněna mimo dvoušroubovici, flanking regions tedy párují) http://www.nature.com/scitable/content/33289/10.1038_nrmicro734-f1_large_2.jpg Bias (skutečná data) •Kratší mikrosatelity (s malým počtem opakování motivu) mají zřejmě tendenci se spíše prodlužovat (slabě převládají adice nad delecemi) • •Delší mikrosatelity se spíše zkracují (náchylnější k velkým delecím) • •Delší mikrosatelity rychleji mutují (díky více opakováním je vyšší pravděpodobnost pro sklouznutí polymerázy (SSM) – mají více alel) Mikrosatelity - závěry •Mechanismy evoluce mikrosatelitů stále nepříliš objasněny • •Stepwise mutation model SMM platí jen omezeně • •= nevýhoda v populační genetice (jsou rychle nahrazovány jinými markery, např. SNPs) • •= tolik nevadí při identifikaci jedinců a pro analýzy příbuznosti (paternity) – zde se budou používat ještě hodně dlouho SINE, LINE, etc. (Shedlock et al. 2004, TREE; Ray et al. 2007, MolEcol) •Transposable elements • •Vytváří kopie (většinou) • •Kopie integrovány na nová místa v genomu • •Obvykle nejsou specificky odstraňovány • •Molekulární fosílie – neexistují homoplasie !!! • •Nesmírně početné • •Člověk – víc jak polovina genomu (ost. druhy – 40-90%) • •Objev DNA transpozonů u kukuřice: Barbara McClintock Barbara McClintock, 1947 Barbara McClintock Typy transposabilních elementů •Kódující své proteiny, autonomní, 1-10 kb –DNA transposony (cut-and-paste) –transposasa –Retrotransposony (copy-and-paste) –LINE 1-2 proteiny, kopie přes RNA –LTR retrotransposony 5-6 proteinů, také přes RNA – •Nekódují proteiny, neautonomní, 100-1000 bp paraziti předešlých, např. SINE (člověk Alu – více než 1 milion kopií) – nejčastěji používané v populačních a fylogenetických studiích • • LINE – mechanismus transpozice •Kopie přes RNA • •Reversní transkriptáza • •Mašinerii využívají SINE (jsou to „paraziti“), Alu (SINE) a L1 (LINE) se stejně rychle množí •DNA •RNA • •Zpět na DNA • •Nové místo v genomu • • LTR retrotransposony – opět přes RNA, složitější proces Velmi nízké riziko homoplázií → SINE = ideální fylogenetické markery •„single-locus marker“ •- PCR amplifikace daného úseku a elektroforéza •SINE Neexistují zpětné mutace = výhoda oproti sekvenačním datům • •Příklad aplikace: kytovci vs. sudokopytníci (hroch je bratr velryby) http://www.talkorigins.org/faqs/molgen/fig4.gif • • http://www.izun.eu/sites/default/files/uvodniky/10-2012/hroch2.jpg http://upload.wikimedia.org/wikipedia/commons/a/ae/Physeter_macrocephalus1.jpg http://www.biolib.cz/IMG/GAL/44616.jpg