Mikrosatelity SINE Fig1 A G Single nucleotide polymorphisms (SNPs) SNPs : nuclear genome (consensus) Single-locus genetic markers •SNPs (single nucleotide polymorphisms) – sekvenční polymorfismus • •kodominantní – je možné odlišit heterozygota (např. A/T) od homozygota (např. A/A) Př.: chromozóm 1 CAAGTA TGGACG CATGTA TGCACG CAAGTA TGGACG CAAGTA TGGACG A/T A/A Příklad informativního SNP znaku Fig1 transice A ↔ G transition: Pu®Pu or Py®Py transversion: Pu®Py or Py®Pu - fixovaný polymorfismus (homozygoti) – využití např. při studiu hybridizací (hybridi = heterozygoti) Využití SNPs znaků •obdobné jako u mikrosatelitů • •identifikace druhu (nebo genetické skupiny) - studium hybridizace • •fylogeografie • •populační genetika (genetická variabilita a struktura, tok genů, identifikace jedinců a vztahů mezi nimi, populační velikost a její změny atd.) Výhody •početné a rozšířené v genomu (v kódujících i nekódujících oblastech) – milióny lokusů •1 SNP cca každých 300-1000 bp •Mendelovská dědičnost (vs. mtDNA) •evoluce je dobře popsatelná jednoduchým mutačním modelem (vs. microsatellites) •jsou analyzovány kratší fragmenty DNA – neinvazivní genetika Nevýhody •„ascertainment bias“ – výběr znaků se provádí na základě jen malého počtu jedinců a nemusí být reprezentativní •nízká variabilita na lokus (většinou jen 2 alely) •pro populační genetiku je vyžadován větší počet lokusů (4-10 krát více než u mikrosatelitů) Metody analýzy 1.Nalezení lokusů („ascertainment“) 2.Genotypizace Nalezení SNPs (1) CATS loci = comparative anchor tagged site loci (= cross amplification) (2) Genomic library = genome restriction + cloning Next-generation sequencing – sekvenování genomu více jedinců a hledání polymorfismů hapmapfig2 Identifikace různých genotypů u různých jedinců (= homologních chromozómů, tj. variabilita alel) SNPs genotyping = zjištění genotypu daného jedince SNPs genotyping – sekvenování? Je drahé a nejasné u heterozygotů C T C/T Heterozygotes? Bi-directional sequencing – are you really sure? AC GT SNPs genotyping – klonování a následné sekvenování? - separation of two (or more in duplicated genes) alleles each clone contain the only allele vector = plasmid insert = only one PCR product ligation, transformation Ex.: heterozygote = two diff. alleles isolation of vectors containig inserts sequencing of inserts !!! cloning – 1000 Kč !!! sequencing 1 clone – 150 Kč PCR is making substitution errors that are visualised by cloning TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGG TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTCCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTGAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA ... před PCR = heterozygot G/C SNPs genotyping 1.Old standards (PCR-based) •RFLP, DGGE, TGGE, SSCP •HRM: high-resolution melting (real-time PCR) •původně detekce geneticky podmíněných chorob, např. cystická fibróza • 2.New methods (not based on standard PCR) •real-time PCR se specifickými sondami (TaqMan, molecular beacon) •ASPE: allele-specific primer extension • SBE: single base extension • SNP microarrays (GeneChip method) • • PCR-RFLP (restriction fragments length polymorphism) Enzyme Site Recognition • Each enzyme digests (cuts) DNA at a specific sequence = restriction site • Enzymes recognize 4- or 6- base pair, palindromic sequences (eg GAATTC) Palindrome Restriction site Fragment 1 Fragment 2 SNP genotyping - old standards Common Restriction Enzymes EcoRI – Eschericha coli – 5 prime overhang Pstl – Providencia stuartii – 3 prime overhang SNP genotyping - old standards PCR-RFLP CCGATCAATGCGGCAA GGCTAGTTACGCCGTT CCGATCACTGCGGCAA GGCTAGTGACGCCGTT cutting by restriction endonuclease Allele A Allele C no cut - neumožní nalézt novou variantu daného SNP (odliší pouze 2 formy daného znaku: +/- ) SNPs genotyping – old standards electrophoresis methods of mutation detection •Thermal gradient gel electrophoresis (TGGE) •Denaturing gradient gel electrophoresis (DGGE) •Single-strand conformation polymorphism (SSCP) • •= special electrophoresis methods based on differences in mobility of different DNA sequences • Denaturing gradient gel electrophoresis (DGGE) (TGGE – podobné, ale gradient teploty) dgge The small (200-700 bp) genomic fragments are run on a low to high denaturant GRADIENT acrylamide gel Each fragments move according to molecular weight, but as they progress into more denaturing conditions, each (depending on its sequence composition) reaches A POINT where the DNA BEGINS TO MELT They retard, and we will see shift in mobility We will see different shifts in mobility for differing products www.leveninc.com/cftr_ex.gif cftr_ex 1- normal homozygote 3- homozygous mutations will yield one band on a different position 2, 4, 5, 6 – heterozygous mutations will yield 4 bands (2 homozygous and 2 heterozygous) NOT ALL BANDS ARE SEEN !!!!! Detekce nových mutací – např. v diagnostice genetických chorob nebo při analýzách MHC High-resolution melting temperature (HRMT) Step 1: real-time PCR = increase of fluorescence Step 2: measuring melting after PCR = decrease of fluorescence SANY0264zmenseny HRMT genotyping Detekce heterozygotů Single strand conformation polymorphism (SSCP) Homo1 Homo2 + - !!! non-denaturing PAGE Hetero radioisotopes silver-staining fluorescent dyes (SYBR gold) Allele 1 - C ...CGCTTCAGG ... ...GCGAAGTCC... ...CGCTTAAGG ... ...GCGAATTCC... Allele 2 - A heating - denaturation snap-cooling ® partial renaturation sequence-specific ssDNA conformations Použití automatických sekvenátorů (denaturing polymer POP7 – ssDNA, e.g. microsatellites – one labelled primer) Well controlled electrophoresis parameters, high sensitivity CTTTCTTTCTTTCTTTCTTTCTTTCTTTCTTT CTTTCTTTCTTTCTTT GAAAGAAAGAAAGAAAGAAAGAAAGAAAGAAA primer primer GAAAGAAAGAAAGAAA primer primer Msat paternita - Sekerak + - 125 bp 131 bp Použití automatických sekvenátorů Why not non-denaturing electrophoresis? - well controlled electrophoresis - - two fluorescent labels - high sensitivity e.g. CAP (conformation analysis polymer) Allele 1 Allele 2 FAM... CGCTTCAGG ... ... GCGAAGTCC ...HEX FAM... CGCTTAAGG ... ... GCGAATTCC ...HEX • MHC Class II (DQA gene) – mice HZ 2 3 1 2 1 2 1 4 1 hour, ~ 100 Kč/4 samples incl. PCR Information about all alleles (vs. cloning-sequencing) Data analysis •GeneMapper (Applied Biosystems) •different „Size Standard“ for each temperature •alignement of more samples •allows detection of „haplotypes“, i.e. short sequences with several SNPs (very useful for e.g. MHC genotyping) Applications 1)Genotyping of codominant markers (e.g. single copy MHC genes) • MHC Class II (DQA gene) – mice HZ 2 3 1 2 1 2 1 4 ... even shape of the peaks is important !!! Applications 1)Genotyping of codominant markers (e.g. single copy MHC genes) 2)Identification of number of genes (e.g. duplicated MHC genes) sscp SSCP of three individuals: - different alleles - same alleles Carpodacus erythrinus – MHC Class I (Promerová et al. 2009) Seven peaks in one colours = = At least four amplifed copies !!! Applications 1)Genotyping of codominant markers (e.g. single copy MHC genes) 2)Identification of number of genes (e.g. duplicated MHC genes) 3)Detection of PCR artefacts during cloning Detection of PCR artefacts during cloning TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGG TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTCCGA TTCAGGTCTCCTAGCTTCGA TTCAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA TTGAGGTCTCGTAGCTTCGA TTCAGGTCTCCTAGCTTCGA ... před PCR = heterozygot G/C • Individual with genotype 1/2 Cloned allele 1 Cloned allele 2 Cloned PCR artefact MHC Class II (DQA gene) – mice HZ Detection of PCR artefacts during cloning of heterozygotes SNP genotyping – new methods 1. real-time PCR se specifickými sondami (TaqMan, molecular beacon) 2.ASPE: allele-specific primer extension 3. SBE: single base extension 4. SNP microarrays (GeneChip method) = not based on standard PCR Real-time PCR se specifickou sondou 1) TaqMan sondy 2) Molecular Beacons („maják“) real-time PCR sondy specifické pro jednotlivé alely ASPE: allele-specific primer extension CCGATCAATGCGGCAA CCGATCAATGCGGCAA T G • dvě PCR se specifickými primery • 3’ terminální nukleotid na primerech je komplementární k SNP nukleotidu • alelově-specifická amplifikace je umožněna vysoce specifickou polymerázou Úspěšná PCR Žádný PCR produkt ASPE: allele-specific primer extension (automatizovaná verze) • existují zoptimalizované multiplexy pro modelové druhy (např. člověk 1536 SNPs) • fluorescenční detekce (Illumina) (3) SBE: single base extension CCGATCAATGCGGCAA CCGATCACTGCGGCAA T G - pouze jeden dideoxynukleotid je přidán k primeru - detekce různými metodami T G + - Detection or SBE products + - electrophoresis in a capillary SNaPShot Multiplex Kit (Life Technologies) „multiplex version“ – různě dlouhé primery, aby bylo možné odlišit různé lokusy Microarray detection of multiple SBE products CCGATCACTGCGGCAA G tag – specific for each locus 1. 2. 3. 4. multicolor detection (using of 5’ oligonucleotide tags on SBE primers) tag-complementary probe - specific for each locus several loci amplified together (4) Microarray analysis of SNPs (whole genome approach – „chip technology“) Target (genomic DNA fragmented by e.g. restriction enzymes) Probe (specific probes for each allele) Microarray SNP Genotyping … ACT GGT CAT … (G) … ACT GTT CAT … (T) probes …ACTG?TCAT… …ACTG?TCAT… …ACTG?TCAT… Individual 1 Individual 2 Individual 3 targets G/G T/T G/T Detekce: Affymetrix, Illumina aj. 10 – 500 tisíc SNP znaků najednou – „chip technology“ BeadArray (Illumina) Použití u příbuzných druhů je možné, ale je tam velmi silný „ascertainment bias“