Polymorfizmus ľudskej DNA Vladimír Ferák Katedra molekulárnej biológie Prírodovedecká fakulta Univerzity Komenského Bratislava i Polymorfizmus ľudskej DNA • Definícia genetického polymorfizmu • Typy polymorfizmu DNA (SNP, RFLP, VNTR, STR, CNV ...) a rozloženie po genóme • Metódy detekcie • Mechanizmy vzniku a mutačné početnosti • Polymorfizmus mtDNA a Y-chrom. DNA • Polymorfné haplotypy a haplotypové bloky • Praktické využitie Genetický polymorfizmus • Definícia (Ford): Geneticky podmienený znak s najmenej dvomi diskontinuitnými variantmi v jednej populácii, pričom početnosť zriedkavejšieho variantu je vyššia ako 1% (arbitrálne číslo) • Vylučuje: negenetické znaky, kontinuitnú variabilitu, polytypizmy, zriedkavé znaky (dedičné choroby) • Typy polymorfizmu: - morofologický - funkčný - serologický - biochemický DNA: je najčastejší, lebo väčšina polymorfizmov DNA nemá fenotypový prejav 3 Typy DNA polymorfizmov • Bodový polymorfizmus (substitúcie jednotlivých báz; SNP) • Variabilný počet tandem, repetícií - mikrosatelity (STR) - minisatelity (VNTR) - makrosatelity • Prítomnosť/neprítomnosť sekvencie (Alu, L1 a i.) na špecifickom mieste (indel) • Variabilita počtu kópií (copy number variants, CNV) 4 Bodový polymorfizmus (Single Nucleotide Polymorphism, SNP) T Mspl T Mspl T Mspl 5-...ACCGGTACA...ATCCGGTTAGCCGGTA...-3' T Mspl X T Mspl 5'-...ACCGGTATA...ATC A G G T T A G C C G G T A ...-3' l...~1000bp ... I • Početnosť odlišností: cca 1 : 1000 bp; v genóme cca 30 mil. SNP, t.č. registrovaných vyše 10 mil. (2004), ale len časť je definitívne potvrdených; • Výskyt: intróny, nekódujúce oblasti (väčšinou žiadny fenotyp); len asi 50 000 v kódujúcich sekvenciách génov • Vznik: mutácia + genetický drift (niekedy selekcia); nepoznáme pôvodný stav, len nepriamo (zo sekvencie u primátov); • u = 10"7 až 10"9 (najčastejšie v dinukl. CpG) • Možný dôsledok: prítomnosť/neprítomnosť restrikč. miesta (ak v rozpozn. sekvencii RE, asi 20%): vznik RFLP (Restriction ragment .ength Polymorphism) 5 Detekcia SNP polymorfizmu • RFLP (restriction fragment lenght polymorphism) - reštrikčné štiepenie genomickej DNA s následným Southern blottingom (dni) - PCR amplifikácia s následným reštrikčným štiepením (deň) • DNA array (čipy): detekcia až 500 000 SNP v jednej analýze V sonda (g) v ___t (g) _________— SZ^------1____^ X7 =*______^7 ________^_____ Polymorfizmus variabilného počtu tandemových opakovaní (VNTR, STR) ....(TGAC)(TGAC)(TGAC)....... ....(TGAC)(TGAC)(TGAC)(TGAC)(TGAC). Detekcia PCR amplifikaciou repetitívneho úseku a separáciou v géli: 5 I 4 ____| 3 1 6 4 I 3 13 Ů ó Ô Ů o 6 ^^_ 5 3 G 5 4 3 G, 4 6,5 5,4 4,3 6,3 5,3 VNTR (minisatelity) - variabilita v populácii m Kapilařova elektroforéza fragmentova analýza G C ^ T LAVUAJ elektroforetogram anóda Q detektor kapilára n laser katóda t vzorka: fragmenty DNA flourescenčne značené Polymorfizmus variabilného počtu tandemových repetici í Minisatelity (VNTR) Dĺžka základnej repetície >6bp Počet opakovaní repetície 10 - 100 (1000) Výskyt preferenčně v telomerickych oblastiach (najmä bohaté na GC páry) Odhadovaný počet: cca 104 Jednoduchá detekcia: Southern, PCR Vznik nových alel: nehomologický crossover Mutačná frekvencia: vysoká, až 103 Využitie: obmedzené; individuálna identifikácia Biologický význam: neznámy, asi selfish DNA Spec, prípad: minisatelit (TTAGGG)n - telomery 9 9 9 Mikrosatelity (STR) Dĺžka základnej repetície 2 - 6bp Počet opakovaní repetície 2 - 100 Výskyt rovnomerne po genóme Odhadovaný počet rádovo 105 Jednoduchá detekcia: PCR Vznik nových alel: replikačné chyby Mutačná frekvencia: cca 103 Využitie: rozsiahle; individuálna identifikácia, nepriama DNA diagnostika, identifikácia génov Biologický význam: neznámy, asi selfish DNA Výnimka: expanzie trinukleotidov u niektorých ochorení Najčastejší: „CA-repeať (asi 50 000 x v genóme) Typy mikrosatelitov Typy: • Perfektné (jednoduché) (CA)n • Imperfektné (CA)n TTT (CA)m • Zložené (CA)n AAA (AT)m V genóme: (CA)n - 0,5% (najmenej 50 000) (TC)n - 0,2% ostatné dinukl. - takmer 0% tri- a tetra: zriedkavé, ale najčastejšie používané v praxi Inzercno-delecny polymorfizmus (indel) • Indel od 1 bp po niekoľko Mb * inzercie Alu, LI - retrotranspozícia o Veľmi zriedkavý jav: inzercie sú unikátne udalosti * Poznáme pôvodný stav (to je stav bez inzercie) • Inzercie (Alu, Ll) aj do kódujúcich sekvencií —► patológia inzerčno-delečný polymorfizmus Alu-sekvencie (300 bp) v Y-chrom. DNA: 1500 tSNQ 1000 500 400 300 Využitie polymorfizmov DNA Ukazovatele variability: • Počet známych alel (pri SNP dve, pri VNTR až 102) • Index heterozygozity H = Z2 Pj p= = 1 — Zpj2 • Pravd, identity PI = 1 - Zpj4- 14 Pj2 Pj2 • Polym. information content PIC = 1 -1 Pj2 -12 Pj2 Pj2 Praktické využitie: • Identifikácia osôb/vzoriek DNA (A. Jeffreys 1985) • Určovanie paternity (VNTR, STR) • Nepriama dg. monogénnych ochorení (vysoký PIC) • Triangulácia génovej mapy (od RFLP až k STR) • Hľadanie nových génov (pozičné klonovanie génov) • SNP a CNV pri multifaktoriálnych ochoreniach Polymorfizmus DNA v kriminalistike História: > Alec Jeffreys (UK) - 1987 - identifikácia páchateľa vraždy (našiel sa medzi 3600 testovanými jedincami) > ČSFR: PRIF UK: 1990 - identifikácia páchateľa vraždy v Brne > 1992 - DNA usvedčila páchateľa 9 vrážd Súčasnosť: > všeobecne akceptovaná metóda; diskriminančná schopnosť 10-17 > vo svete 106 DNA testov ročne (vrátane testov otcovstva) > identifikácia páchateľov/obetí trestných činov > identifikácia obetí hromadných nešťastí > N.Y.C. ll.sept.: 850 identifikácií, 115 000 DNA profilov > tsunami 2004: asi 1100 DNA identifikácií (?) > databázy: - CODIS (USA + 23 krajín): 2,7 mil. DNA profilov - Scotland Yard: 3 mil. DNA profilov - Slovensko (KEÚ PZ): 2600 DNA profilov Individuálna identifikácia „DNA fingerprint" <* Alec Jeffreys, 1984 * Reštrikčné štiepenie genomickej DNA —► elektroforeticka separácia -► Southernov blotting s VNTR sondou (GGGCAGGAXG) liľlľ|I.ULľí PROBE VNTR REPEAT A B f= -i i- Multiplex PCR • Amplifikácia viacerých lokusov v jednej PCR reakcii A. B. L i 2L34L56L LIŽL31L56L D16: .r^ -14 g__~ .-r15 CSFi FO I----- '•lií «Á — ™^- 5 Oľf^- ,--14 [ _----^*^——— --13 -—^— ■ i D13^- ^^—-r ■^^a- ■■■ ■--------- ■■-- HH ^V "^^ = ^^^^ ^™ "■—^------H^------4V ------" __ . ^ __ —-1-4 ^1 n n — D5;— * *~ rr ^ r"~T"-žľ"3 —v h— ^ —U- ■—■ ■ ■ —■ "■ — ^— ■■ 7 ■_ — — ^^ vľavo - separácia na akrylamidovom géli a vizualizácia striebrom vpravo - fluorescenčné značenie primerov 19 37 65 Multiplex: viac STR systémov súčasne (DNA profil) Molecular weight (bp) BO 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 2S0 290 300 310 320 ______i_______________________i____________________i_____________________i_____________________i______________________i_____________________i_____________________i_____________________i_____________________i_____________________i______________________i______________________i____________________i_____________________i_____________________i_____________________i______________________i____________________i______________________i_____________________i______________________i___________________i______________________i_____________________i__________ Amelogenin M D8S1179 u D21S11 U 00 D3S1358 MM !li HUMVWA no lLJ. D16S539 m m úi D18S51 iA-A D2S1333 ÁA Mě D19S433 Q HUMTH01 6 9 HUMFIBRA/FGA m ei Amelogenin dl \e\ui JUL D8S1179 Amelogenin II 1 D8S1179 HE] EU E EMI El L D21S11 D21S11 Ll D18S51 ___J L D18S51 Dnes používaných 13-16 STR systémov: až 1015 - 1020 rozličných možných typov DNA profilov (ale ľudí je len 109) Známe prípady identifikácie pomocou DNA i Romanovci: identifikácia kostrových pozostatkov zavraždeného posledného ruského cára a jeho rodiny Joseph Mengele: DNA pomohla identifikovať pozostatky najmasovejšieho vraha v histórii Thomas Jefferson: DNA potvrdila, že mal syna so svojou čiernou otrokyňou Sally Hemingsovou: DNA chromozómu Y ... B.Clinton - M. Lewinská ... Polymorfizmus STF matka AA dieťa Á A testovaný [ muž A A matka [ AA dieťa f Ä A testovaný muž 1: Al 1a pri určovaní paternity nevylúčený: dieťa má spoločnú alelu s označeným mužom Pravdepoodobnost'jeho otcovstva je tým vyššia, čím je zriedkavejšia táto alela vylúčený: dieťa nemá spoločnú alelu s označeným mužom Pozor: možnosť mutácie! Mikrosatelity při určovaní paternity • Genotypy matky, dietata a označeného múza v štyroch STR polymorfizmoch (kapilárová elektroforéza) Jedinci M D8S1179 ID8S1179 ID8S1179 3000 6000-4000 20004 J L^ 1^51 D21S11 D7S820 löäisii _.^J Ui ag||ai 3o!J| IĎ21S11 1^39] [Ď7S820 [älil |al 10| [Ď7S820 X l^išl Iďtíl CSFIPO Z\ ICSFIPO 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 260 290 310 320 340 350 |al'lo||al'l2| Eni l |al 121 ID8S1179 Idaiüfflar_v3-dup IĎäisn ID7S820 120 130 140 150 160 170 180 190 200 210 220 230 240 250 260 270 280 290 340 350 8000-6000-4000-I-2000- ____AJ li Changed, al 11 Changed aí 12 —<■—±-------------*~- Eľiol I Em I |al 121 Copy-number x .......... ■ i i i i polymorphism (CNP, CNV) § ) chromozóm referenčná DNA delécia inzercia inverzia duplikácia (CNV) i r~i i segmentová duplikácia Detekcia CNV pomocou komparatívnej genómovej hybridizácie (CGH) skúmaná DNA referenčná DNA 9 fluorescenčné farbenie hybridizácia CGtí_ na chromozómoch * JW\ ^ _DNA.čip =■■>■•*■>.•*;> na DNA čipe 8 í «i - - - Iff ;lť Distribúcia CNP (CNV) na chromozómoch zelené: delécie modré: duplikácie CNV pokrývajú asi 12% ľudského genómu Až 50 génov je u každého jedinca duplikovaných! Choroby: CMT, autizmus . = = - ': I4 15 1« 17 1S 19 2D 21 22 Y Polymorfné haplotypy iptot^pe ^IPHE c o r^ L-e? m ť^ o r jsi r -y l-i 3* p-l ůT-y P & T ^"Í^CB contemporarv h ^ pJ r>tv P e- S qjonftemporary häploŕry pe 3 ruži nrfcB m pzpcir-a r y haplotype -*l J—L ~r >=: EF^ t i i i lOi i i-rs I J KF%v I I i-ap^v. t _>í a ■ ' J-*F^ I I "T ^< J^J-Tii^ Haplotyp: súbor alel na jednom chromozóme, ktoré sa len zriedka oddelia rekombináciou Haplotypové bloky v ľudskom genóme: rekombinačné „cold spots" Využitie: štúdium „veku" mutácií 24 Polymorfizr -AIW44I 73 V ■sphi 12 J -Hinfl T + Alu 1 16065 | 1 15606 nus mtDNA Polymorfizmy mtDNA: • Mimo D-kľučky 10x častejšie ako v gDNA • V rámci D-kľučky až 10Ox častejšie ako v gDNA • Žiadna rekombinacia: haplotypy; haploskupiny • Matrilineárna dedičnosť • Heteroplazmia • Využitie: štúdium evolúcie ľudských populácií Prenos mtDNA, Y-chromozomálnej DNA a autozomálnej DNA mtDNA a Y- Pred 5 generáciami mal každý jedinec 25 = 32 predkov, „. z nich len od jedného zdedil Y, od jedného mtDNA, ale rekombinácia od každého časť autozomálnej DNA ô prenos „en bloc" cez generácie ô Každý má práve jedného Y-predka a jedného mt predka v ktorejkoľvek predošlej generácii Dieťa