HGV HUMAN CFNUMF THE ■ I #r» It I ^% liiirtll/l ATI I JL HUMAN VARIOME HGVS-NOMENKLATURA > mezinárodní standard pro pojmenovávání sekvenčních variant nalezených v DNA, RNA či proteinech S autorizovaná Human Genome Variation Society (HGVS), the Human Variome Project (HVP), Human Genome Organization (HUGO) publikace DEN DÜNNEN, Johan T., Raymond DALGLEISH, Donna R. MAGLOTT, et al. HGVS Recommendations for the Description of Sequence Variants: 2016 Update. Human Mutation [online]. 2016, 37(6), 564-569 [cit. 2019-04-05]. DOI: 10.1002/humu.22981. ISSN 10597794. Dostupne z: http://doi.wiley.com/10.1002/humu.22981 online verze http://www.HGVS.org/varnomen DŮVODY PRO ZAVEDENÍ (a dodržování) S správné označení varianty zamezí nedorozuměním stabilita smysluplnost zapamatovatelnost jednoznačnost ! vlastní pravidla vedou ke zmatkům a chybám ! HLAVNÍ OBECNÁ PRAVIDLA 1) Užívat oficiální symboly (HGNC pro geny) 2) Uvádět referenční sekvenci! (číslo i verzi) 3) Uvádět typ sekvence na níž variantu pojmenováváme! předpona - dle typu refseq REFERENČNÍ SEKVENCE (RefSeq) veřejně dostupná, ověřená sekvence NK či proteinu představuje aktuálně nejspolehlivější zdroj sekvence považované za standardní sekvenci dané molekuly > „ta sekvence, vůči které hledáme odchylky u vyšetřovaných vzorků" - 77 bp - ACVRL1 KLÍČOVÉ MOLEKULY MOLEKULÁRNÍ GENETIKY DNA t g atctc&t a a\ /tc\ ...........>\v//\\ a c tagagca T Ty VSÍ/ V\. AU G AOC UCGr U A A _ii_ii_u https://www.khanacademy.org/science/high-school-biology/hs-molecular-genetics/hs-rna-and-protein-synthesis/a/hs-rn^ TYP REFERENČNÍ SEKVENCE • DNA • A,T,C,G • g. (genomická) vs c. (kódující) • RNA • PROTEIN (většinou odvozeno) GENOMICKÁ (g.) KÓDUJÍCÍ (c.) >HH_Ů0DO2Q . Z Homn sipitcia ictÍTÍn A receptor Lite type 1 (ACVRL1] , tranaciipt -.-^-iaiit lj niRHA aggaaacggz : zattaggag ^gp.gzz- ^tggagztggg; z>. :;gc:-.g r aagacgztgga:-.z aag a-j-.z z-.zz z T T GCT C CA G C CCC CA r CCCAGT C CCGGGA G gct GC C GCGC CAGCT GC GC c GAGC GA GCCC CT C OCCGGCT C CA 3 CC C GGTc CGG G G :Z TGC GC C CGGAC C C CAGC C C GCCGT C CAGCGCT G GCGGT GCAAC T G C GGC C G C g C GGTGGAG G G GAGG T G GCC C C GGT CC GC C GAAGGC ZA 3CGCC C :Z 3C CA C :Z :Z GCAGA GCGG GC C CAGAG G G MIC atg %CCT z GGGCCCCCCCAGGAAAGGCCTTCTGATGCTGCTXAVTGGCCTTGíTGACCCAGGGAGACC CTGTGi^CCGTCTCGGGGCCCGCTGGTGACiZTGCACGTGTGAGAGíCCACAT^ CC GGGGGGC CTGGT GCACAGTAGTGCT GGT GCGG GA G GAG G G GAGGCAC C CCCAGGAACAT C GGGGCT GC GGGAACTTGCACAGG^GCTCTGCAGGGGGiZGCCCCACCGAGTITO^ AÍCTCTGCAACCACAACGTGTCCCTGGTGCCGGA^GCCACCCAACCTCC^^ TGGCCAGCrGGCCCTGATCCTGGGCCCCGTGCTG^CCTTGCTGGCCCTGGTGGCCCTGG^ CT GTQGCAT GTCCGA C G3AG GCA gsag 7-J-. 3 CAGC G Z G3C CTG CA CAG C GA 5™I GGGAGAGT C CAGT CT HA TCCTGftAAGCATCTGAGCASGGCGAlCAGCArCTTGGGffiACC T G G :ZT CAG G GCTCCC HTT CC T GGTOCAGA g GAÍZAG T GGCAC GGCAGGT T g CCT T GGTGGAGT GTGT GGGA AAA GGCC GCTAT GGC GAAGT GT GGCGGGGCTT GT GGCACGGT GAGAGT GT GGCC G T CAAGAT iZTT CTCCT CGA3GGATGAACAGTCCTGGTTCCGGGAGACTGAGAT>CTATAACACA CCCAGGCTCCATCGCCZ ZAGACAZ GACCCCC:ZG^AA:ZTCGAG^CGÍZAGCTGTGGCT^^ CACGAGCACGGCTCCCT^ACGA:itttccg:ZAGAGA:ZAGACGCIGGA^ CTGTXTTCCGCGGCATG:ZGGCCTGGCGCAC:ZTGCACGTGGAGACC^^ T GC CCAC C G C GACT T CAAGAGC c GCAAT GT GTE GG T CAAGAGCAAC CTG CAGT GT T GCAT C GC CGAC C Z G GGCCTGGCTGTGATG^CTCACAGGGCAGCGATTACCTGG^ AKGGTA^TGGCACCCSAGGTGíITGGACGAGCAGATCCGí^G^ TGACATCTGGGCCTTTGQCCTG^TTQCTGTGGGMP.TZGCCCGCCÍKACCA GP.CZ AT AGACCACCCTZ TTATGAZ GTGGTGCCCAACGACCCCAGCTTTGAGGACACGAAGAAGGTGGTGT GT GTGGAT Cř. GCAG Ji C z z" c AC CAT CC CTAACCGGCTGGC T GCAGAC C C g GT CCT CTCAGGC CTAGCT CA G 5, z 3AT G C g g 3AGT G z z GGT AC C CAAAC C z z? CT G C CCGACT iZA'TC gc g CTGCGGATCAAGAA 3ACAC ZA CAAGJ^^TCAGCAACAGTCCAGAGAAGCCCAA.^TGATTCAACAK CCCGCAGGGGGCTGGGGGGGTGGGGGfiCAGTXKATGGTGCCCTATCTG^SG^ T G c GT GCT G g GGAT G G GCAG CT G CGCCT G c CT GCT C G3CC C c CA3CC iZA z z :A\&Z iZAAAAATA :ZAGC T G 3 GCT 3AAACCI AKTCCCCTGCTGrCTGGCCT GTrCAAASCGGCAGGCTCCTZ 3-ACGCTTGGCTCT TTCCCC AC C CCT ?J G G CCA&ZAT 'SGT G 'ZA z z" C C ZA z CAC T C c z&3 GACA'3G?iT G iZAAAAGA GGCT C Cř, GAGT Cí, G AGTGCCAAGCC^'5GGAAT^ČAGŤ5ČCAGaCTCAGAGCCCGGGCTTG AACCCCACrGCCCCACCAGAGCrGCCAGGGZ GGCACAGGGCCCC GTCCA3CCCCTGGTACACACTTCCCT SCCAGGCCrCAKCTCCAGCATAAGCTCCAGAGAGCCAGGGCCCATCAGZITCTCrTIGTGGACTTGTAI CTCAGCTCCAT GATGCCTTGGGCZTTCTGT CTCCTCAAC3AGAGTGCAGCZTGCTGAATGTCAGCTGCCZ G GA GAG C Z g g GGC C Z GACT TACTAGGGCATT JV?!AJ CTI A?vGA GGT CCTACT GA&STGT GGCA G5AT iZA C AGGCT^TGGAAAlAAGGGCAGGTCíGATGGGCSA^GCCCAGGACTTTC^ G G C :ZAAGCAT G3CA&3 GSGAFvb b Z CAG T G G gt GT CAAGAGAC C CAGGT CT GACC C C G3AT GT TTGCT C CA TGTGACAAAAGCAGGCCTGTCTCAGGACCTTTTCTTZTCTTTTTTCCTTCTTTTTTZTTTTG^.CACGGA TTCiZGCTCTTGTTGTCCAGGCTAGAGTGCAATGG^TX^TCCCA^ TTCAAATCAZ Z CTCTTGCCTCAGACTCCCGAGTAGCTGGBATTAT^GCACATGCCACCATGCCTGGCTA TYP REFERENČNÍ SEKVENCE • DNA • A,T,C,G • g. (genomická) vs c. (kódující) • RNA • a,u,c,g • r. • PROTEIN (většinou odvozeno) • jednopísmenné/třípísmenné zkratky amk Amino atid Three letter code One letter code Alanine ala A Argininc arg R Asparaginc asn N Aspartic acid asp D Cysteine cys C Glutamic acid glu E Glutamine gin Q Glycine gJy G Histidine* his H Isolcucine* ile I Leucine* leu L Lysine* lys K Methionine* met M Phenylalanine* phe F Pmline pro P Serine ser S Threonine* thr T Tryptophan* trp W Tyrosine tyr Y Valine* val V Baronaroeki.com BarortrDcks.com Barorwocks.com Essential Amino Adds ČÍSLOVÁNÍ REZIDUÍ nukleotid 0 neexistuje! -3-2-11234 začátek 1 • u genomické sekvence 1 = první nukleotid daného souboru • u kódující DNA 1 = A start kodonu ATG nepřekládané oblasti • před start kodonem ATG přidáváme mínus -3, -2, -1, A,T,G • za terminačním kodonem přidáváme * STOP, *1, *2, *3 GENOMICKÁ (g.) KÓDUJÍCÍ (c.) >HH_Ů0DO2Q . Z Homn sipitcia ictÍTÍn A receptor Lite type 1 (ACVRL1] , tranaciipt -.-^-iaiit lj niRHA aggaaacggz : zattaggag ^gp.gzz- ^tggagztggg; z>. :;gc:-.g r aagacgztgga:-.z aag a-j-.z z-.zz z T T GCT C CA G C CCC CA r CCCAGT C CCGGGA G gct GC C GCGC CAGCT GC GC c GAGC GA GCCC CT C OCCGGCT C CA 3 CC C GGTc CGG G G :Z TGC GC C CGGAC C C CAGC C C GCCGT C CAGCGCT G GCGGT GCAAC T G C GGC C G C g C GGTGGAG G G GAGG T G GCC C C GGT CC GC C GAAGGC ZA 3CGCC C :Z 3C CA C :Z :Z GCAGA GCGG GC C CAGAG G G MIC atg %CCT z GGGCCCCCCCAGGAAAGGCCTTCTGATGCTGCTXAVTGGCCTTGíTGACCCAGGGAGACC CTGTGi^CCGTCTCGGGGCCCGCTGGTGACiZTGCACGTGTGAGAGíCCACAT^ CC GGGGGGC CTGGT GCACAGTAGTGCT GGT GCGG GA G GAG G G GAGGCAC C CCCAGGAACAT C GGGGCT GC GGGAACTTGCACAGG^GCTCTGCAGGGGGiZGCCCCACCGAGTITO^ AÍCTCTGCAACCACAACGTGTCCCTGGTGCCGGA^GCCACCCAACCTCC^^ TGGCCAGCrGGCCCTGATCCTGGGCCCCGTGCTG^CCTTGCTGGCCCTGGTGGCCCTGG^ CT GTQGCAT GTCCGA C G3AG GCA gsag 7-J-. 3 CAGC G Z G3C CTG CA CAG C GA 5™I GGGAGAGT C CAGT CT HA TCCTGftAAGCATCTGAGCASGGCGAlCAGCArCTTGGGffiACC T G G :ZT CAG G GCTCCC HTT CC T GGTOCAGA g GAÍZAG T GGCAC GGCAGGT T g CCT T GGTGGAGT GTGT GGGA AAA GGCC GCTAT GGC GAAGT GT GGCGGGGCTT GT GGCACGGT GAGAGT GT GGCC G T CAAGAT iZTT CTCCT CGA3GGATGAACAGTCCTGGTTCCGGGAGACTGAGAT>CTATAACACA CCCAGGCTCCATCGCCZ ZAGACAZ GACCCCC:ZG^AA:ZTCGAG^CGÍZAGCTGTGGCT^^ CACGAGCACGGCTCCCT^ACGA:itttccg:ZAGAGA:ZAGACGCIGGA^ CTGTXTTCCGCGGCATG:ZGGCCTGGCGCAC:ZTGCACGTGGAGACC^^ T GC CCAC C G C GACT T CAAGAGC c GCAAT GT GTE GG T CAAGAGCAAC CTG CAGT GT T GCAT C GC CGAC C Z G GGCCTGGCTGTGATG^CTCACAGGGCAGCGATTACCTGG^ AKGGTA^TGGCACCCSAGGTGíITGGACGAGCAGATCCGí^G^ TGACATCTGGGCCTTTGQCCTG^TTQCTGTGGGMP.TZGCCCGCCÍKACCA GP.CZ AT AGACCACCCTZ TTATGAZ GTGGTGCCCAACGACCCCAGCTTTGAGGACACGAAGAAGGTGGTGT GT GTGGAT Cř. GCAG Ji C z z" c AC CAT CC CTAACCGGCTGGC T GCAGAC C C g GT CCT CTCAGGC CTAGCT CA G 5, z 3AT G C g g 3AGT G z z GGT AC C CAAAC C z z? CT G C CCGACT iZA'TC gc g CTGCGGATCAAGAA 3ACAC ZA CAAGJ^^TCAGCAACAGTCCAGAGAAGCCCAA.^TGATTCAACAK CCCGCAGGGGGCTGGGGGGGTGGGGGfiCAGTXKATGGTGCCCTATCTG^SG^ T G c GT GCT G g GGAT G G GCAG CT G CGCCT G c CT GCT C G3CC C c CA3CC iZA z z :A\&Z iZAAAAATA :ZAGC T G 3 GCT 3AAACCI AKTCCCCTGCTGrCTGGCCT GTrCAAASCGGCAGGCTCCTZ 3-ACGCTTGGCTCT TTCCCC AC C CCT ?J G G CCA&ZAT 'SGT G 'ZA z z" C C ZA z CAC T C c z&3 GACA'3G?iT G iZAAAAGA GGCT C Cř, GAGT Cí, G AGTGCCAAGCC^'5GGAAT^ČAGŤ5ČCAGaCTCAGAGCCCGGGCTTG AACCCCACrGCCCCACCAGAGCrGCCAGGGZ GGCACAGGGCCCC GTCCA3CCCCTGGTACACACTTCCCT SCCAGGCCrCAKCTCCAGCATAAGCTCCAGAGAGCCAGGGCCCATCAGZITCTCrTIGTGGACTTGTAI CTCAGCTCCAT GATGCCTTGGGCZTTCTGT CTCCTCAAC3AGAGTGCAGCZTGCTGAATGTCAGCTGCCZ G GA GAG C Z g g GGC C Z GACT TACTAGGGCATT JV?!AJ CTI A?vGA GGT CCTACT GA&STGT GGCA G5AT iZA C AGGCT^TGGAAAlAAGGGCAGGTCíGATGGGCSA^GCCCAGGACTTTC^ G G C :ZAAGCAT G3CA&3 GSGAFvb b Z CAG T G G gt GT CAAGAGAC C CAGGT CT GACC C C G3AT GT TTGCT C CA TGTGACAAAAGCAGGCCTGTCTCAGGACCTTTTCTTZTCTTTTTTCCTTCTTTTTTZTTTTG^.CACGGA TTCiZGCTCTTGTTGTCCAGGCTAGAGTGCAATGG^TX^TCCCA^ TTCAAATCAZ Z CTCTTGCCTCAGACTCCCGAGTAGCTGGBATTAT^GCACATGCCACCATGCCTGGCTA ČÍSLOVÁNÍ REZIDUÍ * introny - spec. označení pouze u kódující DNA • čísluje se ze strany, kde je exonu blíže • plus/mínus k poslednímu/prvnímu nukleotidu nejbližšího exonu -> v polovině intronu se + láme na -c.589+15, c.590-5 intron exon intron exon intron -1 -1-1 -1- c.589 c.590 t f_ UZIVANE ZNAČKY A ZKRATKY „+" u číslování nukleotidů „-" „mínus" u číslování nukleotidů „*" u číslování nukleotidů „až" označení rozpětí/rozsahu „[ ]" pro alely odděluje různé varianty nacházející se na jedné alele nebo alely UZIVANE ZNAČKY A ZKRATKY odděluje ozn. refseq od zápisu varianty označení nejistoty nebo predikcí označeni neznáme pozice označení substituce označení testované pozice beze změny UZIVANE ZNAČKY A ZKRATKY substituce delece duplikace inzerce inverze frame shift = posun čtecího rámce VYBRANÉ NEJCASTEJSI TYPY ZMEN jednoduché • substituce c.123a>g, „>" neužívá se no úrovni proteinu p.(Glnl82Leu) • delece c.l23del (c.l23delA), p.(Phe508del) • duplikace c.l23dup (c.l23dupA) • inzerce c.l23_124insT-rozsah + sekvence! komplexní • indel c.l23delinsGTAT * kombinace více variant • změna na obou alelách • více jak 1 varianta na 1 alele c.[123A>G];[456delC] c.[123A>G;456delC];[=] PŘÍKLADY: stop kodon -> protein • př. gen CFTR delece na DNA: c.2250delT -> posun čtecího rámce - změna amk + vznik terminačního kodonu p.(Arg751AlafsTer4) Wt 2247 GCC|CGCATCAGCGTGATCAGCACTGGCCCCACGCTTCAGGCACGAAGGAGGCAGTCTGT 2306 ProArglleSerValIleSerlleGlyProThrLeuGlnAlaArgArgArgGlnSer 750751752753754 c.2250delT 2247 GCCCGCATCAGCGTGATCAGCACTGGCCCCACGCTTCAGGCACGAAGGAGGCAGTCTGT 2306 ProAlaSerAlaSTOP 750751752753754 PŘÍKLADY: geny na chromozomu X MUZI • muži - pouze 1 alela (1 chromozom X, 1 chromozom Y) • c.[76A>G];[0] -> hemizygot ženy W x x • ženy-2 alely (2 chromozomy X) • c. [76A>G];[=] PRÍKLADY: více změn, cis/trans?? 1) detekovány 2 sekvenční varianty v poloze trans (na odlišných alelách) c.[2657+5G>A];[3528delC] 2) detekovány 2 sekvenční varianty v poloze cis (na stejné alele), druhá alela je beze změny c.[12C>G;21A>G];[=] PRÍKLADY: více změn, cis/trans?? 1) detekovány 2 sekvenční varianty, zda jsou v poloze cis nebo trans nevíme c.2657+5G>A(;)3528delC 2) detekovány 3 sekvenční varianty, u 2 víme, že jsou v poloze cis, u 3. nevíme c.[12C>G;21A>G](;)423dupG rada na závěr... POKUD NEVÍTE HLEDEJTE http://varnomen.hgvs.org/