Projekt ľudského genómu n Prehistória n História n Ciele n Metódy n Priebeh n Výsledky n Využitie n Perspektívy -------------------- základná www stránka: www.doegenomes.org Prehistória: Watson a Crick 1953 A STRUCTURE FOR DEOXYRIBOSE NUCLEIC ACID J.D.Watson F.H.C.Crick Nature, April 25, 1953 "It has not escaped our notice that the specific pairing we have postulated immediately suggests a possible copying mechanism for the genetic material" Genetika človeka v r. 1953 n hodnotenie rodokmeňov n štúdium dvojčiat n cca 50 monogénnych ochorení n 5 monogénnych znakov (ABO, Rh...) n 48 chromozómov n 5 miliónov génov n žiadna DNA (podľa učebníc) 60-te roky: cytogenetika človeka n 1956: 46 chromozómov n 1959: chromozómové aberácie a choroby n 1960: nomenklatúra a metodika n chromozómy a nádory n chromozómy: "orgán" lekárskej genetiky n ľudských génov jeden milión, o DNA stále ani zmienka... 70-te roky: žeby DNA? n polymorfizmy (sérové skupiny, izoenzýmy...) n väzba a chrom. lokalizácia n bunkové hybridy n biochemická genetika Ale už aj: n prvé RFLP v ľudskej DNA (1978) n DNA diagnostika chorôb (1979) n 100 000 génov Human Genome Project: história n 1986: Santa Fe - DoE Intl. Meeting n James Watson: "vystúpiť na cestu od dvojitej závitnice k 3 miliardám schodov ľudského genómu" n 1988: Kongres USA schválil 15 ročný projekt a dotáciu 3 mld USD n 1990: začiatok projektu n 2005: predpokladané ukončenie Koordinácia: 1988: HUGO (Human Genome Organization) HUGO Europe -- Americas - Pacific HGP: rozsah n 3 200 x 10^6 bp (dĺžka Dunaja v mm !) n dovtedy najdlhší sekvenovaný úsek: ľudská mtDNA (16 500 bp, 1981) n vtedajšia rýchlosť: 100 bp / osoba / deň n cena: 5 - 10 USD/bp Oficiálny začiatok HGP: 1990 n 20 pracovísk zo 6 štátov n 3 mld USD n cca 15 rokov práce (t.j. do r. 2005) História sekvenovania DNA HGP: ciele n Triangulovať genóm pomocou DNA markerov n Identifikovať a mapovať gény, určiť ich štruktúru a funkciu v zdraví aj v patológii n Identifikovať dôležité mimogénové sekvencie n Určiť úplnú sekvenciu genómu (3,2 Gb) n Všetky dáta uložiť vo verejne prístupných databázach n Sekvenovať genómy modelových organizmov (drozofila, myš, C. elegans, A. thaliana a i.) n Skúmať etické, legálne a sociálne aspekty Metódy mapovania Genetické mapovanie § rodokmeňová analýza (rekombinácia) § triangulácia pomocou markerov Fyzické mapovanie - nízke rozlíšenie: - hybridizácia somat. buniek - in situ hybridizácia (FISH) vysoké rozlíšenie: restrikčné mapovanie STS mapovanie EST mapovanie sekvenovanie Triangulácia ľudského genómu Genetické markery: história 1900 krvné skupiny cca 20 1960 sérové proteíny a izoenzýmy 10^2 1980 DNA RFLP 10^3 1985 minisatelity 10^4 1990 mikrosatelity 10^5 1995 SNP (single nt polymorphisms) 10^6 Triangulácia genómu: genetické mapy 1987 RFLP 402 nad 10 cM 1992 STR 813 cca 5 cM 1996 STR 5262 1,6 cM 1997 integrovaná 6800 0,7 cM podrobnejšia triangulácia nie je potrebná (v súčasnosti cca 2 x 10^6 mapovaných SNP) International Human Genome Sequencing Consortium HGP: hierarchická stratégia sekvenovania ("clone-by-clone") n triangulovať genóm pomocou STR n zostrojiť BAC-knižnice n mapovať klony do STR mapy n utvoriť BAC kontigy n štiepiť BAC-y náhodne na sekvenovateľné fragmenty n sekvenovať fragmenty n zoradiť do konečnej sekvencie klonu n zoradiť sekvencie klonov do definitívnej sekvencie n anotovať sekvenciu HGP: Francis Collins a Eric Lander Nárast údajov o sekvencii 1996-2001 Craig J. Venter a Celera Genomics Stratégia sekvenovania: Celera Genomics n Celogenómová shotgun stratégia sekvenovania n Skombinovanie s dátami HGP n Utvorenie knižníc s definovanými dĺžkami (2,10,50 kb) HGP v Bielom Dome, jún 2001 F. Collins a C. J. Venter 2001 Sekvenované eukaryo genómy Prehľad ľudského genómu: Celera n Dĺžka sekvencie 2,91 Gb n Podiel GC párov 38 % n Podiel repetitivnej DNA 35 % n Počet anotovaných génov 26 383 n Celkový počet génov (odhad) 39 114 n Priemerná dĺžka génu 27 kb n Najviac génov v chromozóme 19 (23g./Mb) n Najmenej génov v chromozóme 13 a Y (5/Mb) n Gény tvoria 25,5-37,8 % n Exóny tvoria 1,1 -- 1,4 % n Výskyt SNP 1 : 1250 bp Nature 431, 931 - 945 (21 October 2004); doi:10.1038/nature03001 Finishing the euchromatic sequence of the human genome INTERNATIONAL HUMAN GENOME SEQUENCING CONSORTIUM http://vega.sanger.ac.uk/Homo_sapiens/ www.ensembl.org Dokončená sekvencia (2004): základné údaje n pokrýva 2,85 Gb; celý genóm má 3,08 Gb n pokrýva > 99% euchromat. genómu n sekvenačné chyby zriedkavejšie ako 1 : 100 000, priemerné pokrytie 11-násobné n len <350 medzier (väčšinou heterochrom. úseky a vysoko repetitívne sekvencie) n 20 000 -- 25 000 proteíny kódujúcich génov (22 287) n priemerne 9 génov na Mb; veľká variabilita n 232 000 exónov; v priemere 10,4 exónu na gén; exóny tvoria len 1,2% dĺžky sekvencie n identifikovaných cca 20 000 pseudogénov, asi ich je viac ako génov n segmentové duplikácie tvoria 5,3% euchromatickej sekvencie ("evolutionary gene nurseries") n ale pozor: anotácia sekvencie stále ešte nie je dokončená! Počet génov u rozličných organizmov n Človek okolo 25 000 n Caenorhabditis elegans okolo 20 000 n Drosophila melanogaster 14 000 n E. coli okolo 6000 Chromozóm 12: Mb/cM Segmentové duplikácie v ľudskom genóme HGP: možnosti využitia n Etiológia genetických a nádorových ochorení n Diagnostika monogénnych a nádorových ochorení n Diagnostika multifaktoriálnych ochorení n Génová terapia (genetických a nádorových ochorení) n Cielená liečba ("molekulárna farmakológia") n Štúdium biologických funkcií na molekulárnej úrovni (diferenciácia, starnutie ...) n Evolúcia človeka a pôvod ľudských populácií n Nosce te ipsum: podstatný krok k poznaniu biológie nášho druhu n Podstatná časť práce je ešte len pred nami