512 VESMÍR 77, září 1998 l http://www.cts.cuni.cz/vesmir
Molekuly
na povel V.
Čtení (genomu) na dobrou noc
ZUZANA STORCHOVÁ
Mgr. Zuzana Storchová (*1970) viz
Vesmír 77, 15, 1998/1
Každý organizmus potřebuje pro to, aby vypadal
a fungoval tak, jak má, nějaké pokyny, informaci. Tato
informace je z podstatné části zapsána v pořadí bází
nukleové kyseliny. Podle genů, tedy konkrétních úseků
nukleové kyseliny, se vytvářejí bílkoviny – pořadí
bází je pomocí určitého kódu, společného všem organizmům,
převedeno na posloupnost aminokyselin
v bílkovině. Pořadí neboli sekvence bází také do značné
míry charakterizuje vlastnosti jednotlivých oblastí
DNA – jinak vypadá místo, kde je zahajována replikace,
a jiné sekvence najdeme na koncích chromozomu.
Oblast DNA s určitou typickou sekvencí bází
také například určuje, jak silně bude nějaký gen exprimován
čili kolik molekul příslušné bílkoviny podle
předpisu toho genu vznikne. Mnozí proto podlehli
dojmu, že právě sekvence genomu organizmů je to
jediné důležité, co nám o daném organizmu řekne
všechno. Ať už je toto tvrzení pravdivé nebo ne, je
jisté, že nedávno zahájené velkoakce sloužící
k zjišťování pořadí bází v chromozomech různých organizmů
poskytnou vědecké komunitě množství neocenitelných
informací a komunitě laické řadu výhod
(možná i nevýhod) plynoucích z možností využití získaných
znalostí. K nejznámějším projektům patří akce
HUGO, jejímž cílem je zjistit nukleotidovou sekvenci
všech lidských chromozomů. Občas se v novinách
objeví zpráva typu Čtení genetického kódu či Genetický
kód člověka rozluštěn atp. Lžou vám. Genetický
kód – čili kód, podle nějž se informace zapsaná pořadím
nukleotidů v nukleových kyselinách převádí na
informaci zapsanou pořadím aminokyselin v bílkovině
– člověka i jakéhokoliv jiného organizmu byl rozluštěn
před dobrými 30 lety. Monstrózní projekt zmiňovaný
v novinách se týká „pouze“ zjištění pořadí bází
ve všech chromozomech člověka a řady dalších organizmů.
S genetickým kódem
nemá nic společného.
Čtení chromozomů, čili zjišťování
pořadí nukleotidů v daném
úseku DNA, není nic jednoduchého.
V projektu HUGO (a řadě
dalších) je zapojeno množství
odborných pracovníků, a přesto
jednotlivé projekty trvají několik
měsíců až let. Metod, které
umožňují zjistit sekvenci nukleotidů
v DNA, je několik, ale
v poslední době převážila jediná.
Jejím autorem je Frederick Sanger
a byl za ni po právu odměněn
Nobelovou cenou (spolu
s Paulem Bergem a Walterem
Gilbertem, kteří vypracovali
méně používané techniky sekvencování).
Je neobyčejně rafinovaná,
a přesto elegantně jednoduchá
(ostatně takové je
v molekulární biologii všechno).
Co všechno k sekvencování
potřebujeme
Sangerova enzymatická metoda
zjišťování pořadí nukleotidů
v molekule DNA vychází opět
pouze a jedině z nám dobře
známých fyzikálních a chemických
vlastností DNA a z funkcí
enzymů, které s DNA zacházejí.
Pokud si vzpomínáte, syntézu
DNA zahajuje enzym DNApolymeráza
pouze z primeru,
tedy z krátké molekuly nukleové
kyseliny. Na tento primer
navěšuje nové nukleotidy v po-
1
http://www.cts.cuni.cz/vesmir l VESMÍR 77, září 1998 513
řadí od 5´ konce k 3´ konci, čili na skupinu OH předchozího
nukleotidu napojí fosfátovou skupinu nukleotidu
dalšího podle kopírované matrice. K tomu,
aby DNA-polymeráza mohla pracovat, potřebuje tedy
vhodné prostředí, primer, matricovou DNA a prekurzory
syntézy, v tomto případě deoxyribonukleosidtrifosfáty
(nenechte se vyděsit složitým názvem –
důležité je, že z tohoto prekurzoru DNA-polymeráza
vše nepotřebné odštípne a na vznikající řetězec připojí
tu správnou část). Představme si ale, že DNApolymeráze
nabídneme místo prekurzorů, které po
připojení přes fosfátovou skupinu zůstanou do prostoru
trčet volným koncem OH připraveným k dalšímu
spojování, nějaké prekurzory jiné, které už nebudou
ochotny se s něčím dalším spojovat. Takovými
prekurzory s odštěpenou skupinou OH jsou dideoxyriobonukleosidtrifosfáty,
a ty jsou také tím posledním,
co na nově vznikající řetězec může DNA polymeráza
připojit. Pro další syntézu totiž chybí ocásek
OH, a tak není možné pokračovat.
Tento experiment je vám nepochybně jasný a stejně
nepochybně asi nechápete, k čemu jsou takové triky
dobré. Inu, pro sekvencování! Vezměme si úsek
DNA, jehož pořadí bází chceme znát, a primer, z nějž
můžeme syntézu nového řetězce, komplementárního
k původnímu, začít. Matricovou DNA (tu, kterou
chceme číst) denaturujeme a v jednořetězcovém stavu
smísíme s primerem. Primer nasedne na komplementární
místo a přidáme-li do směsi i DNA-polymerázu
a všechny prekurzory, syntéza může začít.
To my ovšem neuděláme, neboť by nám to bylo k ničemu.
Místo toho takto připravenou směs rozdělíme
do čtyř zkumavek, do každé z nich přidáme polymerázu
a prekurzory, ale pozor! Do každé zkumavky
dáme vždy jenom tři správné prekurzory a 4. prekurzor
(pro každou zkumavku jiný) připravíme tak,
že bude např. 90 % toho správného a 10 % toho, co
se na něj už nedá nic navěsit.
Proč bude čtvrtý prekurzor v reakční směsi přítomen
v obou formách? Kdybychom už od začátku přidali
do zkumavky pouze onen stopovací prekurzor, zastavila
by se nám výroba nového vlákna DNA na tomto
prvním zařazeném nukleotidu. Pokud však připravíme
prekurzor „stopovací“ a prekurzor „pokračovací“
ve správném poměru, zařazuje se stop-prekurzor
jenom občas. A tak vznikají během syntézy
vlákna nejrůznějších délek, která však vždy končí
tím příslušným „stopovacím“ prekurzorem. Nastavíme-li
poměry obou typů prekurzorů správně, získáme
vlákna všech délek vytvořená podle naší oblíbené
DNA, jejíž sekvenci si chceme po večerech číst.
A protože máme 4 zkumavky a v každé je jiný stopovací
prekurzor, získáme ve velmi krátké době:
A) všechna možná různě dlouhá vlákna DNA vytvořená
z primeru podle části matricové molekuly,
v nichž poslední báze je adenin,
G) všechna možná různě dlouhá vlákna DNA vytvořená
z primeru podle části matricové molekuly,
v nichž poslední báze je guanin,
C) všechna možná různě dlouhá vlákna DNA vytvořená
z primeru podle části matricové molekuly,
v nichž poslední báze je cytozin a
T) všechna možná různě dlouhá vlákna DNA vytvořená
z primeru podle části matricové molekuly,
v nichž poslední báze je tymin.
Pokud vám to přece jenom není úplně jasné, prohlédněte
si důkladně obrázek 1, kde je detailně zpracována
situace z případu G.
A jdeme číst!
Máme čtyři různé reakční směsi a v každé z nich je
kromě matricového vlákna spousta nových, různě
dlouhých vláken, a ta vždy v každé zkumavce končí
jedním konkrétním nukleotidem – buď A, nebo G,
nebo C, nebo T. Délky jednotlivých vláken ze všech
směsí se při sekvencování liší o jeden jediný nukleotid!
Musíme tedy připravit takový systém, abychom
od sebe oddělili i vlákna, která se délkou liší o tento
nejkratší možný úsek. To lze provést při speciální
polyakrylamidové elektroforéze (viz Vesmír 77, 372,
1998/7), kde se jednořetězcové molekuly DNA pohybují
v mimořádně tenkém gelu od záporné elektrody
ke kladné a dělí se podle své velikosti – nejrychleji
putuje nejmenší molekula, zatímco vlákno dlouhé se
líně batoumá gelovými zákruty. Na elektroforéze necháme
proběhnout naše reakční směsi – každou zvlášť
– při napětí obvykle kolem 1500–2000 V. V těchto
podmínkách se od sebe oddělí i molekuly, jejichž velikost
se liší o jediný nukleotid. Zviditelnění jednotlivých
proužků však není jednoduché. Nemůžeme použít
klasické barvení nějakou málo citlivou interkalační
barvičkou, jak se to dělá při běžné elektroforéze,
neboť sekvenační elektroforézu podstupují jednořetězcová
vlákna DNA a interkalační barvička se nemá
kam vmezeřit (interkalovat). Proto se už při syntéze
používají prekurzory, které jsou radioaktivně označeny
(k dostatečnému signálu stačí použít jenom jeden
typ prekurzoru radioaktivně značený) a vyzařují
ionizující záření, takže každé vzniklé vlákno a následně
i každý proužek DNA určité velikosti na gelu „svítí“.
Gel se pak po elektroforéze „jednoduše“ plácne na
film a kde je na gelu molekula vlákna příslušné délky,
tam vznikne na filmu černý proužek (obr. 2). Po
vyvolání filmu si pak badatel vezme silnou lampu,
pravítko a zapisovatele, načež proužek po proužku
odečítá jednotlivé báze v molekule. Co na tom, že odečtená
sekvence neodpovídá původní molekule! Zato
čteme báze k matrici komplementární – ve dvouřetězcové
DNA nám stačí znát jeden řetězec, druhý si
podle zákona párování vymyslíme sami. Důležité je,
že jsme opět pouze s využitím enzymů metabolizmu
nukleových kyselin a jednoduchých fyzikálně-chemických
vlastností DNA získali informaci o pořadí bází
v dané molekule. (Pro šťouraly: postup používaný
v praxi se maličko liší od výše uvedeného, princip však
zůstává stejný.)
Až budeme mít všechno přečtené ...
Ohromný rozvoj molekulární biologie a genetiky
v posledních letech vede k získávání mimořádného
514 VESMÍR 77, září 1998 l http://www.cts.cuni.cz/vesmir
množství nových poznatků
a tím na principu pozitivní
zpětné vazby umožňuje
další zrychlení sebe
sama. Téměř každý nový
objev totiž může být využit
k dalším studiím, které
přinesou nový objev,
který může být využit
k novým studiím, které...
Bouřlivý vývoj molekulární
biologie přivedl badatele
do stavu, kdy se i velmi
smělé plány zdají být realizovatelné.
Jedním z nejambicióznějších
programů
je HUGO, mezinárodní
program zjištění úplné
sekvence lidského genomu,
k němuž se připojila
řada dílčích podprogramů
sekvencování genomů
mnoha dalších organizmů
(viz Vesmír 76, 163,
1997/3). Při řešení tohoto
úkolu se objevují problémy
nejen vědecké a technické,
ale i společenské,
s nimiž si již dnes,
několik let před dokončením
programu, lámou
hlavy právníci, sociologové
i pojišťovací agenti
(a těm je taky, alespoň zatím,
přenecháme). Náročné
technické problémy,
které se při řešení tohoto
úkolu vynořily, donutily
badatele zdokonalit metodu
sekvencování až k hranicím
představitelnosti.
Výše popsané klasické
ruční sekvencování je totiž
značně časově náročné
a může je provádět pouze
dovedný molekulární biolog.
Na jednom gelu je možné zpravidla analyzovat
6–8 sekvencí dlouhých od 200 do 500 nukleotidů –
podle konkrétních podmínek. Lidský genom obsahuje
zhruba 5x109
párů bází, a aby byla zjištěná sekvence
dostatečně hodnověrná, je třeba ji správně přečíst
nejméně dvakrát. V optimálním případě by tedy
bylo zapotřebí provést 3,5 milionu gelových analýz
sekvence. Evidentní nemožnost tohoto úkolu pomohla
na svět automatickému sekvenátoru – přístroji,
který dělá (skoro) všechno sám. Princip sekvencování
zůstává stejný, nepoužíváme však radioaktivní
značení, ale každý stopovací prekurzor je označen
jinou fluorescenční barvičkou. Reakce probíhá se
všemi prekurzory („stopovacími“ i „pokračovacími“)
v jediné zkumavce, a poté je směs nanesena do jediné
kapiláry s předpřipraveným gelem optimálních
dělicích vlastností. Vzniklé jednotlivé různě dlouhé
a různě „barevně“ označené molekuly pak putují
v elektrickém poli od – k + a na konci z kapiláry,
správně podle velikosti rozdělené, vyputují. Přímo
v bodě, kde kapiláru opouštějí, však musí označené
molekuly projít svazkem laserových paprsků, který
umožní detektoru „odečíst“ jejich barvu a poslat ji
počítači. Ten pak každé „barvě“ sám přiřadí příslušný
nukleotid a badateli nahlásí rovnou celou sekvenci
(obr. 3). Akce je tak zjednodušena a zrychlena,
že se ze sekvencování stává příjemná odpolední
zábava místo vysilujícího celodenního programu
s nejistým výsledkem.
Ani automatický sekvenátor však neumožňuje sekvencovat
najednou libovolně dlouhou molekulu. Jed-
2. Sekvence přečtená pomocí
ručního sekvencování. V každé
dráze byla rozdělena jedna reakční
směs, čtyři dráhy společně
poskytují informaci pro celou
sekvencovanou molekulu.
3. Výsledek sekvencování pomocí automatického sekvenátoru. Počítač
data shromažďuje a ihned vyhodnocuje. Případné nejednoznačnosti
(např. překrývají-li se dva vrcholy atp.) musí ovšem rozhodnout
člověk nebo další sekvencování.
ním z nejnáročnějších úkolů se tak při čtení pořadí
nukleotidů v DNA stává příprava fragmentů pro sekvencování
včetně udržení pořádku při sestavování
získaných sekvencí dohromady. V praxi to vypadá
tak, že každá laboratoř zapojená do projektu „obdrží“
k sekvencování určitý úsek DNA, který si rozdělí
na řadu dalších vzájemně se překrývajících molekul
DNA. Ty pak postupně sekvencuje a překrývající části
využívá k sestavování celé molekuly dohromady.
Do projektu HUGO a řady dalších sekvenačních projektů
je celosvětově zapojeno množství pracovišť. Informace,
které díky nim získáme, bude možno využít
nejen v diagnostice dědičných chorob, k objevu
nových genů či nových regulačních oblastí v genomu.
Zjištěná data jsou neméně důležitá a přínosná pro
systematické a evoluční biology, kteří mohou využít
sekvenci DNA jako další ze znaků pro určování příbuznosti
druhů. Neočekávané jsou údaje, které ze
sekvence DNA zjišťují matematici – objevují další
informační roviny v molekule DNA, které mohou její
fungování značně ovlivnit. Asi málokdo si dovede do
všech detailů představit důsledky tohoto monstrózního
projektu. Jedno je však skoro jisté – životu díky
tomu lépe rozumět nebudeme. p
INZERCE