Moderní metody analýzy genomu Úvod Čipové technologie 23.9.2016Jitka Malčíková Moderní metody analýzy genomu - sylabus 23.9. Úvod, příprava vzorků Čipové technologie: expresní, CGH, SNP a proteinové čipy (Malčíková) 7.10. Sekvenování nové generace (NGS) – technologické aspekty různých NGS platforem (Tichý) 21.10. Příprava knihoven pro sekvenování nové generace (Tichý) 4.11. Metody pro analýzu nekódujících RNA – miRNA, lncRNA (Mráz) 11.11. Analýza dat I (Tom) 25.11. Analýza dat II (Pál) 9.12. Aplikace - Využití moderních technologií, design experimentů (Trbušek) 2 Ukončení  Test na internetu  Alespoň polovina správných odpovědí 3 Trocha historie - Kompletní diploidní sekvence konkrétního člověka -J.C. Venter - Sangerovo kapilární sekvenování - Institut J. C. Ventera - Cena 100 millionů $ (Levy, S., et al. PloS Biol 2007) - James Watson - Sekvenování nové generace - Baylor College, Texas - Osekvenováno za 4 měsíce - < 1,5 millionu $ - "the first of the rest of us" (Wheeler, D.A., et al. Nature, 2008) Publikování sekvence lidského genomu PCR 1983 20011996 2007 První individuální genom 2008 1. Microarray Analýza exprese 45 genů Arabidopsis 1995 Affymetrix GeneChip Druhý individuální genom 2010 Projekt 1000 genomů 1. komerčně dostupný NGS sekvenátor 2005 4  „large-scale“  Co nejširší  Exom, genom, tisíc genomů  „ultra-deep“  Co nejhlubší  Jednotlivé buňky a molekuly 2016 Lidský genom možno osekvenovat za 50 hodin a pod 1000 $ 5  Interpretace  „Unsolicited findings“ – nevyžádané nálezy  Informované souhlasy  Komerční „direct-to-concumer“ (DTC) genetic testing Úskalí 6 Genom (3.2 x 109 bp, < 20 tis genů) Transkriptom Proteom (miliony proteinů)  Dynamický systém – odráží momentální stav buňky  Hladina proteinu často nekoreluje s hladinou mRNA  Transkripce  Posttranskripční modifikace  Alternativní sestřih  Translace  Posttranslační modifikace  Alternativní konformace Variabilita 7 PŘÍPRAVA VZORKU 8 Kvantifikace  Nanodrop  Spektrofotometrická kvantifikace nukleových kyselin A260  Měření čistoty:  A260/280 1.8-2.0 (<1,8 kontaminace proteiny)  A260/230 >2.0 (<2 kontaminace organickými látkami)  Qubit  Fluorometrická kvantifikace  Specifické značení dsDNA, RNA, proteinů 9 Kontrola kvality  Elektroforéza  „Lab on a chip“  Bioanalyser  Analýzy integrity RNA  RIN – RNA integrity number – poměr 28S a 18S rRNA  Nevhodný pro gDNA 10 Kontrola kvality  Tapestation  Umožňuje analyzovat i gDNA  DIN - DNA integrity number  Stanovení na základě distribuce signálu v celém rozsahu velikostí fragmentů  Fragment analyzer... 11 ČIPOVÉ TECHNOLOGIE 12 Princip čipových technologií  Princip – sondy vázané na nosný podklad  Různé dělení podle  Aplikace (genotypizace; exprese RNA, proteinů; epigenetika…)  Technologie výroby (in situ syntéza; deponování)  Typu sond (umělé chromozómy – BAC, PAC; cDNA; oligonukleotidy)  Značeni (fluorescence – jedno/více-kanálové; autoradiografie, chemiluminiscence) 13 Nosný podklad  Sklo  Mikroskopické sklíčko (25 x 75 mm)  Speciální formáty  Různé úpravy povrchu – aminosilan, epoxy atd.  Nylonová nebo nitrocelulózová membrána  Plast, gel  Mikrokuličky  BeadArrays® (Illumina)  xMAP (Luminex) 14 Aplikace  Analýza genomových aberací, genotypizace  CGH, SNP čipy  Resekvenační čipy  Epigenomika  Mapování vazby proteinů na DNA (ChIP-on-chip)  Mapování metylované DNA (MeDIP-chip)  Exprese  mRNA, miRNA  Proteiny  Buňky, tkáně 15 Kvantifikace, kontrola kvality Čipová analýza Amplifikace a značení Příprava čipu Hybridizace materiálu (RNA,proteinů…) s čipem Skenování čipu Analýza dat, statistické zpracování Izolace DNA, RNA, proteinů… 16 ČIPY PRO ANALÝZU GENOMU  Výchozí materiál - genomová DNA  Detekce nebalancovaných genomových změn  Amplifikace, delece – CNV – copy number variations  Nedetekuje balancované chromozomální translokace  Array CGH  Detekce uniparentální dizomie, genotypizace  SNP čipy  Detekce mutací, polymorfismů  Resekvenační čipy 17 CGH - komparativní genomová hybridizace Kohybridizace značené DNA vzorku a kontrolní DNA www.advalytix.com (Beckman Coulter) na sondy navázané na sklíčku  array CGH – čipová technologie na normální metafázní chromozomy  Klasická CGH, HR-CGH  Metoda molekulární cytogenetiky 18 Rozdělení aCGH podle typu sond  Délka a hustota pokrytí DNA sond určuje rozlišení čipu  Úseky genomové DNA vložené do vektorů  YAC (Yeast Artificial chromosome) - 200 -1000 kb  BAC (Bacterial Artificial chromosome) - 50–200 kb  PAC (Phage Artificial chromosome) - 75-200 kb  Kosmidy – 30-40 kb  Rozlišení ~ 1Mb  cDNA - 1-2 kb  Pouze genové oblasti  Horší schopnost detekce jednokopiových změn  Rozlišení - 1-2 kb  Oligonukleotidy - 25-85 bazí  Rozlišení - pod 1 kb19  Cílené  Analýza vybraných „hot spot“ oblastí spojených s konkrétním onemocněním  Chromozomové  Celogenomové  Sondy rozmístěné  Rovnoměrně po genomu  V určitých intervalech  Tilling arrays – sondy se překrývají – vysoké rozlišení Davies et al., 2005 Rozdělení aCGH podle analyzované oblasti 20 Výsledky aCGH Delece 9pIzochromozom 17 Delece + amplifikace Krátká delece mono a bialelická 21 SNP čipy  Čipy umožňující rozlišit nejen CNV, ale i SNP  Sondy pro detekci CNV jako u CGH čipů + sondy speciálně navržené pro detekci SNP  SNP – jednonukleotidové polymorfismy  Určení alelového statusu, haplotypu  Genotypizace, asociační studie  Detekce uniparentální dizomie www.marshall.edu 22 Uniparentální dizomie (UPD) = CN LOH – copy neutral loss of heterozygozity  Vrozená, získaná  Heterodisomie vs isodisomie  Vyskytuje se u řady onemocnění mutace monozomie trizomie UPD Normální karyotyp * 23 Princip SNP čipů - Affymetrix  25b sondy, záměna 13. nukleotidu - největší vliv na sílu vazby při neshodě  Jednobarevná detekce  na čip se hybridizuje pouze označená testovaná DNA 24 Princip SNP čipů - Illumina  1x 50b, single base extension; pouze A/G, A/C, T/C, T/G (dvoubarevná metoda)  2X 50b, allele specific extension 25 Princip SNP čipů - Agilent  60b, SNPs pouze v místech rozpoznávaných restrikčními endonukleázami 26 Výsledky SNP čipů Amplifikace + delece Uniparentální dizomie 27 Výsledky SNP čipů - genotypizace SNP Array → 28 Využití CGH, SNP čipů  Nádorová genomika  V nádorových buňkách často změny genomu – primární i sekundární  Klinická genetika  Přesnější charakterizace mikrodelečních syndromů  Identifikace genomových změn u pacientů s mentální retardací i jinými vrozenými postiženími  Prenatální a preimplantační screening  Sure24  Karyomapping – i vyšetření rodičů  Diagnostika monogenních onemocnění a zároveň screening aneuploidií  Asociační studie – asociace SNP i CNV s řadou onemocnění (revmatoidní artritida, diabetes, nádorová onemocnění, psychiatrická onemocnění)  Evoluční studie 29 Resekvenační čipy  Affymetrix  Stejný princip jako detekce SNP  SNP = testovány 2 varianty X resekvenování = testovány 4 varianty  APEX  Arrayed Primer EXtension  Prodloužení sondy o jeden nukleotid komplementární ke vzorku  4-barevná technologie – nutné speciální vybavení 30 Resekvenační čipy – hudba minulosti  Paralelní sekvenace více oblastí  Detekce mutací, na které je čip navržen  Screeningová metodika  Custom arrays – nutno ověřit Sangerovým sekvenováním  Komerčně dostupné „diagnostické“ čipy  Roche – platforma Affymetrix  Cytochrom P450  FDA approval, CE-IVD  Není nutné ověřovat výsledek  Jen 1 gen , ale velmi rychlé, „user friendly“ (protokol max 2 dny)  APEX  Dostupné čipy pro konkrétní geny + možný vlastní design  Nutné ověřit sekvenací  Research use only31 ChIP-on-chip (Chromatin immunoprecipitation)  Mapování vazby proteinů na DNA  Např. transkripční faktory MeDIP-chip (Methyl-DNA immunoprecipitation)  Stejný princip – imunoprecipitace s protilátkou proti 5-metyl-cytosinu32 EXPRESNÍ ČIPY Buňky sledovanéBuňky kontrolní 33 Historie  1987 Kulesh et al. - cDNA knihovna na papírovém filtru  Přelom 80./90. - E. Southern – in-situ syntéza oligonukleotidů  1991 – Fodor et al. - světlem řízená paralelní syntéza  1995 – Schena et al. - cDNA expresní microarray  1996 – lidská cDNA microarray  1997 – celogenomová (kvasinka) - cDNA microarray  1997 – celogenomová (kvasinka) - oligonukleotidová microarray 34 Expresní čipy - typy  Studium exprese mRNA (miRNA)  Exonové (whole transcript)  Cílené – konkrétní dráhy, diagnózy  High- i low- density  Sondy – krátké i dlouhé oligonukleotidy, cDNA  Sklíčka, cartridge, mikrokuličky, membrány  Jedno- a dvou- kanálové 35 Postup  Přepis RNA  Oligo-dT priming  Kvalitní RNA  3' biased sondy  Random priming – hexa-, okta-, nona-mery  I degradovaná RNA  Celý transkript  Značení - fluorescence  Hybridizace, odmytí  Skenování  Analýza dat  Zpracování obrazu  Normalizace  Klastrová analýza (supervised, unsupervised)  Integrace s dalšími daty – gene ontology, genové interakce, funkční vztahy 36 Výsledky  Identifikace genů rozdílně exprimovaných u konkrétních skupin vzorků  Ověření pomocí real-time PCR geny vzorky 37 Využití  Studium efektů stimulů na genovou expresi  Chemikálie (např. léčiva)  Fyzikální faktory (záření)  Gene knock-out (siRNAm, CRISPR)  Genová transfekce (např. transkripční faktory, mutantní alely)  Studium rozdílů mezi vzorky  Tkáně a orgány  Diagnózy  Studium biomarkerů – diagnostické, prognostické, prediktivní 38 Využití  Komerčně dostupné pro in vitro diagnostiku  FDA cleared / IVDMA (In Vitro Diagnostic Multivariate Index Assays)  MammaPrint®  Stanovení rizika metastázování po chirurgickém odstranění nádoru prsu u pacientek v časných stádiích  Nízké riziko – hormonální terapie X vysoké riziko – agresivnější léčba (chemoterapie)  70 genů  Tissue of Origin Test  Identifikace původu nádorů – metastáze, nediferencované nebo málo diferencované nádory  > 2000 genů  Řada dalších bez certifikace pro IVD (ColoPrint….) 39 PROTEINOVÉ ČIPY  Expresní  Stanovení přítomnosti a koncentrace proteinů v komplexních vzorcích  Protilátkové čipy  Lyzátové čipy  Antigen čipy  Funkční  Studium interakce proteinů s jinými molekulami  proteiny, peptidy, nízkomolekulární látky, oligosacharidy, DNA 40 Princip proteinových čipů  Vazba protilátka-antigen - mikrospot ELISA (EnzymeLinked ImmunoSorbent Assay)  Systém využívající malé množství vázané protilátky a malého objemu vzorku je citlivější než systém se stonásobně větším objemem materiálu  Citlivost řádově ve femtomolech - 106 molekul/ml  Stanovení koncentrace analytu ve vzorku  Koncentraci přímo odpovídá množství vázaného analytu (Ekins RP, J Pharm Biomed Anal. 1989) 41 Princip proteinových čipů  Stovky – tisíce proteinů imobilizovaných ve formě mikrospotů na pevném povrchu  Membrány (polystyrenové, PVDF - polyvinyliden fluorid, nitrocelulosové)  Standardní mikroskopická sklíčka  S chemicky modifikovaným povrchem (poly-lysin, aldehydické skupiny)  Potažená membránou  Kuličky  Detekční metody  Nejčastěji fluorescence  Enzymaticky – značení alkalickou fosfatázou, křenovou peroxidázou  Chemiluminiscence  Radioaktivita  Zvýšení signálu – značení biotinem – vazba na značený streptavidin  Hmotnostní spektrometrie42 Bead array - mikrosféry  Průměr ~ 10 μm (velikost lymfocytu)  Polystyrenové nebo latexové kuličky  „Kódovány“ rozdílnými barvami nebo velikostmi  Detekce - např. flow cytometricky  Rozpoznávání rozdílně kódovaných mikrosfér  Identifikace a kvantifikace proteinů ve vzorku  Množství stanovovaných proteinů je limitováno počtem druhů mikrosfér (~1000)  Značení Quantum dots - teoreticky až 40 000  Možnost automatizace  Luminex xMAPTM - otevřený systém www.lucerna.chem.ch 43 Protilátkové čipy  Přímý formát (FPA- forward phase arrays)  Na povrchu spotované protilátky  Inkubace se vzorkem  Detekce stovek antigenů ve vzorku  Expresní profilování – „large-scale“ monitorování proteinové exprese  Cílené na určité buněčné procesy (buněčný cyklus, cytokiny…) Lyzátové čipy  Zpětný formát (RPA – reverse phase arrays)  Na povrchu spotované vzorky (proteinové, tkáňové lyzáty, sérum)  Inkubace se specifickými značenými protilátkami  Srovnání exprese až desítek antigenů u stovek různých vzorků  Nevýhoda – malá hustota studovaných molekul ve spotu – pre-frakcionace pomocí 2D kapalinové chromatografie Možnost dvoubarevné detekce Vyšší citlivost a specifita Čipy pro stanovení antigenů Xiaobo et al. 2010 Xiaobo et al. 2010 Sendvičová metodaPřímé značení 44 Čipy pro stanovení protilátek Antigen čipy  Na povrchu spotované známé antigeny  Syntetické proteiny, peptidy  Inkubace se sérem obsahujícím studované protilátky  Detekce přítomnosti protilátek ve vzorku, nejčastěji v séru Xiaobo et al. 2010 45 Buněčné čipy  Přímý formát  Spotované protilátky  Inkubace s buněčnou suspenzí  „Transfekční čipy“ - buňky rostou na povrchu čipu s naspotovanou cDNA  Během růstu přijmou cDNA  Čip se spoty buněk exprimujících různé cizorodé proteiny  Detekce  Přímo mikroskopicky na sklíčku  Další charakterizace značenými protilátkami 46 Tkáňové čipy  Varianta RPA čipů (zpětný formát)  Spotují se celé vzorky tkání např. bioptických  Inkubace se značenými protilátkami  Velikost spotu 0,6 - 2mm 47 Funkční čipy  Studium interakce s jinými molekulami  Inkubace s jinými proteiny, DNA, malými molekulami (oligosacharidy, terapeutika, …)  Studium posttranslačních modifikací  Studium enzymatické aktivity  Studium kofaktorů a inhibitorů  Studium interakcí ligand-receptor 48 Spotovány nativní proteiny  Potřeba zachování struktury a biologické aktivity  Nespecifická vazba přímo na povrch  Adsorpce  Kovalentní vazba přirozených chemických skupin proteinu na upravený povrch  Aktivní část proteinu může být schovaná, problém zachování konformace  Chemoselektivní vazba – připojení chemické skupiny na definovanou pozici proteinu → specifická reakce s komplementární chemickou skupinou na povrchu sklíčka  Orientovaná pozice na sklíčku  Imobilizace přes specifický rekombinantní tag  Zachování orientace, konformace, funguje jako „spacer“ 49 Další typy funkčních čipů  Doménové čipy  Spotovány pouze jednotlivé domény proteinu  Pochopení protein-proteinových interakcí  Peptidové čipy  Inkubace s proteiny, DNA, malými molekulami (oligosacharidy, terapeutika, …)  Čipy s chemickými knihovnami  Inkubace s proteiny (enzymy, receptory…)  Studium inhibitorů, studium ligand-receptorových interakcí- vyhledávání terapeutik 50 Typ čipu Molekuly imobilizované na čipu Stanovované molekuly Inkubace Počet spotů Použití expresní protilátkové (přímý formát) známé protilátky antigeny neznámý vzorek proteinový lyzát  1000 proteinové profilování lyzátové (zpětný formát) neznámý vzorek - proteinový lyzát antigeny známé protilátky 1000 proteinové profilování antigen čipy známé antigeny protilátky neznámý vzorek – protilátky v séru 1000 stanovení přítomnosti protilátek v séru funkční protein- protein známé proteiny v nativním, funkčním stavu nebo peptidy, nebo chemické látky partnerské molekuly interagující s proteiny nebo proteiny 100 studium interakcí proteinů s partnerskými molekulami proteinDNA, RNA protein- nízkomolek ulární látky Enzym- substrát 51 Využití  Studium biomarkerů  Identifikace terapeutických cílů  Detekce autoprotilátek, studium imunitní odpovědi, analýza alergenů 52  In vitro diagnostika – více než u ostatních typů čipů  Nejčastěji diagnostika autoimunitních onemocnění, alergií  Diagnostika infekčních onemocnění  Profilování biomarkerů  Sepse a záněty  Neurodegenerativní onemocnění  Nádorová onemocnění Využití Cretich et al., 2014 53 Děkuji za pozornost ….is this generation Příště: Sekvenování nové generace - Next Generation Sequencing Dotazy?