C7188 Úvod do molekulární medicíny 4/12 Moderní metodické přístupy v molekulární medicíně II GENOMIKA II Ondřej Slabý, Ph.D. Masarykův onkologický ústav Univerzitní centrum buněčné imunoterapie Lékařská fakulta Masarykovy univerzity © Ondřej Slabý, 2009 logo_MOU ucic_logo_text_en GS011558 Úvod do molekulární medicíny 4/12 Strana 2 © Ondřej Slabý, 2009 Úvod do molekulární medicíny 4/12 Strana 3 © Ondřej Slabý, 2009 Strana 4 © Ondřej Slabý, 2009 Scatter600.jpg Gene Expression Arrays: Scatter Plot 5 7 9 11 13 15 Untreated (log2 ratio) Treated (log2 ratio) 5 7 9 11 13 15 Two fold line Linear Best Fit Line ~9.5 ~5.5 Úvod do molekulární medicíny 4/12 Strana 4 © Ondřej Slabý, 2009 Normalizace dat ukázky normalizačních metod -kompenzace nelinearity dat mezi jednotlivými čipy a uvnitř daného čipu Pozitivní kontroly: “Housekeeping” geny s „konstantní“ expresí ve tkáních kontrolní genetický materiál (referenční vzorek) kontroly účinnosti hybridizace – artreficiální sekvence Negativní kontrola: -pozadí hybridizace -Affymetrix - mutace v jednom nukleotidu sondy Odečtení pozadí – background substraction (griding,local background, median, empty spot,…) Úvod do molekulární medicíny 4/12 Strana 5 © Ondřej Slabý, 2009 5 • Normalizace dat Cy3 a Cy5 vybalancování rozdílného signálu ze značení Cy3 a Cy5 Jeho nerovnoměrnost může být způsobena: -rozdílnou inkorporací barviva do NK -rozdílným množstvím mRNA -odlišnými parametry při skenování 0 200 400 600 800 1000 1200 cy3 cy5 Log of Intensities 0 200 400 600 800 1000 1200 1400 cy3 cy5 © Ondřej Slabý, 2009 Strana 6 Úvod do molekulární medicíny 4/12 Normalizace Lowess: princip Loess (or lowess) : Locally WEighted Scatterplot Smoothing (vyhlazování) Normalizace závislá na intezitě signálu Místní lineární regrese Úvod do molekulární medicíny 4/12 © Ondřej Slabý, 2009 Strana 7 1) Identifikace biologicky významných genů -geny s reprodukovatelnou signifikantně rozdílnou expresí mezi jednotlivými podmínkami experimentu -poměr exprese v jednotlivých experimentech -t-test (test rozdílnosti průměrů exprese v jednotlivých skupinách) -Significance Analysis of Microarrays (SAM) založeno na t-testu -Multifaktoriální ANOVA (nejsignifikantnější geny pro dané skupiny) TIGR MultipleExperiment Viewer (TMEV) http://www.tm4.org/ Úvod do molekulární medicíny 4/12 © Ondřej Slabý, 2009 Strana 8 Shlukova analýza je jednou z nejpoužívanějších vícerozměrných statistických metod Jedna se o explorativni techniku, ktera se použivá zejmena v případech, kdy nemame žadne a priori znalosti o struktuře uvnitř dat. každý gen je reprezentován vektorem jehož souřadnice, jsou hodnoty exprese genu v jednotlivých experimentech, vzdálenost je měřena mezi vektory nebo centroidy Ukolem shlukovacích metod je tedy najit v datech skupiny prvků (shluky) tak, že prvky jednotlivých skupin budou v jistem smyslu více podobné než prvky z jiných skupin, tzn. nalezené skupiny prvků budou co nejvíce homogenní Snažíme se nalézt mezi zkoumanými geny (resp. biologickými vzorky) skupinky genů (resp. biologických vzorků), ktere vykazují v průběhu experimentu, tedy za působení specifických podminek, podobné chování. 2) Ukázky multidemenzionálních metod analýzy čipových dat Shlukovací analýzy Úvod do molekulární medicíny 4/12 Strana 9 © Ondřej Slabý, 2009 5 2 4 1 3 Hierarchické klastrování 3 1 4 2 5 Vzdálenost mezi jednotlivými klastry Dendrogram Podobnost je vyjádřena hierarchickým stromem – dendrogram. Heat map -kalkulace vzdálenosti mezi všemi geny a nalezení nejmenší. K ní se seskupí všechny jí podobné a vytvoří se klastr. -po vytvoření X počtu clusterů se hledají vzdálenosti mezi klastry (hierarchical clustering) -počet klastrů není omezen Úvod do molekulární medicíny 4/12 © Ondřej Slabý, 2009 Strana 10 Centroidové metody - K-means opakování = 0 •start s náhodnou pozicí předem definovaného počtu K-centroidů •opakovaný pohyb centroidů, dokud nedosáhnou stability a nezahrnou veškeré prvky systému minimalizovaná vnitroshluková variabilita a zaroveň maximalizovaná mezishluková variabilita Úvod do molekulární medicíny 4/12 Strana 11 © Ondřej Slabý, 2009 •start s náhodnou pozicí předem definovaného počtu K-centroidů •opakovaný pohyb centroidů, dokud nedosáhnou stability a nezahrnou veškeré prvky systému opakování = 1 Centroidové metody - K-means Úvod do molekulární medicíny 4/12 Strana 12 © Ondřej Slabý, 2009 opakování = 3 •start s náhodnou pozicí předem definovaného počtu K-centroidů •opakovaný pohyb centroidů, dokud nedosáhnou stability a nezahrnou veškeré prvky systému • Centroidové metody - K-means Úvod do molekulární medicíny 4/12 Strana 13 © Ondřej Slabý, 2009 3) Klasifikační metody Principem klasifikačních metod v analýze dat z DNA čipů je vytvoření rozhodovacího pravidla, ktere by na zakladě naměřených hodnot genové exprese umožňovalo přiřazení pacienta do jedne z předem definovaných tříd (například zdravý, nemocný). Z toho je zřejmé, že by se „dobré“ rozhodovací pravidlo založené na expresních datech mohlo zařadit po bok stavajících diagnostických metod a výrazně tak přispět ke zpřesnění diagnostiky závažných onemocnění (klasifikační stromy, Support Vector Machines (SVM), metoda k-nejbližších sousedů,..) ch52f1.jpg MOLEKULÁRNÍ KLASIFIKACE NÁDORŮ: precizní klasifikace je základem léčebného úspěchu, současné metody jsou založeny na morfologii, imunohistochemii, genetice a klinické odpovědi řada diagnostických nejasností (heterogenita) ČIPY: -identifikace nových jednotek na podkladě profilu genové exprese -reklasifikace stávajících jednotek -identifikace skupin či jednotlivých genů „markerů“ specifických pro dané jednotky Úvod do molekulární medicíny 4/12 Strana 14 © Ondřej Slabý, 2009 403503aa.2.jpg 00000179Mac 384 B1E78C0E: Vzato z: Nature February, 2000 Paper by Allzadeh. A et al Distinct types of diffuse large B-cell lymphoma identified by Gene expression profiling, Molekulární klasifikace velkobuněčného B-lymfomu Úvod do molekulární medicíny 4/12 Strana 15 © Ondřej Slabý, 2009 403503ac.2.jpg 00000179Mac 384 B1E78C0E: Strana 16 © Ondřej Slabý, 2009 Úvod do molekulární medicíny 4/12 Úvod do molekulární medicíny 4/12 Strana 17 © Ondřej Slabý, 2009 Molekulární klasifikace karcinoma prsu Sorlie et al, 2002, PNAS Úvod do molekulární medicíny 3/12 Strana 17 © Ondřej Slabý, 2009 ER -/+ -/+ -/+ +/++ ++ +++ HER2 - +++ - / + - / + - - / + p53mut 82% 71% 33% 80% 40% 13% CK 5/6, 17 +++ +/- +++ - - - CK 8/18 - - + +/++ +/++ +++ c-myb / ost. +++ +++ -/+ +++ - - Sorlie et al, 2002, PNAS Úvod do molekulární medicíny 4/12 Strana 19 © Ondřej Slabý, 2009 Web%20page%20pictures%2070%20gene Predikce metastatického potenciálu u pacientek s časnými stádii mamárního karcinomu Van’t Veer et al. (Nature, 2002) AGENDIA 96 sporadických mamárních karcinomů 46 pacientek se špatnou prognózou (do 5 let se nevyvinuly vzdálené metastáze) 50 pacientek s dobrou prognózou (do 5 let se nevyvinuly vzdálené metastáze) Sada 70 genů - patent 5852 genů se signifikantním rozdílem v expresi mezi skupinami 70 genů nejvíce korelujících s klinickým stavem použila pro klasifikaci Úvod do molekulární medicíny 4/12 Strana 20 © Ondřej Slabý, 2009 PROTOKOL KLINICKÉ STUDIE „MINDACT“ (Microarray In Node negative Disease may Avoid ChemoTherapy) Pacientky s karcinomem prsu: T1-3N0M0 Registrace do studie, rebiopsie tumoru a odesláním vzorku nativní tkáně do centra studie Stanovení prognózy pacientek (riziko relapsu choroby): 1. “randomizace“ pacienta 1. klinicko-patologický prognostický systém (Adjuvant OnLine) 2. 70-genový prognostický profil genové exprese tumoru Oba prognostické systémy vyhodnotily vysoké riziko časného relapsu choroby Oba prognostické systémy vyhodnotily nízké riziko časného relapsu choroby Výsledky obou prognostických systémů jsou ve vzájemném rozporu 3. randomizace pacienta Chemoterapie: A) s antracyklinem B) s kapecitabinem/docetaxelem 2. randomizace pacienta Chemoterapie: NE AN0 Hormonoterapie NE: ER- ANO: ER+ EORTC Protocol 10041 – BIG 3-04 - http://www.eortc.be/services/unit/mindact) Rozpočet ~ 20 mil. EUR Pořádá síť TRANSBIG 40 institucí 21 zemí Zařazení 5000 pacientek v prvních 3 letech Úvod do molekulární medicíny 4/12 Strana 21 © Ondřej Slabý, 2009 Úvod do molekulární medicíny 4/12 Strana 22 © Ondřej Slabý, 2009 Proč se zabývat výzkumem mikroRNA? rnai timeline nature Nature Biotechnology 21, 1441 - 1446 (2003) 5.10.2009 PubMed - „MicroRNA AND Cancer“ – 1562 odkazů „MicroRNA“ – 4989 odkazů mikroRNA: nová úroveň regulace genové exprese mikroRNA čipy http://www.economist.com/images/20070616/2407LD1.jpg Úvod do molekulární medicíny 4/12 Strana 23 © Ondřej Slabý, 2009 Proč se zabývat výzkumem mikroRNA? Úvod do molekulární medicíny 4/12 Strana 24 © Ondřej Slabý, 2009 Proč se zabývat výzkumem mikroRNA? mello_banquet2_photo Craig Mello na slavnostním banketu po udílení Nobelových cen za rok 2006. Úvod do molekulární medicíny 4/12 Strana 25 © Ondřej Slabý, 2009 Biogeneze a funkce mikroRNA 1.Transkripce miRNA genu 2. 2.pri-miRNA jsou zpracovány pomocí RNáz Drosha a Pasha 3. 3.pre-miRNA exportovány pomocí Exportinu 5 do cytoplazmy 4. 4.Zpracovaní pomocí RNázy Dicer 5. Úvod do molekulární medicíny 4/12 Strana 26 © Ondřej Slabý, 2009 5. Aktivní vlákno je inkorporováno do komplexu RISC 1. 6.Represe translace nebo degradace mRNA v závislosti na míře komplementarity Biogeneze a funkce mikroRNA microRNA: licensed to kill messenger Strana 27 © Ondřej Slabý, 2009 Úvod do molekulární medicíny 4/12 gb-2002-3-3-reviews0004-1 Struktura mRNA - interakce regulačních oblastí Úvod do molekulární medicíny 4/12 Strana 28 © Ondřej Slabý, 2009 •Funkce obou je regulace exprese •siRNA je původem dsRNA •siRNA souvisí s cizorodou RNA (obvykle virovou) a je 100% komplementární •miRNA je původně ssRNA, která formuje vlásenkové dsRNA struktury •miRNA reguluje post-transkripční genovou expresi He and Hannon, Nature Reviews Genetics, 2004 Jaký je rozdíl mezi miRNA a siRNA? Úvod do molekulární medicíny 4/12 Strana 29 © Ondřej Slabý, 2009 Základní fakta o mikroRNA miRNA poprvé popsal Ambros a kol. (1993) u C. elegans (lin-4) Přibližně 3% predikovaných lidských genů jsou geny pro miRNA (přibližně 1000 miRNA) miRNA mají potenciál regulovat asi 1/3 kódujících genů Některé miRNA jsou kódovány více než jedním genem Geny kódující miRNA jsou často klastrovány (klastr miR-17) Geny miRNA jsou lokalizovány v mezigenových oblastech v intronových oblastech nebo antisense řetězcích znamých genů Úvod do molekulární medicíny 4/12 Strana 30 © Ondřej Slabý, 2009 Zapojení mikroRNA do Vogelsteinova modelu kolorektálního karcinomu figure1.gif Slaby et al, Molecular Cancer, 2009 Úvod do molekulární medicíny 4/12 Strana 31 © Ondřej Slabý, 2009 Real-Time PCR – modifikovaná TaqMan technologie ke kvantifikaci miRNA Úvod do molekulární medicíny 4/12 © Ondřej Slabý, 2009 mikroRNA čipy Hybridizační čipy – analogická technologie jako u DNA čipů Ambion, Exiqon, Agilent, Affymetrix, Invitrogen NCode Real-Time PCR čipy Applied Biosystems Low density arrrays (LDA) microRNA array verze 2.0 (panel A+B) QuantiMir, SABiosciences, miRANDA LDA mikrofluidní destička (384 miRNA) Strana 32 Úvod do molekulární medicíny 4/12 Strana 33 © Ondřej Slabý, 2009 Význam mikroRNA v nádorové biologii Rozdílné expresní profily mezi nádorovou a nenádorovou tkání Volinia et al., PNAS, 2006 Shluková analýza 540 vzorků šesti druhů solidních nádorů a příslušných nenádorových tkání. > Žlutá znamená zvýšenou expresi oproti kontrolnímu (nenádorovému) vzorku Úvod do molekulární medicíny 4/12 Strana 34 © Ondřej Slabý, 2009 Úvod do molekulární medicíny 4/12 Strana 35 © Ondřej Slabý, 2009 Za geneticky polymorfní je považován znak s nejméně dvěma geneticky podmíněnými variantami v jedné populaci, které se nachází v takových frekvencích, že i zřídkavá má frekvenci alespoň 1%. SNP = single nucleotide polymorphism, jsou jednonukleotidové polymorfní znaky Celogenomové mapy SNPs jsou dostupné ve webových databázích (~6 milionů) Mezi lidmi je přibližně 99,9% shoda v sekvenci DNA Zbývajících 0,1% nás činí jedinečnými (jak vypadáme, nemoci, kterými budeme trpět, …) Přibližně 1 SNP per 1.000 bp 90% genů obsahuje alespoň 1 SNP SNP čipy Affymterix SNP čipy Mapping 10K array => Mapping 100K array => Genome-wide Human SNP array 5.0 (500K) => Genome-wide Human SNP array 6.0 (1.8 million) Umožňuje: Detekci SNP Počet kopií daného genu (amplifikace, delece, aneupoildie) Ztráta heterozygotnosti Úvod do molekulární medicíny 4/12 Strana 36 Affymterix SNP čipy • HJ dané alely: AA, AB, BB • Intenzita signálu: počet kopií Úvod do molekulární medicíny 4/12 Strana 37 Moderní metodické přístupy v molekulární medicíně II – proteomika (dvojrozměrná elektroforéza, hmotnostní spektrometrie, proteinové čipy), využití proteomiky v diagnostice nádorových onemocnění Molekulární epidemiologie – definice a vymezení oboru, identifikace molekulárních rizikových faktorů vzniku a rozvoje onemocnění, analýza vztahu molekulárních faktorů a vlivů prostředí na rozvoj nádorového onemocnění, význam molekulární epidemiologie u karcinomu plic a kolorektálního karcinomu Náplň příští přednášky Take home Analýza čipových dat – pozadí, normalizace Analýza čipových dat - identifikace biologicky významných genů Analýza čipových dat -ukázky multidemenzionálních metod analýzy čipových dat - Shlukovací analýzy Analýza čipových dat – klasifikační metody Molekulární klasifikace nádorových onemocnění – ukázky Aplikace čipových technologií do klinické praxe – studie MINDACT, Agendia, Roche AmpliChip CYP450 mikroRNA: nová úroveň regulace genové exprese mikroRNA čipy SNP čipy 1) 1) Strana 38 © Ondřej Slabý, 2009 Úvod do molekulární medicíny 4/12 Strana 39 © Ondřej Slabý, 2009 Dotazy? Úvod do molekulární medicíny 4/12