C7188 Úvod do molekulární medicíny 4/12 Moderní metodické přístupy v molekulární medicíně II GENOMIKA II Ondřej Slabý, Ph.D. Masarykův onkologický ústav Univerzitní centrum buněčné imunoterapie Lékařská fakulta Masarykovy univerzity © Ondřej Slabý, 2011 logo_MOU GS011558 Úvod do molekulární medicíny 4/12 Strana 2 © Ondřej Slabý, 2009 Úvod do molekulární medicíny 4/12 Strana 4 © Ondřej Slabý, 2009 Analýza obrazu Odečtení pozadí od „foreground“ – background substraction (griding,local background, median, empty spot,…) SNR – „signal-to-noise ratio“, odstup intenzity popředí od šumu pozadí -převod obrazové informace na numerická data Úvod do molekulární medicíny 4/12 Strana 4 © Ondřej Slabý, 2009 Úvod do molekulární medicíny 4/12 Strana 3 © Ondřej Slabý, 2009 Strana 4 © Ondřej Slabý, 2009 Scatter600.jpg Gene Expression Arrays: Scatter Plot 5 7 9 11 13 15 Untreated (log2 ratio) Treated (log2 ratio) 5 7 9 11 13 15 Two fold line Linear Best Fit Line ~9.5 ~5.5 Úvod do molekulární medicíny 4/12 Strana 4 © Ondřej Slabý, 2009 Normalizace dat ukázky normalizačních metod Základem většiny normalizačních metod je předpoklad, že počet genů se změněnou mírou exprese je výrazně nižší než těch, jejichž exprese se nemění. -minimalizace vlivu „nebiologických“ zdrojů variability -kompenzace nelinearity dat mezi jednotlivými čipy a uvnitř daného čipu Pozitivní kontroly: Referenční geny s „konstantní“ expresí ve tkáních kontrolní genetický materiál (referenční vzorek) kontroly účinnosti hybridizace – artreficiální sekvence Negativní kontrola: -pozadí hybridizace -Affymetrix - mutace v jednom nukleotidu sondy Úvod do molekulární medicíny 4/12 Strana 5 © Ondřej Slabý, 2009 7 • Normalizace dat Cy3 a Cy5 vybalancování rozdílného signálu ze značení Cy3 a Cy5 Jeho nerovnoměrnost může být způsobena: -rozdílnou inkorporací barviva do NK -rozdílným množstvím mRNA -odlišnými parametry při skenování 0 200 400 600 800 1000 1200 cy3 cy5 Log of Intensities 0 200 400 600 800 1000 1200 1400 cy3 cy5 © Ondřej Slabý, 2009 Strana 6 Úvod do molekulární medicíny 4/12 Normalizace Lowess: princip Loess (or lowess) : Locally WEighted Scatterplot Smoothing (vyhlazování) Normalizace závislá na intezitě signálu Místní lineární regrese Úvod do molekulární medicíny 4/12 © Ondřej Slabý, 2009 Strana 7 Statistická analýza dat Základní dělení metod je na „unsupervised“ (využívají jako vstup pouze naměřené hodnoty bez informací o vzorcích, klastrovací metody) a „supervised“ (využívají i další známé informace o vzorcích, identifikace biologicky významných genů, klasifikační metody) Další skupina metod propojuje informaci o genové expresi s dostupnými informacemi o biologické funkci genů (analýzy signálních drah, informace z databáze GO „gene ontology“, a další) 1) Identifikace biologicky významných genů -geny s reprodukovatelnou signifikantně rozdílnou expresí mezi jednotlivými podmínkami experimentu -poměr exprese v jednotlivých experimentech (fold change) -t-test (test rozdílnosti průměrů exprese v jednotlivých skupinách) -neparametrické testy (Mann-Whitney, Wilcoxon test) -Significance Analysis of Microarrays (SAM) -Multifaktoriální ANOVA (nejsignifikantnější geny pro dané skupiny) Hranice významnosti (1% = 1 ze 100, u čipu je to 200 falešně pozitivních z 20000, Bonferoniho korekce) Úvod do molekulární medicíny 4/12 © Ondřej Slabý, 2009 Strana 8 Shlukova analýza je jednou z nejpoužívanějších vícerozměrných statistických metod Jedna se o explorativni techniku, ktera se použivá zejmena v případech, kdy nemame žadne a priori znalosti o struktuře uvnitř dat. každý gen je reprezentován vektorem jehož souřadnice, jsou hodnoty exprese genu v jednotlivých experimentech (v jednotlivých vzorcích), vzdálenost je měřena mezi vektory. Ukolem shlukovacích metod je tedy najit v datech skupiny prvků (shluky) tak, že prvky jednotlivých skupin budou v jistem smyslu více podobné než prvky z jiných skupin, tzn. nalezené skupiny prvků budou co nejvíce homogenní Snažíme se nalézt mezi zkoumanými geny (resp. biologickými vzorky) skupinky genů (resp. biologických vzorků), ktere vykazují za specifických podminek nebo u daného fenotypu, podobné chování. 2) Ukázky multidemenzionálních metod analýzy čipových dat Shlukovací analýzy Úvod do molekulární medicíny 4/12 Strana 9 © Ondřej Slabý, 2009 5 2 4 1 3 Hierarchické klastrování 3 1 4 2 5 Vzdálenost mezi jednotlivými klastry Dendrogram Podobnost je vyjádřena hierarchickým stromem – dendrogram s teplotní mapou „heat-map“ Heat map -kalkulace vzdálenosti mezi všemi geny a nalezení nejmenší. K ní se seskupí všechny jí podobné a vytvoří se klastr. -po vytvoření X počtu clusterů se hledají vzdálenosti mezi klastry (hierarchical clustering) -počet klastrů není omezen Úvod do molekulární medicíny 4/12 Strana 17 © Ondřej Slabý, 2009 Klastrová analýza u karcinomu prsu Sorlie et al, 2002, PNAS Úvod do molekulární medicíny 3/12 Strana 17 © Ondřej Slabý, 2009 ER -/+ -/+ -/+ +/++ ++ +++ HER2 - +++ - / + - / + - - / + p53mut 82% 71% 33% 80% 40% 13% CK 5/6, 17 +++ +/- +++ - - - CK 8/18 - - + +/++ +/++ +++ c-myb / ost. +++ +++ -/+ +++ - - Sorlie et al, 2002, PNAS Úvod do molekulární medicíny 4/12 Strana 13 © Ondřej Slabý, 2009 3) Klasifikační metody Jejich podstatou je znalost informace o charakteru vzorku tzn. supervised přístup. Principem klasifikačních metod v analýze dat z DNA čipů je vytvoření rozhodovacího pravidla, ktere by na zakladě naměřených hodnot genové exprese umožňovalo přiřazení pacienta do jedne z předem definovaných tříd (například zdravý, nemocný). Z toho je zřejmé, že by se „dobré“ rozhodovací pravidlo založené na expresních datech mohlo zařadit po bok stavajících diagnostických metod a výrazně tak přispět ke zpřesnění diagnostiky závažných onemocnění (klasifikační stromy, Support Vector Machines (SVM), metoda k-nejbližších sousedů,..) ch52f1.jpg MOLEKULÁRNÍ KLASIFIKACE NÁDORŮ: precizní klasifikace je základem léčebného úspěchu, současné metody jsou založeny na morfologii, imunohistochemii, genetice a klinické odpovědi řada diagnostických nejasností (heterogenita) ČIPY: -identifikace nových jednotek na podkladě profilu genové exprese -reklasifikace stávajících jednotek -identifikace skupin či jednotlivých genů „markerů“ specifických pro dané jednotky Úvod do molekulární medicíny 4/12 Strana 19 © Ondřej Slabý, 2009 Web%20page%20pictures%2070%20gene Predikce metastatického potenciálu u pacientek s časnými stádii mamárního karcinomu Van’t Veer et al. (Nature, 2002) AGENDIA 96 sporadických mamárních karcinomů 46 pacientek se špatnou prognózou (do 5 let se nevyvinuly vzdálené metastáze) 50 pacientek s dobrou prognózou (do 5 let se nevyvinuly vzdálené metastáze) Sada 70 genů - patent 5852 genů se signifikantním rozdílem v expresi mezi skupinami 70 genů nejvíce korelujících s klinickým stavem použila pro klasifikaci Úvod do molekulární medicíny 4/12 Strana 20 © Ondřej Slabý, 2009 PROTOKOL KLINICKÉ STUDIE „MINDACT“ (Microarray In Node negative Disease may Avoid ChemoTherapy) Pacientky s karcinomem prsu: T1-3N0M0 Registrace do studie, rebiopsie tumoru a odesláním vzorku nativní tkáně do centra studie Stanovení prognózy pacientek (riziko relapsu choroby): 1. “randomizace“ pacienta 1. klinicko-patologický prognostický systém (Adjuvant OnLine) 2. 70-genový prognostický profil genové exprese tumoru Oba prognostické systémy vyhodnotily vysoké riziko časného relapsu choroby Oba prognostické systémy vyhodnotily nízké riziko časného relapsu choroby Výsledky obou prognostických systémů jsou ve vzájemném rozporu 3. randomizace pacienta Chemoterapie: A) s antracyklinem B) s kapecitabinem/docetaxelem 2. randomizace pacienta Chemoterapie: NE AN0 Hormonoterapie NE: ER- ANO: ER+ EORTC Protocol 10041 – BIG 3-04 - http://www.eortc.be/services/unit/mindact) Rozpočet ~ 20 mil. EUR Pořádá síť TRANSBIG 40 institucí 21 zemí Zařazení 5000 pacientek v prvních 3 letech Úvod do molekulární medicíny 4/12 Strana 21 © Ondřej Slabý, 2009 Moderní metodické přístupy v molekulární medicíně II – proteomika (dvojrozměrná elektroforéza, hmotnostní spektrometrie, proteinové čipy), využití proteomiky v diagnostice nádorových onemocnění Molekulární epidemiologie – definice a vymezení oboru, identifikace molekulárních rizikových faktorů vzniku a rozvoje onemocnění, analýza vztahu molekulárních faktorů a vlivů prostředí na rozvoj nádorového onemocnění, význam molekulární epidemiologie u karcinomu plic a kolorektálního karcinomu Náplň příští přednášky Take home Analýza čipových dat – pozadí, normalizace Analýza čipových dat - identifikace biologicky významných genů Analýza čipových dat -ukázky multidemenzionálních metod analýzy čipových dat - Shlukovací analýzy Analýza čipových dat – klasifikační metody Molekulární klasifikace nádorových onemocnění – ukázky Aplikace čipových technologií do klinické praxe – studie MINDACT, Agendia, Roche AmpliChip CYP450 mikroRNA: nová úroveň regulace genové exprese – biogeneze a biologická funkce mikroRNA v patogeneze nádorových onemocnění mikroRNA jako biomarkery (SNP, tkáňové, sérové) mikroRNA jako terapeutické cíle mikroRNA čipy 1) 1) Strana 38 © Ondřej Slabý, 2009 Úvod do molekulární medicíny 4/12 Strana 39 © Ondřej Slabý, 2009 Dotazy? Úvod do molekulární medicíny 4/12