Zhrnutie prvej časti ●Veľká časť rozmanitosti života vrátane ochorení sa zrejme dá obsiahnúť štúdiom funkcie genómu a proteómu ●V súčasnosti existujú špeciálne vysokopokryvné metódy (high-density methods), ktoré umožňujú skúmať tisíce génov a proteínov v jednej vzorke a jednom experimente ●Tieto metódy produkujú obrovské množstvá dát a vyžadujú špecializovanú štatistickú analýzu > Microarray Postup mikročipového experimentu 1.Výroba mikročipového sklíčka 2.Príprava vzoriek 3.Hybridizácia 4.Skenovanie 5.Analýza obrazu 6.Kvantifikácia obrázku na hodnoty expresie Postup mikročipového experimentu 1.Výroba mikročipového sklíčka 2.Príprava vzoriek 3.Hybridizácia 4.Skenovanie 5.Analýza obrazu 6.Kvantifikácia obrázku na hodnoty expresie Výroba microarray sklíčka §Výroba sklíčka spočíva v pripojení sond na podložné sklíčko do oblastí spotov §Dve hlavné metódy: §Spotting – sondy sú syntetizované PRED umiestnením na microarray sklíčko, potom umiestnené na sklíčko pomocou špeciálneho robota Spotovací robot J. Vallon-Christersson, Dept Oncology, Lund Univ. Princíp spotovania http://www.youtube.com/watch?v=Pjr1Oyc0KrY&feature=related Výroba microarray sklíčka §Výroba sklíčka spočíva v pripojení sond na podložné sklíčko do oblastí spotov §Dve hlavné metódy: §Spotting – sondy sú syntetizované PRED umiestnením na microarray sklíčko, potom umiestnené na sklíčko pomocou špeciálneho robota §In-situ syntéza – sondy sú syntetizované priamo na podklad, fotolitografickou syntézou http://www.youtube.com/watch?v=ui4BOtwJEXs&feature=related §Spotting – u dlhších cDNA sekvencií §In-situ syntéza – pre krátke oligonukleotidy > Typy sond §cDNA sondy - 500-5000 párov báz dlhé cDNA klony cieľového génu alebo známej sekvencie. Obvykle syntetizované pred umiestnením na microarray sklíčko pomocou spotovacieho robota §Výhoda: sú viac špecifické, a v prípade úspešnej hybridizácie s cieľovou DNA môžeme takmer s istotou povedať, že sa spojili práve s daným génom §Oligonukleotidové sondy – najviac 25 párov báz dlhé sekvencie, ktoré sú designované tak, aby zodpovedali len častiam sekvencie známych kódujúcich génových ORF (open reading frames). > Typy microarray sklíčok §Podľa typu sondy rozlišujeme: §cDNA mikročipy – používajú cDNA sondu Pretože množstvo hybridizácie v týchto arrayoch je závislé na dĺžke sond, a pretože nepoznáme presné čislo exact number of klonov v každom spote, úroveň hybridizácie musí byť porovnané s nejakou referenčnou hodnotou, kontrolou. Táto relatívna informácia je robustnejšia než absolútna informácia o intenzite každého spotu. Preto tieto experimenty sú obvykle dvojkanálové (jeden kanál pre DNA ktorú skúmame, druhý kanál pre referenčnú DNA). §Oligonukleotidové mikročipy – oligonukleotidové sondy §obvykle syntetizované in-situ §nie je potrebný druhý kanál §… > Postup microarray experimentu 1.Výroba microarray sklíčka 2.Príprava vzoriek 3.Hybridizácia 4.Skenovanie 5.Analýza obrazu 6.Kvantifikácia obrázku na hodnoty expresie Príprava vzoriek 1.Izolácia DNA/RNA: molekuly ktoré chceme skúmať (DNA či mRNA) sú extrahované zo vzorky. 1.Prepis a amplifikácia: mRNA sa prepisuje do cDNA a aplifikuje pomocou RT-PCR. DNA zas pomocou PCR. 1.Značenie: Amplifikovaná DNA (cDNA) je ofarbená fluorescenčným farbivom (najčastejšie Cy3 or Cy5). Toto s nazýva priame označenie. U nepriameho, najprv reaktívna skupina, väčšinou primárny amín je inkorporovaná do cDNA a Cy3 / Cy5 sú potom inkorporované do cDNA v následnej reakcii. mRNA A G C U RT-PCR A G C T cDNA DNA A G C T PCR A G C T DNA Značení Postup microarray experimentu 1.Výroba microarray sklíčka 2.Príprava vzoriek 3.Hybridizácia 4.Skenovanie 5.Analýza obrazu 6.Kvantifikácia obrázku na hodnoty expresie Hybridizácia I. §DNA mikročipová technológia je založená hybridizácii §Hybridizácia je proces komplementárneho párovania dvoch jednoreťazcových nukleových kyselín do dvojreťazcovej molekuly (duplexu) na základe párovania báz. Hybridizácia II. §Princíp: 1.Fragmentovaná a namnožená cDNA(DNA) vzorky sa vyleje na microarray sklíčko, kde sú už naviazané jednoreťazcové sondy. 2.Zahriatím na určitú teplotu sa zrušia vodíkové väzby medzi reťazcami a DNA vzorky sa rozpletá na dva samostatné reťazce – tento proces nazývame denaturácia 3.Teplota sa zas zníži a jednoreťazcové molekuly sa snažia znovu spárovať so svojimi komplementárnymi reťazcami 4.Nastáva komplementárne párovanie medzi: §pôvodným párom DNA reťazcov §DNA a sondou – vzniká hybrid > Hybridizácia III. Kapitola II.1.1 Vznik a charakter dát -> cDNA mikročipy Výuka IBA Postup microarray experimentu 1.Výroba microarray sklíčka 2.Príprava vzoriek 3.Hybridizácia 4.Skenovanie 5.Analýza obrazu 6.Kvantifikácia obrázku na hodnoty expresie F. Analýza obrazu (snímanie intenzít jednotlivých kanálov) Dátový súbor: tisíce riadkov (génov) X desiatky stĺpcov -číselné hodnoty intenzít testovanej a referenčnej RNA (+ hodnoty pozadí... ) -kontrola kvality spotov -... spot Ďalšia analýza 1.úpravy datového súboru 2.určenie odlišných génov 3.klasifikácia, predikcia.... Ako získavame základné dáta z cDNA Dvojkanálové skenovanie Po hybridizácii vkladáme sklíčko do skeneru aby sme vytvorili obrázok microarray sklíčka.  Vyšší frekvence, více energie  Nižší frekvence, méně energie Ozáření „zelená“ vlnová délka fluorescence Překrytí obrazů „červená“ vlnová délka Vlnová délka (, nm) Excitační a emisní spektra Cy3 a Cy5 Analýza obrazu Kroky kvantifikácie: 1.Lokalizácia centier spotov Automaticky pomocou grid (sieťky), a manuálnou úpravou 2.Segmentácia Klasifikácia spotov, odlíšenie intenzity pozadia od popredia (pomocou kruhov, etc...). 3.Kvantifikácia signálu V popredí i v pozadí spotu Terry Speed et al. Po skenovaní sa uloží obrázok microarray sklíčka vo formáte .tiff, ktorý sa vloží do programu pre analýzu obrazu. Nasleduje kvantifikácia signálu. Lokalizácia centier spotov Terry Speed et al. Automaticky pomocou špeciálneho súboru grid (od výrobcu mikročipu), ktorý obsahuje info o: •Počte a umiestnení spotov na mikročipe •Priemere spotu v pixeloch Segmentácia §V tomto kroku sú programom pre analýzu obrazu rozpoznávané oblasti spotov a pozadia §Nastavenie veľkosti a pozície spotov – automaticky §Obvykle nutná vizuálna inšpekcia a ďalšie prispôsobenia ručne §Navyše – manuálne označovanie zlých, prípadne prázdnych spotov §Algoritmy vyhľadávania spotov: §Fixed circles §Adaptive circles §Histogram adaptive §Rôzne programy rôzne definujú pozadie spotu GenePix QuantArray ScanAlyse Kvantifikácia signálu §V tejto fáze sa kvantifikuje signál spotu, používajú sa rôzne charakteristiky (priemer, medián, modus, kvantily) Průměr Medián Modus 75% kvantil Logaritmus intensity signálu v pixelech spotu Kvantifikácia signálu pozadia GenePix QuantArray ScanAlyse §Tri druhy metód: 1.Lokálna metóda (local background) 2.Morfologické otvorenie (morphological opening) 3.Konštantná/globálna metóda (constant/global background) Vizualizácia oblastí lokálneho odhadu intenzity pozadia u troch rôzných programov analýzy obrazu cDNA mikročipu Kvantifikácia signálu pozadia 2. Štvorcový element Nový obraz s odhadnutým signálom pozadia Schematické znázornenie Centier spotov, z ktorých je odhadnutý signál pozadia pre spot §Tri druhy metód: 1.Lokálna metóda (local background) 2.Morfologické otvorenie (morphological opening) 3.Konštantná/globálna metóda (constant/global background) Kvantifikácia signálu pozadia 3. §Tri druhy metód: 1.Lokálna metóda (local background) 2.Morfologické otvorenie (morphological opening) 3.Konštantná/globálna metóda (constant/global background) Signál je odhadnutý ako jediná hodnota pre všetky spoty: §priemer intenzít signálov negatívnych kontrol (sondy iného organizmu, ktoré by nemali hybridizovať so vzorkou) §3% rozdelenia signálu všetkých spotov Kontrola kvality spotov I. §Počas kvantifikácie intenzít prebieha ešte inšpekcia kvality spotov na základe parametrov zadaných do algoritmu §Aj po kvantifikácii je možné manuálne označiť spoty ktoré považujeme za nekvalitné §Spotom, ktoré neprejdú kontrolou kvality je priradená príslušná hodnota v premennej Flags: §Napr. §100 ~ good ; §-100 ~ bad ; §-75 ~ absent; §-50 ~ not found; §0 ~ unflagged; Source: http://probes.invitrogen.com/lit/catalog/2/images/g002230.gif Kontrola kvality spotov II. §Charakteristiky kontroly kvality: §Veľkosť a tvar spotu §Príliš malé spoty neposkytujú vierohodné odhady intenzity hybridizácie (Simon et al., 2003) (spoty menšie než < 25 pixelov by mali byť odstránené) §Spoty s nepravidelným tvarom, prípadne "koblihové spoty" by mali byť označené ako nekvalitné §Intenzita signálu §Spoty s príliš malou intenzitou signálu v oboch kanáloch §log2(610/590) = 0.048, ale log2(30/10) = 1.58 §Pomer signál/šum by mal byť dosatočne veľký §Saturácia spotu §Spoty by nemali obsahovať saturované pixely! Kontrola kvality spotov III. §Príklad nekvalitných spotov: §A) saturovaný spot, B) koblihový spot, C) spot s nepravidelnou štruktúrou, D) dobrý spot Ukážka základných cDNA microarray dát §Dáta z jedného cDNA microarray sklíčka Po kvantifikácii a kontrole získavame základný dátový súbor. Základný dátový súbor Obsahuje (príklad GenePix 6.0) §Pozíciu spotu §Meno a ďalšie identifikátory sondy na spote §Ďalšie charakteristiky spotu: (priemer, tvar, cirkularita, saturácia, ...) §Informácie o intenzite signálu pozadia, popredia (medián, priemer, suma, SD) §Počet saturovaných pixelov §Odvodené charakteristiky i) % pixelov signálu s intenzitami väčšími než 1SD (2SD) intenzity pozadia ii) intenzita signálu mínus intenzita pozadia iii) pomer mediánov/priemerov oboch kanálov iv) logaritmus bázy 2 tohoto pomeru §Informácie o kvalite spotu §Premennú Flags Základné dáta §Dáta v základnom súbore NIE SÚ koncentrácie mRNA! §Hodnoty získané z microarray experimentu sú pozitívne korelované s množstvom prítomnej mRNA, ale navyše v sebe nesú ŠUM, súvisiaci s: §Kontamináciou tkaniva §RNA degradáciou §Efektivitou §amplifikácie DNA §reverznej transkripcie §hybridizácie a špecificitou sond §Výberom a identifikáciou sond §PCR výsledkom NUTNÁ KONTROLA KVALITY A ÚPRAVA DÁT § Efektivitou spotovania § Ďalšími technickými vplyvmi pri spracovaní § Segmentáciou obrazu § Kvantifikáciou signálu § Korekciou na pozadie Úrovne kontroly kvality Úroveň sondy: Kvalita jedného spotu na mikročipe Úroveň mikročipu: Kvalita celého mikročipu Úroveň experimentu: Kvalita měření transkriptú všech mikročipů v experimentu Mikročipy 1 ... n Kvalita mikročipu Kvalita experimentu Kvalita sondy Úroveň mikročipu (základní datová matice) Úroveň experimentu (finální datová matice) Úrovne úprav dátových súborov Úroveň sondy: Kvalita jedného spotu na mikročipe Úroveň mikročipu: Kvalita celého mikročipu Úroveň experimentu: Kvalita měření transkriptú všech mikročipů v experimentu Mikročipy 1 ... n Kvalita mikročipu Kvalita experimentu Kvalita sondy Úroveň mikročipu (základní datová matice) Úroveň experimentu (finální datová matice) Odstránenie nekvalitných spotov Sumarizácia duplikátov Normalizácia v rámci mikročipu Normalizácia medzi mikročipmi Úrovne úprav dátových súborov Úroveň sondy: Kvalita jedného spotu na mikročipe Úroveň mikročipu: Kvalita celého mikročipu Úroveň experimentu: Kvalita měření transkriptú všech mikročipů v experimentu Mikročipy 1 ... n Kvalita mikročipu Kvalita experimentu Kvalita sondy Úroveň mikročipu (základní datová matice) Úroveň experimentu (finální datová matice) Odstránenie nekvalitných spotov Sumarizácia duplikátov Normalizácia v rámci mikročipu Normalizácia medzi mikročipmi Replicate mean median SD No. of non-flagged replicates clone 1 2 3 A_23_P347643 -0.186 -0.265 -0.313 -0.254 -0.265 0.052 3 A_23_P60243 0.523 flagged flagged 0.523 0.523 0 1 A_23_P116057 0.039 -0.978 flagged -0.495 -0.495 0.5 2 A_23_P203743 -0.614 0.537 1.589 0.504 0.537 0.899 3 Kontrola dát v rámci microarray sklíčka §Replikáty sond §Sumárne štatistiky replikátov spotov (nekvalitné spoty už vylúčené) §Buď vyhodiť sondy s príliš veľkou variabilitou medzi replikátmi… §…alebo si uschovať informáciu o počte validných replikátov (a vyhodiť klony len s jedným replikátom) §Kvalita microarray sklíčka §Percento nekvalitných spotov nesmie byť príliš veľké (<25 %) §Systematické odchýlky odstránime procesom NORMALIZÁCIE Úrovne úprav dátových súborov Úroveň sondy: Kvalita jedného spotu na mikročipe Úroveň mikročipu: Kvalita celého mikročipu Úroveň experimentu: Kvalita měření transkriptú všech mikročipů v experimentu Mikročipy 1 ... n Kvalita mikročipu Kvalita experimentu Kvalita sondy Úroveň mikročipu (základní datová matice) Úroveň experimentu (finální datová matice) Odstránenie nekvalitných spotov Sumarizácia duplikátov Normalizácia v rámci mikročipu Normalizácia medzi mikročipmi Systematické odchýlky v rámci microarray sklíčka §Nerovnomerná hybridizácia (priestorové odchýlky) §Príčina: nerovnomerne umytý čip, nerovnomerne distribuovaná vzorka, print-tip efekt (defektná ihla) §Signál pozadia §Môže byť veľmi silný, buď zle umytý čip, alebo zlá segmentácia (časť popredia je kvantifikovaná ako pozadie) §Efekt farbiva (rozdiely intenzít medzi kanálmi) §Príčina: odlišná schopnosť inkorporácie molekúl farbiva (Cy3, Cy5) odlišná reakcia na excitáciu (slabšia intenzita UV, ...) ODHAĽUJEME GRAFICKOU REPREZENTÁCIOU Virtuálna rekonštrukcia microarray sklíčka, vykreslenie heatmapy log2 pomeru Cy5/Cy3 intenzít na základe ich pozície na sklíčku Box-ploty jednotlivých oblastí (najčastejšie print-tip) Diagnostika nerovnomernej hybridizácie Graf intensit kanálů Cy5 MA graf M = log (R/G) A = 1/2 (log(R)+log(G)) Neukáže nelineárne trendy Diagnostika efektu farbiva Ukáže nelineárne trendy! §Často je efekt farbiva väčší u sond s nízkou expresiou Cy3 = B0 + B1*Cy5 (Cy3-B0)/B1=Cy5’ Balík marray §Balík marray poskytuje sadu funkcií pre analýzu cDNA čipov §Základnou štruktúrou, s ktorou pracuje a ktorá obsahuje základné dáta všetkýchch matic experimentu je trieda marrayRaw §Vytvára sa nasledovne new('marrayRaw', maRf = ...., # matice intensit spotu červeného kanálu maGf = ...., # matice intensit spotu zeleného kanálu maRb = ...., # matice intensit pozadí červeného kanálu maGb = ...., # matice intensit pozadí zeleného kanálu maLayout = ...., # objekt třídy marrayLayout, popis mikročipu maGnames = ...., # objekt třídy marrayInfo, popis sond maTargets = ...., # objekt třídy marrayInfo, popis vzorků maNotes = ...., # text - poznámky ) Ďalšie objekty balíku marray §marrayLayout - popisuje mikročip, umiestnenie spotov a ich sondy new('marrayLayout', maNgr = ... , #počet řádků matic maNgc = ..., #počet sloupců matic maNsr = ..., #počet řádků v matici maNsc = ..., #počet sloupců v matici maNspots = ..., # maNgr x maNgc x maNsr x maNsc maSub = ..., # vektor TRUE/FALSE, které spoty se používají maPlate = ..., # faktor – print tip maControls = ..., # faktor – status sondy (kontrolná nebo ne?) maNotes = ..., # Object of class character) maNsr maNsc maNgr maNgc Ďalšie objekty balíku marray §marrayInfo - popisuje vzorky nebo sondy new('marrayInfo', maLabels = ...., # vektor jmen/názvů maInfo = ...., # datová tabulka s dalšími charakteristikami maNotes = ...., # text s poznámkami ) Příklad I §Načtěme si data swirl, které představují mikročipový experiment, porovnávající genovou expresi divokého druhu rybky Dánio pruhované a jejího mutanta v genu BMP2. Experiment byl proveden v dye swap designu, dohromady jsou k dispozici 4 mikročipy: > library(marray) > data(swirl) > str(data) §Vytvořme si paletu barev a provedeme kontrolu kvality čipů > Gcol <- maPalette(low = "white", high = "green", k = 50) > Rcol <- maPalette(low = "white", high = "red", k = 50) > RGcol <- maPalette(low = "green", high = "red", k = 50) Příklad II – kontrola prostorových efektů §Vykreslíme si heatmapu třetího mikročipu s pomocí funkce maImage > maImage(swirl[, 3], x = "maRb") # vykreslíme pozadí červeného kanálu > maImage(swirl[, 3], x = "maGb") # vykreslíme pozadí zeleného kanálu > maImage(swirl[, 3], x = "maM") # vykreslíme poměr intensit spotů obou kanálů (M hodnoty) §Funkce maImage dokáže vykreslit i efekt print-tipu: > maImage(swirl[, 1],x="maPrintTip") §Funkce maBoxplot vykreslí krabicové grafy > maBoxplot(swirl[,1]) Příklad III – efekt barviva §Vykreslíme jednoduše pomocí základní funkce plot, a dvou funkcí, kterými z marrayRaw objektu extrahujeme intensity spotů červeného a zeleného kanálu: > R = maRf(swirl[,1]) > G = maGf(swirl[,1]) > plot(R,G) > abline(a=0, b=1) # vykreslíme diagonálu §Funkce plot aplikována přímo na objekt třídy marrayRaw vykreslí MA graf, s odhadem křivek podle jednotlivých print-tipů > plot(swirl[,1]) §Jiným způsobem je prvně vypočítat hodnoty A a M, a pak je zobrazit pomocí funkce ma.plot: > A=maA(swirl[,3]) > M=maM(swirl[,3]) > ma.plot(A,M)