RNA bioinformatika C2131 Úvod do bioinformatiky, jaro 2023 Lenka Malinovská RNA • RNA: tři hlavní formy zapojené do proteosyntézy, mediátorová RNA (mRNA), ribozomální RNA (rRNA), transferová RNA (tRNA). • mRNA: přenos informace pro syntézu proteinů. • rRNA: nekódující RNA, složka ribozomů. Využívaná pro studium evolučních vztahů. Nezbytná pro správnou funkci ribozomů, tj. evolučně konzervovaná. • tRNA: transport aminokyselin pro proteosyntézu. Obsahují místo pro připojení aminokyseliny a antikodon pro interakci s mRNA. DNA RNA Proteiny Protein Ribosom AGC GUA CGG Ser His Ala mRNA – nástroje a databáze DNA RNA Proteiny • Prokaryotická mRNA je často polycistronická (multigenní, polygenní) – obsahuje přepisy několika genů. Transkripce je u prokaryot úzce spřažena s translací. Životnost bakteriální mRNA je krátká. • Eukaryotická mRNA je monocistronická. Vzniká jako pre-mRNA (prekurzorová mRNA), podléhá modifikacím (tvorba komplexů s proteiny, úprava 5´ konce čepičkou, polyadenylace 3´ konce) a sestřihu. • Predikční nástroje: predikce míst sestřihu (souvislost s predikcí genů) a dalších specifických míst a oblastí, predikce interakcí (s proteiny a další RNA), predikce modifikací, predikce lokalizace. mRNA – predikce míst sestřihu DNA RNA Proteiny SpliceAI „Compared with other state-of-the-art splice site prediction tools, SpliceFinder generates results in about half lower false positive while keeping recall higher than 0.8. Also, SpliceFinder captures the non-canonical splice sites.“ „We demonstrate that MapSplice achieves higher sensitivity and specificity than TopHat and SpliceMap on a set of simulated RNAseq data. Experimental studies also support the accuracy of the algorithm.“ „Compared to current methods, SpliceMap can achieve 12% higher sensitivity without sacrificing specificity.“ „The TopHat pipeline is much faster than previous systems, mapping nearly 2.2 million reads per CPU hour, which is sufficient to process an entire RNA-Seq experiment in less than a day on a standard desktop computer.“ Běžný predikční program mRNA – predikce polyA (pA) míst DNA RNA Proteiny • Polyadenylace 3´ konce – připojení poly(A) sekvence na 3´ konec pre-mRNA. Štěpení poblíž polyadenylačního signálu, poté připojení 50-250 A. • Význam pro stabilitu, export a translaci mRNA. • Geny mohou mít více polyadenylačních míst (alternativní polyadenylace). 1 gen = více transkriptů (mRNA isoformy) s různou stabilitou a efektivitou translace; popřípadě mohou vznikat různé formy proteinů. Deep neural network-based PolyA SiTe Analysis https://acronymify.com/ mRNA – predikce mRNA:miRNA interakcí DNA RNA Proteiny • miRNA – microRNA. Krátké nekódující jednovláknové řetězce RNA. Regulace genové exprese – vazba na komplementární úseky mRNA vede ke snížení produkce proteinu (inhibice translace, destabilizace mRNA). • Chybná (snížená x zvýšená) produkce microRNA pozorována u různých nemocí. • Léčiva budoucnosti? 2019 Fáze 1 – testování na malé skupině osob, nejčastěji zdravých dobrovolnících. Stanovení nejvyšší tolerované dávky, sledování vedlejších účinků. Fáze 2 – testování na malém počtu vybraných pacientů. Teprve tady se sleduje, jestli léčivo skutečně funguje – prokázání léčebných účinků. Fáze 3 – testování na velkém množství pacientů, ověření účinnosti. V případě úspěchu končí schválením a registrací léčiva, lze použít pro zdravotní péči. Fáze 4 – sledování nežádoucích účinků při dlouhodobém užívání, interakcí s jinými léčivy, vzácných vedlejších účinků. mRNA – predikce mRNA:miRNA interakcí DNA RNA Proteiny • miRNA – microRNA. Krátké nekódující jednovláknové řetězce RNA. Regulace genové exprese – vazba na komplementární úseky mRNA vede ke snížení produkce proteinu (inhibice translace, destabilizace mRNA). • Chybná (snížená x zvýšená) produkce microRNA pozorována u různých nemocí. • Léčiva budoucnosti? 2021 mRNA – predikce mRNA:miRNA interakcí DNA RNA Proteiny • miRNA – microRNA. Krátké nekódující jednovláknové řetězce RNA. Regulace genové exprese – vazba na komplementární úseky mRNA vede ke snížení produkce proteinu (inhibice translace, destabilizace mRNA). • Chybná (snížená x zvýšená) produkce microRNA pozorována u různých nemocí. • Léčiva budoucnosti? http://mirdb.org/ rRNA – nástroje a databáze Protein Ribosom • rRNA tvoří 2/3 ribozomu. Ribozomy jsou komplexní makromolekulární struktury, skládají se z malé a velké podjednotky, obsahují RNA a proteiny. • rRNA se vyskytuje v buňce ve velkém množství (80 % RNA). • Jednotky S: prvotní analýzy ribozomů byly dělány pomocí ultracentrifugace. Svedberg (S) – jednotka sedimentačního koeficientu pojmenovaná podle Theodora Svedberga. Svedberg byl plodný vědec – měl Nobelovu cenu, čtyři manželky (postupně) a dvanáct dětí. Jeho dalším koníčkem byla botanika a malování. • rRNA je vysoce konzervovaná (především 2D, 3D struktura). Využívána pro fylogenetické analýzy a studium biodiverzity (konzervované úseky, variabilní úseky genů). Molekulární fylogeneze • Fylogenetická data jsou získávána zkoumáním charakteristických znaků studovaných organismů. • Prvotně používány pouze MORFOLOGICKÉ znaky. Problém – fosilní pozůstatky většinou NEKVALITNÍ, neposkytují žádané informace nebo se VŮBEC nedochovají. • Kde se dá inteligentně umřít: Mamuťátko „Lyuba“ (protože když to pojmenujete, asi se to lépe pitvá?). Rancho La Brea tar pits – asfaltová jezírka Kosti šavlozubých koťátek. Molekulární fylogeneze • Fylogenetická data jsou získávána zkoumáním charakteristických znaků studovaných organismů. • Prvotně používány pouze MORFOLOGICKÉ znaky. Problém – fosilní pozůstatky většinou NEKVALITNÍ, neposkytují žádané informace nebo se VŮBEC nedochovají. • Molekulární fylogenetická dat = sekvence nukleových kyselin, proteinů ze současných taxonů. • Jednotlivé stavy (nukleotidy, aminokyseliny) jsou jednoznačné a nezaměnitelné a vhodné pro matematické a statistické analýzy. • Příklad: kdo jsou nejbližší příbuzní hrochů? Zoo Ostravacmsch.cz https://www.whalesoficeland.is/ Molekulární fylogeneze • Fylogenetická data jsou získávána zkoumáním charakteristických znaků studovaných organismů. • Prvotně používány pouze MORFOLOGICKÉ znaky. Problém – fosilní pozůstatky většinou NEKVALITNÍ, neposkytují žádané informace nebo se VŮBEC nedochovají. • Molekulární fylogenetická dat = sekvence nukleových kyselin, proteinů ze současných taxonů. • Jednotlivé stavy (nukleotidy, aminokyseliny) jsou jednoznačné a nezaměnitelné a vhodné pro matematické a statistické analýzy. • Příklad: kdo jsou nejbližší příbuzní hrochů? Zoo Ostrava https://www.whalesoficeland.is/ rRNA – nástroje a databáze Protein Ribosom • Využití pro fylogenetické analýzy: small subunit ribosomal RNA (SSU rRNA) – rRNA z malé ribozomální podjednotky • 16S rRNA – prokaryota • 18S rRNA – eukaryota Silva = latinsky les Vyhledávání podle názvu https://www.arb-silva.de/ rRNA – nástroje a databáze Protein Ribosom • Využití pro fylogenetické analýzy: small subunit ribosomal RNA (SSU rRNA) – rRNA z malé ribozomální podjednotky • 16S rRNA – prokaryota • 18S rRNA – eukaryota Silva = latinsky les Vyhledávání podle názvu https://www.arb-silva.de/ rRNA – nástroje a databáze Protein Ribosom • Small subunit ribosomal RNA (SSU rRNA) – rRNA z malé ribozomální podjednotky • 16S rRNA – prokaryota • 18S rRNA – eukaryota • 16s rRNA – studium biodiverzity (metagenomika) Kandy už má potomky… Assam bude moci za chvilku poskytovat vzorek… https://ngs.arb-silva.de/silvangs/ https://hmpdacc.org/hmp/overview/ tRNA – nástroje a databáze AGC GUA CGG Ser His Ala • tRNA - transport aminokyselin pro proteosyntézu. Obsahují místo pro připojení aminokyseliny a antikodon pro interakci s mRNA. Existují ve dvou stavech, s/bez aminokyseliny. • Na 3´ konci je vždycky sekvence CCA (kódovaná nebo připojená enzymaticky) – sloužící k připojení aminokyseliny. • tRNA podléhá mnoha posttranskripčním modifikacím, obsahuje neobvyklé nukleotidy (důležité pro strukturu a funkci). • Typická sekundární struktura: jetelový list („cloverleaf“). tRNA – databáze AGC GUA CGG Ser His Alahttp://tpsic.igcz.poznan.pl/ tRNA – databáze Sekundární struktura Terciární struktura PyMOL 9) Predikce 2D, 3D a 4D struktury proteinů. Souřadnice. Formáty. Vizualizačnínástroje. http://tpsic.igcz.poznan.pl/ tRNA – databáze http://tpsic.igcz.poznan.pl/ Sekundární struktura Terciární struktura tRNA – modifikace Sekundární struktura Schematické znárodnění míst/míry výskytu modifikací https://iimcb.genesilico.pl/modomics/ RNA • RNA: tři hlavní formy zapojené do proteosyntézy, mediátorová RNA (mRNA), ribozomální RNA (rRNA), transferová RNA (tRNA). Mnoho dalších typů a funkcí, např.: • miRNA (micro RNA) – mikroRNA, krátké nekódující jednovláknové řetězce RNA. Regulace genové exprese. • snRNA (small nuclear RNA) – malá jaderná RNA, asociovány s proteiny, zapojení do sestřihu. • snoRNA (small nucleolar RNA) – malá jadérková RNA, úprava pre-rRNA. Většina savčích snoRNA pochází z intronových sekvencí pre-mRNA. Geny obsahující tyto introny většinou kódují proteiny zapojené do biosyntézy ribozomů. • scRNA (small cytoplasmic RNA) – malá cytoplazmatická RNA, obecně jakákoliv malá RNA v cytoplazmě, která není přímo zapojená do proteosyntézy. • lncRNA (long non-coding RNA) – dlouhé nekódující RNA, RNA > 200 nukleotidů, regulační funkce. Mohou vznikat přepisem intergenových nebo intronových sekvencí. • … • … • … • ??? RNA https://rnacentral.org/ RNA – struktura • RNA: primární, sekundární a terciární struktura. • Primární: lineární sekvence bází. • Sekundární: základním prvkem jsou dvouvláknové úseky vzniklé párováním bází (A-U, G-C, G-U). • Terciární: 3D (prostorové uspořádání) molekuly RNA. AAGAAGUUUAGGAUAUACAGUCCAA GAGCCUUCAAAGCCCUUAGAAAACA AACAAGUUUAACUUCUGCCA Primární Sekundární Terciární Prvky sekundární struktury Lukáš Žídek Skripta předmětu C9530 Strukturní biochemie RNA – struktura • RNA: může se vyskytovat v mnoha různých strukturních uspořádáních, což odráží množství nejrůznějších funkcí, které plní. • Správná sekundární a terciární struktura je klíčová pro správné fungování RNA. • Sekundární struktura terciární struktura funkce. • Sekundární struktura poskytuje mnoho informací o funkci. • Predikce sekundární struktury RNA je významný bioinformatický problém. Prvky sekundární struktury Vlásenka se smyčkou (hairpin loop) Smyčka Stopka Výduť (bulge) Vnitřní smyčka (internal loop) Křížová struktura (junction) Pseudouzel (pseudoknot) Kissing hairpin Mus musculus, 18S rRNA, jenom část… Mus musculus, 18S rRNA, celá RNA – struktura • RNA: může se vyskytovat v mnoha různých strukturních uspořádáních, což odráží množství nejrůznějších funkcí, které plní. • Správná sekundární a terciární struktura je klíčová pro správné fungování RNA. • Sekundární struktura terciární struktura funkce. • Sekundární struktura poskytuje mnoho informací o funkci. • Predikce sekundární struktury RNA je významný bioinformatický problém. Mus musculus, 18S rRNA, schematické znázornění 2D struktury ........................(((((((...............(((.(((................................................. ...(((............(((...........................((.(((.....))).)).................((((...((((((......) )))))...))))....(((((........(((((.((((...((((.((((((((....))))))))..)))).)))).....))))).......))))).. .........((((.((((......))))))))....))).........))).(((....(((....(((((((.........))))))))))......))). ..((((...............))))....((.(((..........))).))................)))))).........(((...(((((...))))). )))...............(((((((((.(((....)))..)))))).)))....................................((((((.......... .........................)))))).)))))))........................................(((.(((((((((((((.((((. ...))))....))))))))..)))))))).......((((.(((((...(((((((......)))))))....))))))))).................... ...................................................................................................... ......((((((......((((..((..((((((((...(((......)))......))))))))..)).......((....))...)))).....)).))) ).................((((((........((((.........)))).....)))))).................(((....((((((.(((((....)) )))))))))....)))......................................((((....))))...............(((((.(((((((......(( (((..(((.((((((....((((........))))........(((((......(((((........((.(((........))).))......)))))...( (.(((.....(((.......(((.((.............(((......)))...)).)))..............((((..((((....(((..((((....) ))).)))....))))..))))........(((((.....)))))...................))).......))))).......)))))...)).)))).) )).....((.(((................((..((((....))))..))..............))).))............(((((..........))))). ..........)))))........(((((.......)))))..............)))))))))).)).............((((.((....((((((((.(( (..((((.((...(((((.((((((((((((.....))))))))))))...)))))...)).))))..))).))))))))...)).))))............ ...((((((((((....))))))))))........ „Dot-bracket notation“ (((((((.....))))))) . Nespárovaná báze ( ) Pár bází RNA – predikce 2D struktury • Predikce sekundární struktury RNA je významný bioinformatický problém. • Metody ab initio/ metody komparativní (srovnávací). • Ab initio – predikce je založena na jediné (zkoumané) RNA sekvenci. Vyhledávání nejstabilnější RNA struktury = struktury s nejnižší volnou energií. Tvorba párů bází je energeticky výhodná, zjednodušeně řečeno hledáme tedy strukturu s maximálním možným počtem párů bází. • Komparativní metody – využívají evolučně příbuzné RNA. Předpoklad: homologní sekvence RNA mají stejnou 2D strukturu. Multiple alignment sekvencí RNA, identifikace evolučně konzervované sekundární struktury. Teoreticky lepší, problémem je nutnost mít sadu homologních sekvencí. Ab initio – výlet do historie 1971 • Identifikace všem možných párů bází, které může zkoumaná sekvence sama se sebou tvořit. • A-U, G-C, G-U • Páry jsou různě „obodované“: A-U (1), G-C (2), G-U (0). • Cíl: Složit sekvenci do struktury, kterou získáte nejvíc bodů. Ab initio – výlet do historie 1971 • Co Vám pomůže? Nalezení diagonálních linií (sekvencí čísel), které představují nepřerušovaný spárovaný úsek. Čím delší, tím lepší. Třeba tady můžeme vytvořit tři páry za sebou (G-U, G-C, G-C) než nám to C a U pokazí. Ab initio – výlet do historie Tři nejlepší řešení podle autorů. Všimněte si kladných bodů za páry bází a záporných bodů za smyčky a výdutě. Ab initio – výlet do historie Tři nejlepší řešení podle autorů. Všimněte si kladných bodů za páry bází a záporných bodů za smyčky a výdutě. Ab initio – výlet do historie Řešení I se zbaběle drží nejdelší, byť přerušované, diagonály. Ab initio – výlet do historie Řešení III zkouší zapojit další dvě diagonály…vyplatí se to? Ab initio – výlet do historie Řešení II…kombinace obou? Ab initio – výlet do historie Tři nejlepší řešení podle autorů. Všimněte si kladných bodů za páry bází a záporných bodů za smyčky a výdutě. • Přímý výběr může rozumně fungovat pro krátké sekvence, ideálně s jedním typem sekundární struktury (např. identifikace vlásenek). • Výběr energeticky nejlepší kombinace možností pro větší molekuly by byl extrémně obtížný. • Jednoduchá na provedení, náročná na vyhodnocení. RNA – predikce 2D struktury • Predikce sekundární struktury RNA je významný bioinformatický problém. • Metody ab initio/ metody komparativní (srovnávací). • Ab initio – predikce je založena na jediné (zkoumané) RNA sekvenci. Vyhledávání nejstabilnější RNA struktury = struktury s nejnižší volnou energií. Tvorba párů bází je energeticky výhodná, zjednodušeně řečeno hledáme tedy strukturu s maximálním možným počtem párů bází. http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAfold.cgi 2003 RNA – predikce 2D struktury • Predikce sekundární struktury RNA je významný bioinformatický problém. • Metody ab initio/ metody komparativní (srovnávací). • Komparativní metody – využívají evolučně příbuzné RNA. Předpoklad: homologní sekvence RNA mají stejnou 2D strukturu. Multiple alignment sekvencí RNA, identifikace evolučně konzervované sekundární struktury. Teoreticky lepší, problémem je nutnost mít sadu homologních sekvencí. • Jak identifikovat konzervované sekundární struktury u skupiny příbuzných RNA? • Např. využití kovariance. Princip: funkční motivy RNA jsou strukturně konzervované. Mutace v pozici, která tvoří pár bází, musí být kompenzována mutací v odpovídající komplementární pozici. RNA – predikce 2D struktury • Predikce sekundární struktury RNA je významný bioinformatický problém. • Metody ab initio/ metody komparativní (srovnávací). • Komparativní metody – využívají evolučně příbuzné RNA. Předpoklad: homologní sekvence RNA mají stejnou 2D strukturu. Multiple alignment sekvencí RNA, identifikace evolučně konzervované sekundární struktury. Teoreticky lepší, problémem je nutnost mít sadu homologních sekvencí. • Jak identifikovat konzervované sekundární struktury u skupiny příbuzných RNA? • Např. využití kovariance. Princip: funkční motivy RNA jsou strukturně konzervované. Mutace v pozici, která tvoří pár bází, musí být kompenzována mutací v odpovídající komplementární pozici. RNA – predikce 2D struktury • Predikce sekundární struktury RNA je významný bioinformatický problém. • Metody ab initio/ metody komparativní (srovnávací). • Komparativní metody – využívají evolučně příbuzné RNA. Předpoklad: homologní sekvence RNA mají stejnou 2D strukturu. Multiple alignment sekvencí RNA, identifikace evolučně konzervované sekundární struktury. Teoreticky lepší, problémem je nutnost mít sadu homologních sekvencí. http://rna.tbi.univie.ac.at/cgi-bin/RNAWebSuite/RNAalifold.cgi RNA – alignment • RNA – nízká chemická komplexita, sekvence obsahuje pouze čtyři znaky. • Nízká citlivost RNA alignmentu – zhoršená možnost použití sekvenční podobnosti pro odhad biologického významu alignmentu. • RNA – evolučně konzervovaná struktura (kompenzační mutace). • Sekvenční identita/podobnost může být u RNA špatným ukazatelem biologické podobnosti a evolučně konzervované struktury. • Řešení: zohlednění sekundární struktury RNA při alignmentu. http://tcoffee.crg.cat/apps/tcoffee/index.html Alignment a predikce sekundární struktury RNA jsou velmi úzce související problémy. LocARNA is a tool for multiple alignment of RNA molecules. LocARNA requires only RNA sequences as input and will simultaneously fold and align the input sequences. Specifications of additional constraints or fixed input structures are possible. LocARNA outputs a multiple alignment together with a consensus structure. For the folding it makes use of a very realistic energy model for RNAs as it is by RNAfold of the Vienna RNA package (or Zuker's mfold). RNA – alignment • RNA – nízká chemická komplexita, sekvence obsahuje pouze čtyři znaky. • Nízká citlivost RNA alignmentu – zhoršená možnost použití sekvenční podobnosti pro odhad biologického významu alignmentu. • RNA – evolučně konzervovaná struktura (kompenzační mutace). • Alignment a predikce sekundární struktury RNA jsou velmi úzce související problémy. • Fold and align: souběžné řešení obou problémů. Alignment + konsenzuální sekundární struktura http://rna.informatik.uni-freiburg.de/LocARNA/Input.jsp RNA – predikce 3D struktury • Vznik 3D struktury RNA in vivo (folding) mnohdy zahrnuje interakce s proteiny, ionty kovů, jinou RNA a dalšími typy molekul. • RNA může tvořit mnoho dalších interakcí kromě kanonického párování bází. • Komparativní metody vycházející z experimentálně získaných struktur (template-based). • Simulace procesu foldingu (template-free): Sekundární struktura terciární struktura (model). • Hybridní metody – kombinace obou přístupů (de novo modeling), významné zapojení experimentálně získaných poznatků (konformace ze známých struktur, fragment assembly). Nejúspěšnější. RNA – predikce 3D struktury • Vznik 3D struktury RNA in vivo (folding) mnohdy zahrnuje interakce s proteiny, ionty kovů, jinou RNA a dalšími typy molekul. • RNA může tvořit mnoho dalších interakcí kromě kanonického párování bází. • Komparativní metody vycházející z experimentálně získaných struktur (template-based). • Simulace procesu foldingu (template-free): Sekundární struktura terciární struktura (model). • Hybridní metody – kombinace obou přístupů (de novo modeling), významné zapojení experimentálně získaných poznatků (konformace ze známých struktur, fragment assembly). Nejúspěšnější. RNA – „inverse folding“ • RNA: může se vyskytovat v mnoha různých strukturních uspořádáních, což odráží množství nejrůznějších funkcí, které plní. • RNA desing: návrh a syntéza sekvence RNA, která se složí do požadovaného tvaru a může vykonávat požadovanou funkci. • Cílené doručování léčiv – RNA aptamery (specifická vazba na receptory buněk). • Ribozymy (katalyticky aktivní molekuly RNA) – štěpení cílové RNA. • Regulace exprese genů. • Imunoterapie s využitím RNA nanočástic. GGGAACCUGAUCAUGUAGAUCGAAUG GACUCUAAAUCCGUUCAGCCGGGUUA GAUUCCCGGGGUUUCCGCCAUGGCGU UCGUACUUAAAUAUGGAAUUAACUAU UCCAAUUUUCGCUACGAACUCCG RNA – „inverse folding“ • RNA: může se vyskytovat v mnoha různých strukturních uspořádáních, což odráží množství nejrůznějších funkcí, které plní. • RNA desing: návrh a syntéza sekvence RNA, která se složí do požadovaného tvaru a může vykonávat požadovanou funkci. • Cílené doručování léčiv – RNA aptamery (specifická vazba na receptory buněk). • Ribozymy (katalyticky aktivní molekuly RNA) – štěpení cílové RNA. • Regulace exprese genů. • Imunoterapie s využitím RNA nanočástic. GGGAACCUGAUCAUGUAGAUCGAAUG GACUCUAAAUCCGUUCAGCCGGGUUA GAUUCCCGGGGUUUCCGCCAUGGCGU UCGUACUUAAAUAUGGAAUUAACUAU UCCAAUUUUCGCUACGAACUCCG https://eternagame.org/home/ RNA – „inverse folding“ • RNA: může se vyskytovat v mnoha různých strukturních uspořádáních, což odráží množství nejrůznějších funkcí, které plní. • RNA desing: návrh a syntéza sekvence RNA, která se složí do požadovaného tvaru a může vykonávat požadovanou funkci. • Cílené doručování léčiv – RNA aptamery (specifická vazba na receptory buněk). • Ribozymy (katalyticky aktivní molekuly RNA) – štěpení cílové RNA. • Regulace exprese genů. • Imunoterapie s využitím RNA nanočástic. GGGAACCUGAUCAUGUAGAUCGAAUG GACUCUAAAUCCGUUCAGCCGGGUUA GAUUCCCGGGGUUUCCGCCAUGGCGU UCGUACUUAAAUAUGGAAUUAACUAU UCCAAUUUUCGCUACGAACUCCG RNA – „inverse folding“ RNA – „inverse folding“ RNA – predikce ncRNA • Metody založené na homologii. Musíme brát v úvahu sekvenční i strukturní homologii. Rychlé, ale málo citlivé. • Metody využívající typické vlastnosti a parametry RNA. Vysoká falešná pozitivita. • Metody založené na sekvenování. Izolace a sekvenace všech RNA, odstranění transkriptů kódujících proteiny a známých ncRNA. • Specifické metody používané pro konkrétní rodiny ncRNA. • miRNA – velmi krátké (22 nt), málo sekvenčně konzervované. Relativně konzervovaná sekundární struktura. • lncRNA – nízká sekvenční i strukturní konzervovanost, mohou podléhat sestřihu. RNA – predikce ncRNA • Metody založené na homologii. Musíme brát v úvahu sekvenční i strukturní homologii. Rychlé, ale málo citlivé. • Metody využívající typické vlastnosti a parametry RNA. Vysoká falešná pozitivita. • Metody založené na sekvenování. Izolace a sekvenace všech RNA, odstranění transkriptů kódujících proteiny a známých ncRNA. • Specifické metody používané pro konkrétní rodiny ncRNA. • miRNA – velmi krátké (22 nt), málo sekvenčně konzervované. Relativně konzervovaná sekundární struktura. • lncRNA – nízká sekvenční i strukturní konzervovanost, mohou podléhat sestřihu. RNA – predikce ncRNA • Metody založené na homologii. Musíme brát v úvahu sekvenční i strukturní homologii. Rychlé, ale málo citlivé. • Metody využívající typické vlastnosti a parametry RNA. Vysoká falešná pozitivita. • Metody založené na sekvenování. Izolace a sekvenace všech RNA, odstranění transkriptů kódujících proteiny a známých ncRNA. • Predikce tRNA – největší ncRNA rodina, výskyt u všech živých organismů. Charakteristická sekundární struktura. • tRNAscan-SE – využití kovariančních modelů, predikce sekundární struktury identifikovaných tRNA a funkce (antikodon). http://lowelab.ucsc.edu/tRNAscan-SE/ Vyhledání homologních sekvencí v databázi Anotace genomů https://www.ncbi.nlm.nih.gov/genome/annotation_prok/ RNA-Seq („RNA-sequencing“) • Sekvenování transkriptomu s využitím moderních „high-throughput“ technologií. • Expresní profilování, studium alternativního sestřihu, identifikace nových typů transkriptů (RNA). • Náročný vícekrokový proces, nutná důsledná kontrola dat. • Bioinformatika: kontrola kvality dat, rekonstrukce transkriptomu (např. mapování na referenční genom/transkriptom), kvantifikace exprese, identifikace posttranskripčních modifikací. • Metatranskriptomika – studium celkové RNA skupiny organismů získané přímo z jejich přirozeného životního prostředí. Identifikace druhů, chování celé komunity za konkrétních životních podmínek. RNA-Seq („RNA-sequencing“) • Sekvenování transkriptomu s využitím moderních „high-throughput“ technologií. • Expresní profilování, studium alternativního sestřihu, identifikace nových typů transkriptů (RNA). • Náročný vícekrokový proces, nutná důsledná kontrola dat. • Bioinformatika: kontrola kvality dat, rekonstrukce transkriptomu (např. mapování na referenční genom/transkriptom), kvantifikace exprese, identifikace posttranskripčních modifikací. • Metatranskriptomika – studium celkové RNA skupiny organismů získané přímo z jejich přirozeného životního prostředí. Identifikace druhů, chování celé komunity za konkrétních životních podmínek. Shrnutí • Tři hlavní formy RNA (mRNA, rRNA, tRNA) jsou zapojené do proteosyntézy. • + mnoho dalších typů RNA, plnících rozličné funkce (často regulační). • Geny pro rRNA – fylogenetické analýzy. • Predikční nástroje často využívané pro predikce modifikací a interakcí RNA. • Primární/sekundární/terciární struktura RNA. • Predikce 2D struktury: ab initio, komparativní metody. • Predikce 3D struktury: template-based, template-free, hybridní metody. • „Inverse folding“ – design RNA pro specifické účely. • Alignment: nutné/vhodné zahrnout strukturní informace. • Existuje transkriptomika a metatranskriptomika  …a zahrajte si Eternu! Zoo Ostrava Použitá a doporučená literatura