Výpočetní metody v bioinformatice a systémové biologii

Týden 4 - Markovovy modely v bioinformatice - teorie

Hmm-slidy

Hmm R objects

Instalace lokalnich balicku (napr. "HMM"):

> install.packages("HMM")

System se Vas zepta, jestli chcete instalovat lokalne, odpovezte "y".

Ukol

Navrhnete jednouduchy HMM pro klasifikaci sekvenci tvoricich kvadruplexy v DNA. G4-kvadruplex spravidla tvori ctyri shluky 2-5 guaninu oddelenych mezerami 1-8 bp.

Model by mel rozpoznavat skupiny guaninu od smycek nebo mit podobu profiloveho HMM pro urcitou skupinu kvadruplexu.

V hodine

1) Ve sekvneci chromosomu 5 arabidopsis naleznete potencialni kvadruplexy pomoci regularniho vyrazu. Napr. G{2,5}.{1-8}....G{2,5} (prikaz egrep -o) na obou vlaknech.

2) Seznamte se s balikem HMM pro R. Nastavte tranzicni matici modelu HMM v R tak, aby sekvence zacinali znakem G a zustavali ve skrytem stavu potrebny pocet krat (v prumeru).

3) Natrenujte model algoritmem Baum-Welch na mnozine kvadruplexu. Porovnejte puvodni hodnoty parametru s novymi.

4) Pomoci FB algoritmu vyradte 10% kvadruplexu, ktere jsou nejmene pravdepodobne generovany Vasim HMM.

5) Opakujte 2-3x kroky 3 a 4.

Pozdeji nebo doma (5 bodu)

2) Sekvence nekolika stovek kvadruplexu zarovnejte pomoci programu clustalx

3) Ve vystupu clustalx vyberte jednu z vetsich sekvencne podobnych skupin sekvenci.

4) Jednym ze spusobu z prednasky vytvorte profilovy HMM pro danou rodinu kvadruplexu.

5) Odevzdejte fasta soubor s kvadruplexy dane rodiny, HMM v uchovanem obejktu z R/HMM nebo HMMER

6) Odevzdejte 3 sekvence kvadruplexu, ktere maji i jine nukleotidy G nez ty ktere tvori Hoogsteenovy vazby. Oznacte je Viterbiho algoritmem, aby bylo videt, ktere nukleotidy G patri do smycek.

Předchozí

Následující

Výpočetní metody v bioinformatice a systémové biologii
- Nyní studovat
  
  OSNOVA A ZÁKLADNÍ INFORMACE KURZU
- Nyní studovat
  
  Týden 1 - UCSC Genome Browser - uvod
- Nyní studovat
  
  Týden 2 - UCSC Genome Browser - pokrocile funkce
- Nyní studovat
  
  Týden 3 - UCSC a Ensembl Genome Browser - programovatelne dotazy a zber dat
- Nyní studovat
  
  Týden 4 - Interakční sítě v systémové biologii
- Nyní studovat
  
  Týden 5 - Integrace dat
- Nyní studovat
  
  Týden 6 - Měření a data genové exprese
- Nyní studovat
  
  Týden 7 - Analýza expresních profilů
- Nyní studovat
  
  Týden 8 - Bayesovské a boolovské sítě
- Nyní studovat
  
  Týden 9 - Boolovské sítě
- Nyní studovat
  
  Týden 10 - Pokročilá analýza boolovských sítí
- Nyní studovat
  
  Týden 4 - Markovovy modely v bioinformatice - teorie
- Nyní studovat
  
  Týden 5 - Markovovy modely v bioinformatice - profilove HMM
- Nyní studovat
  
  Týden 6 - Markovovy modely v bioinformatice - Bayesovské sítě

Operace

Prohlédnout vše

Interaktivní osnova

Týden 4 - Markovovy modely v bioinformatice - teorie

Operace