Zkouška: test11.5.20239:00C2-211 +přednáška/prezentace+novádata(výběrtermínu) Prezentace-Analýzaproteinu Obsahtétopřednášky Konkrétnínovádata–článek(<5let)okomplexu(neboproteinu) Ujasnitsi souvislosti,rozšířitsi znalosti,aplikovatpoznatkyzpřednášek… Analýzaproteinu • Popis a funkce • Konzervovanost (Alignment) • Evoluce (fylogenetický strom) • Zjištění přítomnosti domén daného proteinu • Struktura proteinu – Alphafold/Colabfold • Zjištění interakčních partnerů • Úprava proteinového modelu v PyMol • Zvýraznění interakčních aminokyselin • Zvýraznění domén UniProtajehomožnosti Hledání proteinu Souvislosti Funkce Interaktom Mutace Vizualizace Alphafold Lokalizace proteinu Stahování dat Analýzy BLAST Alignment Komplexní, vysoce kvalitní a volně přístupný zdroj sekvenčních a funkčních informací o proteinech https://www.uniprot.org/ Výběr databáze Název genu Název proteinu Onemocnění Search bar Pokročilé vyhledávání UniProt https://www.uniprot.org/ UniProt–Pokročilévyhledávání ID Název genu Název proteinu Organismus Výběr databáze Název genu Název proteinu Onemocnění Search bar Pokročilé vyhledávání Vyhledávání pomocí „accessions“ nebo ID UniProt https://www.uniprot.org/ UniProt–IDmapping Vyhledávání více proteinů najednou UniProt https://www.uniprot.org/ Tools Uložená data/analýzy Nacosidátpozor Data, která jsou ručně zkontrolována Označení žlutým listem s hvězdičkou Automaticky anotované UniProt–Vyhledáváníproteinu ScSMC5 protein Doporučení:Využítinformacez literatury/článků UniProt–Vyhledáváníproteinu Breast cancer type 1 susceptibility protein BRCA1 UniProt–Vyhledáváníproteinu Probereme během této přednášky Přednáška:Analýzaproteinu • Popis a funkce • Konzervovanost (Alignment) • Evoluce (fylogenetický strom) • Zjištění přítomnosti domén daného proteinu Alignment • Porovnání příbuzných proteinů (Multiple sequence alignment) • Sekvenční podobnost • Strukturní podobnost (Alphafold) • Souvisí s přítomností konzervovaných domén/aminokyselin • Funkční, strukturní souvislosti • Evoluční, fylogenetické vztahy • Strukturní podobnost • šroubovice konzervované • Hledání podobného „patternu“ – hydrofobní, nabité aminokyseliny Základníalignment • BLAST – hledání příbuzných sekvencí • Lze vybrat i organismy, u kterých bude vyhledávat podobné proteiny • Podívat se i na fylogeneticky vzdálenější organismy • Grafické rozhraní – napoví o konzervovanosti Výběr organismů Vyloučení organismů https://blast.ncbi.nlm.nih.gov/Blast.cgi Základníalignment • BLAST – hledání příbuzných sekvencí Blastování SMC5 sekvence S. cerevisiae Bez výběru organismů Blastování SMC5 sekvence S. cerevisiae Bez výběru organismů Drtivá většina nalezených sekvencí pochází z kvasinek Nenapoví to o fylogenezi Blastování SMC5 sekvence S. cerevisiae Výběr organismů Homo sapiens Mus musculus Gallus gallus Xenopus laevis Danio rerio S. cerevisiae S. pombe SMC5 proteins SMC6 proteins Doporučení: Vybrat i vzdálenější organismy. Čím více sekvencí, tím lépe Porovnání SMC5 sekvence S. cerevisiae a Mus musculus Porovnání SMC5 sekvence S. cerevisiae a S. boulardii Základníalignment • Pair-Alignment příbuzných sekvencí v BLAST BLASTnaUniProt https://www.uniprot.org/blast BLASTnaUniProt https://www.uniprot.org/blast Sekvenčnípodobnost/alignmentnaUniProt https://www.uniprot.org/align MultipleSequenceAlignment https://www.ebi.ac.uk/Tools/msa/muscle/ MultipleSequenceAlignment muscle-I20230503-064457-0144-4283286-p1m.clw Prezentacevýsledkůokonzervovanosti(inspirace) • Přenést základní sekvenci do wordu • Postupně přidávat další sekvence • nejlépe i fylogeneticky vzdálenější – napoví o konzervovanosti • Zaznačit aminokyseliny či pattern, který je podobný • Hydrofobní aminokyseliny: L,V,A,M,F,I,W • Záporně nabité aminokyseliny: D,E • Kladně nabité aminokyseliny: R,K • Nenabité aminokyseliny: T,S,C,N,Q • Malé aminokyseliny: P,G (otočka) • Lze proložit i sekundární strukturou AlignmentCANINdoményupodjednotkyNSE6 • Hydrofobní aminokyseliny: L,V,A,M,F,I,W • Záporně nabité aminokyseliny: D,E • Kladně nabité aminokyseliny: R,K • Nenabité aminokyseliny: T,S,C,N,Q • Malé aminokyseliny: P,G (otočka) doc. Jan Paleček (Lelkes et al. 2023) Hydrofobní aminokyseliny: L,V,A,M,F,I,W Záporně nabité aminokyseliny: D,E Kladně nabité aminokyseliny: R,K Nenabité (neutrální) aminokyseliny: T,S,C,N,Q Malé aminokyseliny: P,G (otočka) Predikce helixu Pokročilýalignment • BLAST nenajde příbuzné sekvence s vaším proteinem • Nalezení jiného proteinu, který by měl být homologem/ortologem • Alignment příbuzných sekvencí v BLAST • Přenesení výsledků do dokumentu (word) • Postupné přidávání dalších sekvencí • Využití informace • sekundární struktura (PSIPRED) • terciální struktura (Alphafold) • Značení patternu 30 StrukturnípodobnostpodjednotkyNSE5 PpNSE5 AtNSE5 ScNSE5 Alphafold doc. Jan Paleček (unpublished)HsSIMC1 AlignmentpodjednotkyNSE5 doc. Jan Paleček (unpublished) • NCBI Conserved domain search https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi • UniProt https://www.uniprot.org/ • Protein může být popsaný a charakterizovaný v publikacích • Příbuzné organismy - porovnání • Interakční motivy – kratší než domény (jednotky aminokyselin) • Online tools/programy na jejich vyhledávání Zjištěníkonzervovanýchdoménproteinu Zjištěníkonzervovanýchdoménproteinu UniProt SUMO-TARGETED UBIQUITIN E3 LIGASE 2 STUbL2 Zjištěníkonzervovanýchdoménproteinu Zadat sekvenci proteinu Propojení na NCBI Conserved domains Zjištěníkonzervovanýchdoménproteinu https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi Schématagenů/proteinů • Powerpoint • BioRender • CorelDRAW 1 45376 BRCT Zinc Finger 299 345 STUbL Schémata genů • Zaznačení exonů, intronů, UTR sekvencí • Místa mutací – původní nukleotid/pozice/ změněn na jaký nukleotid (A325G) • Jaké mají mutace efekt na proteinové úrovni? Schémata proteinů • Domény • Lze zaznačit i efekt mutací Při publikacích pozor, ať obrázky neztrácí kvalitu při zoomu. Přednáška:Analýzaproteinu • Popis a funkce • Konzervovanost (Alignment) • Evoluce (fylogenetický strom) • Zjištění přítomnosti domén daného proteinu • Struktura proteinu – Alphafold/Colabfold Predikcesekundárnístruktury • PSIPRED: http://bioinf.cs.ucl.ac.uk/psipred PSIPRED–predikcesekundárnístruktury PSIPRED–predikcesekundárnístruktury AlphaFold–3Dstrukturyproteinu 1) Využití databáze PDB (stažení PDB modelu) 2) UniProt (lze stáhnout) https://www.rcsb.org/ https://www.uniprot.org/uniprotkb/Q9ZW89/entry Stažení AlphaFold–3Dstrukturyproteinu 3) EMBL – EBI Alphafold Protein Structure Database https://alphafold.ebi.ac.uk/ AlphaFold–predikce3Dstrukturyproteinu • Využití online predikce Alphafold • LatchBio: https://console.latch.bio/workflows • Umožňuje i predikci 3D struktury proteinového komplexu LatchBioAlphaFold • unrelaxed_model_x.pdb: output • relaxed_model_x.pdb: after performing an Amber relaxation procedure on the unrelaxed structure prediction • ranked_x.pdb: A PDB format containing the relaxed predicted structures, after reordering by model confidence. • ranked_0.pdb should contain the prediction with the highest confidence • ranked_4.pdb the prediction with the lowest confidence Přednáška:Analýzaproteinu • Popis a funkce • Konzervovanost (Alignment) • Evoluce (fylogenetický strom) • Zjištění přítomnosti domén daného proteinu • Struktura proteinu – Alphafold/Colabfold • Zjištění interakčních partnerů Databázeprotein-proteinovýchinterakcí Informace o interakcích v literatuře Interakčí databáze - odkazy v UniProt Protein je součástí komplexu BioGRID IntAct MINT STRING Obsahují podobné informace Nutné vyfiltrovat převážně fyzické interakce (protein-protein), binární ComplexPortal Protein je součástí komplexu https://www.ebi.ac.uk/complexportal/home IntAct Filtry – typ interakce Detekční metoda interakce – binární, koimunoprecipitace? https://www.ebi.ac.uk/intact/home IntAct Publikace AlphaFold–predikce3Dstrukturyproteinovéhokomplexu • Využití online predikce Alphafold pro proteinový komplex • LatchBio: https://console.latch.bio/workflows • Umožňuje i predikci 3D struktury proteinového komplexu • Lze vložit i sekvence dvou proteinů – umožní predikci 3D modelu proteinového komplexu Přednáška:Analýzaproteinu • Popis a funkce • Konzervovanost (Alignment) • Evoluce (fylogenetický strom) • Zjištění přítomnosti domén daného proteinu • Struktura proteinu – Alphafold/Colabfold • Zjištění interakčních partnerů • Úprava proteinového modelu v PyMol • Zvýraznění interakčních aminokyselin • Zvýraznění domén Zpracování3Dpredikce(PyMOL) Zobrazení sekvence Display/Sequence A: Action S: Show H: Hide L: Label C: Color Vyhlazení obrazu Publikační kvalita Vytvoření obrázku pro publikaci Zvýrazněníaminokyseliny • Označení aminokyseliny • Pravé tlačítko myši – Color • Pravé tlačítko myši – Show  Side chain  Stick ÚkonyvPyMol • Změna barvy proteinu • Zvýraznění domén • Zvýraznění aminokyselin • Změna barvy • Postranní řetězce • Stahování obrázků • Tvorba videa 1 45376 BRCT Zinc Finger 299 345 STUbL K17 TvorbavideavPyMol • Studentská verze PyMol nepodporuje stažení videí • Využití aplikace BandiCam https://www.bandicam.com/cz/ • Snímání obrazovky monitoru Příklad rotace v PyMol: Movie Program  Camera Loop  Y roll  16 second Přednáška:Analýzaproteinu • Popis a funkce • Konzervovanost (Alignment) • Evoluce (fylogenetický strom) • Zjištění přítomnosti domén daného proteinu • Struktura proteinu – Alphafold/Colabfold • Zjištění interakčních partnerů • Úprava proteinového modelu v PyMol • Zvýraznění interakčních aminokyselin • Zvýraznění domén Zkouška: test11.5.20239:00C2-211 +přednáška/prezentace+novádata(výběrtermínu) Prezentace-Analýzaproteinu Konkrétnínovádata–článek(<5let)okomplexu(neboproteinu) Ujasnitsi souvislosti,rozšířitsi znalosti,aplikovatpoznatkyzpřednášek…