Zkouška: Test+přednáška/prezentace+novádata(výběrtermínu) Prezentace-Analýzaproteinu Obsahtétopřednášky Konkrétnínovádata–článek(<5let)okomplexu(neboproteinu) Ujasnitsi souvislosti,rozšířitsi znalosti,aplikovatpoznatkyzpřednášek Analýzaproteinu • Popis a funkce • Konzervovanost (Alignment) • Evoluce (fylogenetický strom) • Zjištění přítomnosti domén daného proteinu • Zjištění interakčních partnerů • Struktura proteinu – Alphafold/Colabfold • Úprava proteinového modelu v PyMol • Zvýraznění interakčních aminokyselin • Zvýraznění domén UniProtajehomožnosti Hledání proteinu Dle názvu Dle sekvence Souvislosti Funkce Interaktom Mutace Vizualizace Alphafold Lokalizace proteinu Stahování dat Analýzy BLAST Alignment Komplexní, vysoce kvalitní a volně přístupný zdroj sekvenčních a funkčních informací o proteinech https://www.uniprot.org/ JJ0 Snímek 4 JJ0 Uniprot - odrazový můstek, vytažení podstatných informací, SNP, hrubý nástřel domén - provedení po webu Jitka Jemelková; 2023-04-15T18:20:41.865 Výběr databáze Název genu Název proteinu Onemocnění Search bar Pokročilé vyhledávání UniProt https://www.uniprot.org/ UniProt–Pokročilévyhledávání ID Název genu Název proteinu Organismus Výběr databáze Název genu Název proteinu Onemocnění Search bar Pokročilé vyhledávání Vyhledávání pomocí „accessions“ nebo ID UniProt https://www.uniprot.org/ UniProt–IDmapping Vyhledávání více proteinů najednou UniProt https://www.uniprot.org/ Tools Uložená data/analýzy Nacosidátpozor Data, která jsou ručně zkontrolována Označení žlutým listem s hvězdičkou Automaticky anotované UniProt–Vyhledáváníproteinu HsSMC5 protein Vycházet z dostupné literatury/nejnovější články Databáze nemusí obsahovat aktuální informace Přednáška:Analýzaproteinu • Popis a funkce • Konzervovanost (Alignment) • Evoluce (fylogenetický strom) • Zjištění přítomnosti domén daného proteinu Alignment • Porovnání příbuzných proteinů (Multiple sequence alignment) • Sekvenční podobnost • Strukturní podobnost (Alphafold) • Souvisí s přítomností konzervovaných domén/aminokyselin • Funkční, strukturní souvislosti • Evoluční, fylogenetické vztahy • Strukturní podobnost • šroubovice konzervované • Hledání podobného „patternu“ – hydrofobní, nabité aminokyseliny Základníalignment • BLAST – hledání příbuzných sekvencí • Lze vybrat i organismy, u kterých bude vyhledávat podobné proteiny • Podívat se i na fylogeneticky vzdálenější organismy • Grafické rozhraní – napoví o konzervovanosti Výběr organismů Vyloučení organismů https://blast.ncbi.nlm.nih.gov/Blast.cgi Základníalignment • BLAST – hledání příbuzných sekvencí Blastování SMC5 sekvence H. sapiens Bez výběru organismů Blastování SMC5 sekvence H. sapiens Bez výběru organismů Drtivá většina nalezených sekvencí pochází z primátů Nenapoví to o fylogenezi Výběr organismů Homo sapiens Mus musculus Gallus gallus Xenopus laevis Danio rerio S. cerevisiae S. pombe Základníalignment Blastování SMC5 sekvence H. sapiens s výběrem organismů SMC5 proteiny vzdálených organismů SMC6 proteiny Vybrat i vzdálenější organismy. Čím více sekvencí, tím lépe Porovnání sekvence proteinu SMC5 Homo sapiens sapiens a Danio rerio Porovnání sekvence proteinu SMC5 Homo sapiens a Gorilla gorilla Základníalignment • Pair-Alignment příbuzných sekvencí v BLAST BLASTnaUniProt https://www.uniprot.org/blast BLASTnaUniProt https://www.uniprot.org/blast Sekvenčnípodobnost/alignmentnaUniProt https://www.uniprot.org/align MultipleSequenceAlignment https://www.ebi.ac.uk/Tools/msa/muscle/ MultipleSequenceAlignment muscle-I20230503-064457-0144-4283286-p1m.clw Prezentacevýsledkůokonzervovanosti(inspirace) • Přenést základní sekvenci do wordu • Postupně přidávat další sekvence • nejlépe i fylogeneticky vzdálenější – napoví o konzervovanosti • Zaznačit aminokyseliny či pattern, který je podobný • Hydrofobní aminokyseliny: L,V,A,M,F,I,W • Záporně nabité aminokyseliny: D,E • Kladně nabité aminokyseliny: R,K • Nenabité aminokyseliny: T,S,C,N,Q • Malé aminokyseliny: P,G (otočka) • Lze proložit i sekundární strukturou AlignmentpodjednotkySMC5 doc. Jan Paleček (Lelkes et al. 2023) Hydrofobní aminokyseliny: L,V,A,M,F,I,W Záporně nabité aminokyseliny: D,E Kladně nabité aminokyseliny: R,K Nenabité (neutrální) aminokyseliny: T,S,C,N,Q Malé aminokyseliny: P,G (otočka) AlignmentpodjednotkySMC5 doc. Jan Paleček (Lelkes et al. 2023) Hydrofobní aminokyseliny: L,V,A,M,F,I,W Záporně nabité aminokyseliny: D,E Kladně nabité aminokyseliny: R,K Nenabité (neutrální) aminokyseliny: T,S,C,N,Q Malé aminokyseliny: P,G (otočka) Pokročilýalignment • BLAST nenajde příbuzné sekvence s vaším proteinem • Nalezení proteinu, který by měl být homologem/ortologem • Alignment příbuzných sekvencí v BLAST • Přenesení výsledků do dokumentu (word) • Postupné přidávání dalších sekvencí • Využití informace • sekundární struktura (PSIPRED) • terciální struktura (Alphafold) • Značení patternu 29 StrukturnípodobnostpodjednotkyNSE5 PpNSE5 AtNSE5 ScNSE5 Alphafold doc. Jan Paleček (unpublished)HsSIMC1 AlignmentpodjednotkyNSE5 doc. Jan Paleček (unpublished) • NCBI Conserved domain search https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi • UniProt https://www.uniprot.org/ • Protein může být popsaný a charakterizovaný v publikacích • Příbuzné organismy - porovnání • Interakční motivy – kratší než domény (jednotky aminokyselin) • Online tools/programy na jejich vyhledávání Zjištěníkonzervovanýchdoménproteinu Zjištěníkonzervovanýchdoménproteinu UniProt Vymezení strukturních/ funkčních oblastí proteinu Zjištěníkonzervovanýchdoménproteinu Zadat sekvenci proteinu Propojení na NCBI Conserved domains Zjištěníkonzervovanýchdoménproteinu https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi Schématagenů/proteinů • Powerpoint • BioRender • CorelDRAW a jiné… Schémata genů • Zaznačení exonů, intronů, UTR sekvencí • Místa mutací – původní nukleotid/pozice/ změněn na jaký nukleotid (A325G) Schémata proteinů • Domény • Jaké mají mutace efekt na proteinové úrovni? Při publikacích pozor, ať obrázky neztrácí kvalitu při zoomu. Tomaštíková et al. 2023 Přednáška:Analýzaproteinu • Popis a funkce • Konzervovanost (Alignment) • Evoluce (fylogenetický strom) • Zjištění přítomnosti domén daného proteinu • Zjištění interakčních partnerů Databázeprotein-proteinovýchinterakcí Informace o interakcích i v Uniprot + odkazy na databáze Obsahují podobné informace Nutné vyfiltrovat převážně fyzické interakce (protein-protein), binární ComplexPortal Protein je součástí komplexu https://www.ebi.ac.uk/complexportal/home IntAct q Filtry – typ interakce Detekční metoda interakce – binární, koimunoprecipitace? https://www.ebi.ac.uk/intact/home IntAct Přednáška:Analýzaproteinu • Popis a funkce • Konzervovanost (Alignment) • Evoluce (fylogenetický strom) • Zjištění přítomnosti domén daného proteinu • Zjištění interakčních partnerů • Struktura proteinu – Alphafold/Colabfold • Úprava proteinového modelu v PyMol • Zvýraznění interakčních aminokyselin • Zvýraznění domén Predikcesekundárnístruktury • PSIPRED: http://bioinf.cs.ucl.ac.uk/psipred PSIPRED–predikcesekundárnístruktury PSIPRED–predikcesekundárnístruktury AlphaFold–predikce3Dstrukturyproteinu 1) Využití databáze PDB (stažení PDB modelu) 2) 3D predikce proteinu na UniProt – odkaz na Alphafold databázi https://www.rcsb.org/ Alphafold = predikce Nemusí odrážet realitu AlphaFold–predikce3Dstrukturyproteinu • Využití online predikce Alphafold • LatchBio: https://console.latch.bio/workflows • Umožňuje i predikci 3D struktury proteinového komplexu LatchBioAlphaFold • unrelaxed_model_x.pdb: output • relaxed_model_x.pdb: after performing an Amber relaxation procedure on the unrelaxed structure prediction • ranked_x.pdb: A PDB format containing the relaxed predicted structures, after reordering by model confidence. • ranked_0.pdb should contain the prediction with the highest confidence • ranked_4.pdb the prediction with the lowest confidence Zpracování3Dpredikce(PyMOL) A: Action S: Show H: Hide L: Label C: Color Stahování obrázků Zobrazení sekvence Display/Sequence ÚkonyvPyMol • Změna barvy celého proteinu • Zvýraznění domén • Zvýraznění sekundárních struktur • Zvýraznění aminokyselin • Postranní řetězce • Stahování obrázků • Tvorba videa Zvýrazněníaminokyseliny • Označení aminokyseliny (levé tlačítko myši) • Pravé tlačítko myši – Color • Pravé tlačítko myši – Show  Side chain  Stick Zvýrazněníaminokyseliny • Označení aminokyseliny (levé tlačítko myši) • Pravé tlačítko myši – Color • Pravé tlačítko myši – Show  Side chain  Stick TvorbavideavPyMol Pymol: Movie Program  Camera Loop  Y roll  16 second • Trial verze PyMol nepodporuje stažení videí, ale studentská verze ano TvorbavideavPyMol Pymol: Movie Program  Camera Loop  Y roll  16 second • Trial verze PyMol nepodporuje stažení videí, ale studentská verze ano • Využití aplikace BandiCam https://www.bandicam.com/cz/ Snímání obrazovky monitoru Přednáška:Analýzaproteinu • Popis a funkce • Konzervovanost (Alignment) • Evoluce (fylogenetický strom) • Zjištění přítomnosti domén daného proteinu • Zjištění interakčních partnerů • Struktura proteinu – Alphafold/Colabfold • Úprava proteinového modelu v PyMol • Zvýraznění interakčních aminokyselin • Zvýraznění domén Zkouška: test11.5.20239:00C2-211 +přednáška/prezentace+novádata(výběrtermínu) Prezentace-Analýzaproteinu Konkrétnínovádata–článek(<5let)okomplexu(neboproteinu) Ujasnitsi souvislosti,rozšířitsi znalosti,aplikovatpoznatkyzpřednášek…