C3210 Strukturní Bioinformatika Validace strukturních dat Proč validovat? • Nespolehlivost • „Garbage in garbage out“ • Selektivita dat Krize reprodukce výsledků https://www.nature.com/articles/533452a Proč? Více než 70 % respondentů odpovědělo, že mají zkušenost s neúspěšným pokusem o zopakování experimentů z jiných laboratoří. Nárůst proteinových struktur v PDB databázi https://www.rcsb.org/statsRok Početstruktur Zastoupení vložených struktur podle metody https://www.rcsb.org/stats 86,3 % Proteinová krystalografie 7 % NMR 6,5 % Cryo-EM Selekce struktur podle rozlišení https://www.rcsb.org/stats Početstruktur Rozlišení (Ångström [Å]) Opakování – proteinová krystalografie Zisk difrakčních dat Výpočet elektronové hustoty Interpretace elektronové hustoty pomocí modelu Krok 1 Krok 2 Krok 3 Proteinová krystalografie https://www.rcsb.org/structure/1A3N Validace struktur v PDB https://www.wwpdb.org/validation/2017/XrayValidationReportHelp Validační statistika wwPDB Kvalita modelu (R-faktor) FO FC Experimentálně pozorované difrakce Vypočtené difrakce z našeho modelu Pro R-faktor platí: • Dva možné zápisy: R= 0,2 nebo R= 20 % • R-faktor může mít teoreticky hodnoty od 0,0 po 1,0 • V praxi se budete střetávat s hodnotami mezi 0,1 a 0,4 • Čím nižší R-faktor, tím lepší struktura Dobře vyřešená struktura nabývá hodnoty R= rozlišení/10 tj. pro dobře vyřešenou strukturu s rozlišením 2 Å je optimální R= 0,2 Kvalita modelu (R-free) Experimentálně pozorované difrakce Vypočtené difrakce z našeho modelu Množina T jsou náhodně vybraná data, která nejsou použita pro výpočet elektronové hustoty. Pro Rfree platí: • Zpravidla je o něco větší než R-faktor, tj. pro strukturu s R= 0,2 je rozumné mít Rfree= 0,23 • Pokud je velký rozdíl mezi R a Rfree struktury, tato struktura je podezřelá a je nutná podrobnější inspekce Validace struktur v PDB https://www.wwpdb.org/validation/2017/XrayValidationReportHelp Validační statistika wwPDB Počet párů atomů, které jsou neobvykle blízko sebe. Validace struktur v PDB https://www.wwpdb.org/validation/2017/XrayValidationReportHelp Validační statistika wwPDB β-list Ramachandranův diagram Pravotočivá α-šroubovice Levotočivá α-šroubovice Kvalita modelu (Ramachandranův diagram) β-list Ramachandranův diagram Pravotočivá α-šroubovice Levotočivá α-šroubovice Modře- residua se správnou konformací torzních úhlů Červeně- residua s nesprávnou konformací torzních úhlů Ramachandranův diagram modelu proteinu Validace struktur v PDB https://www.wwpdb.org/validation/2017/XrayValidationReportHelp Validační statistika wwPDB Procento aminokyselin, které mají neobvyklou konformaci bočního řetězce. Validace struktur v PDB https://www.wwpdb.org/validation/2017/XrayValidationReportHelp Validační statistika wwPDB „Real-space R-value“ je ukazatel, jak dobře odpovídá model elektronové hustotě. Daný ukazatel reprezentuje procento reziduí, která nesedí dobře v el. hustotě. Kvalita ligandu • Manuální inspekce • Nutnost znalosti metodiky https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5799025/ Validační statistika wwPDB A) Původně namodelovaná α-1,6-mannobiosa. Autoři museli vložit alternativní orientaci molekuly, aby interpretovali el. hustotu. To se jim moc nepovedlo a dané dvě konformace molekuly nesedí dobře v el. hustotě. B) Správně interpretovaná el. hustota pomocí molekuly threhalosy. Odkazy • https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4531100/ • https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3138648/ https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5799025/ • https://pubmed.ncbi.nlm.nih.gov/28291756/ • https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5349432/