Protein folding Rosetta Rosetta© home Foldit Robetta Shrnutí Rosetta & Foldit 9. říjen 2012 Protein folding Rosetta RosettaQhome Foldit Robetta Shrnutí 0 Protein folding O Rosetta 0 Rosetta®home 0 Foldit 0 Robetta 0 Shrnutí Protein folding Rosetta RosettaOhome Foldit Robetta Shrnutí Protein folding • Proces skládání prostorového tvaru proteinu (terciární struktura) • Struktura —> funkce Protein folding Rosetta RosettaOhome Foldit Robetta Shrnutí Predikce vs. experimentální přístup • Sekvenci aminokyselin proteinů lze snadno přečíst ze sekvence nukleotidů DNA • Pouze zlomek proteinů se známou sekvencí má objasněnou strukturu • Problém je přečíst informaci o prostorové struktuře proteinu ze sekvence aminokyselin • Ohromné množství konformací proteinu • Je obtížné vytvořit realistický model vodného prostředí Protein folding Rosetta Rosetta© home Foldit Robetta Shrnutí Rosetta • Baker laboratory (University of Washington) • Algoritmus pro předpověď struktury proteinu ze sekvence de novo • Softwarový balík s mnoha funkčními moduly: Rosetta ab initio, Rosetta N MR, Rosetta Design, Rosetta Doc, Rosetta Fragment Selection, Rosetta Ugand, RosettaMembrane... Protein folding Rosetta Rosetta© home Foldit Robetta Shrnutí Rosetta • Ab initio vs. de novo modelování • "Od počátku" • Sekvence aminokyselin obsahuje informaci o struktuře proteinu • Snaha najít stav s nejnižší energií o Potřeba zredukovat ohromné množství konformací • Potřeba ohodnotit jednotlivé stavy (funkce přidělující skóre na základě energie) Protein folding Rosetta RosettaOhome Foldit Robetta Shrnutí Odvození úhlů mezi aminokyselinami v polypeptidové kostře • Rozdělení proteinu na segmenty • Snaha o snížení počtu konformací pro jednotlivý segment: nemusí se vyzkoušet každý úhel mezi dvěma aminokyselinami, ale uvažují se pouze realistické úhly • Využití experimentálně získaných struktur • Knihovna proteinových fragmentů • Fragmenty dlouhé 3 a 9 reziduí • Fragmenty jsou mapovány v PDB pomocí PSIBLAST • Kombinace fragmentů a vypočítání energie Protein folding Rosetta Rosetta© home Foldit Robetta Shrnutí Schéma de novo modelování Rosetta • (a) Knihovny fragmentů zachycují lokální konformace • (b) Kombinace různých fragmentů z různých knihoven, optimalizace vzdálených kontaktů • (c) Snížení energie struktury na globální minimum Protein folding Rosetta RosettaOhome Hodnocení konformace proteinu • Fyzikální základ • Vlastnosti aminokyselin (hydrofobicita, velikost) • Vzájemné interakce vedlejší řetězců • Tvar kostry proteinu (vodíkové můstky, disulfidické můstky) • Tvorba sekundárních struktur (alfa šroubovice, beta skládaný list) Protein folding Rosetta RosettaOhome Foldit Robetta Shrnutí • BOINC (Berkley Open Infrastructure for Network Computing) • Open-source platforma vytvořená po úspěchu SETIOhome • Projekt založený na distribuovaných výpočtech • Software využívá výpočetní kapacitu domácích počítačů v době, kdy jsou nečinné • Stahuje problém z hlavního serveru a výsledky odesílá zpět Protein folding Rosetta RosettaOhome Rosetta@home Protein Folding, Design, and Docking • Hledá strukturu proteinů s nejnižší energií • Spuštěno v říjnu 2005 Protein folding Rosetta RosettaShome Foldit Robetta Grafické zobrazení výpočtu Protein folding Rosetta Rosetta©home Foldit Robetta Shrnutí Foldit • Free online hra • Vychází z projektu Rosetta • Využívá Rosetta energy function • Stejný cíl jako Rosetta®home řeší využitím veřejnosti • Člověk řeší problém efektivněji než progam • Motivace uživatelů formou hry Protein folding RosettaOhome Algorithm discovery by protein folding game players Firas Khatib-*, Seth Cooper11, Michael D. TykaJ. Kefan Xua, llya MakedorV. Zoian Popovit*, David Baker*4', and Foldit Players C-d-ntribJteO by David Balcer, Oct-Wer 5. 2C11 {sent for review June 21 2011) Foldit is a multiplayer online game in which players collaborate and compete to create accurate protein structure models. For specific hard problems., Foldit player solutions tan in some cases outperform state-of-the-art computational methods, However, very little is known about how collaborative gameplay produces these results and whether Foldit player strategies can be formalized and structured so that they can be used by computers, To determine whether high performing player strategies could be collectively codified, we augmented the Foldit gameplay mechanics with tools for plays* to encode their folding strategies as "recipes1' and to siiare their recipes with other player^ who are able to further modify and redistribute them. Here we describe the rapid soda I evolution of player-developed folding algorithms that took place in the year following the introduction of these tools Players developed ever 5,4ffldifferent recipes, both by creating new algorithms and by modifying and recombining successful redpes developed by other players. The most successful recipes rapidly spread through the Foldit player population, and two of the redpes became parti cularly dominant. Examination of the algorithms, encoded in these two recipes revealed a striking similarity to an unpublished algorithm developed by scientists over the same period. Benchmark calculation: show that the new algorithm independently discovered by scientists and by Foldit players outperforms previously published methods. Thus, online scientific game frameworks have the potential not only to solve hard scientific problems, but also to discover and formalize effective new strategies and algorithms A-i IIil pliiyurs Lh.nii.lvundLLsiand Midi" iLral.-pi.-s h.-ll.-r Ihun anyone, we derided to allow them to codify their ak'.iiriihni-: d i. rue i It . liithji" Mian ;i tl Linn line; tn iinlnijialk-iil Iv Lain iippi:i vi in iiliiin.1. Wl iiiiL'.niLiitj;! -laiiLl:ir;l I :il;lil |iliiv with ihu aliilitr tn create. \iJ\i.. sbari:. iinii i~s11__- L'.iimj |ilav majr:i-. r-.-t.Tr.-J hi ai "recipes"' within Lh.- Iviklil ljiiii.- i Jn lbj ejmi:: l iidi plnym" lius ih.-it own "fookhook ■ -■! di i j.dpe ■■. :: -■ i.1 liich i jar. Invoke ii VLirietv i)t" intcLiietivj iiiitoniiitLd iLi-NL.gi .-i. J'luv.Ti ran share reelpej they write with the rest of the Foldit community or tluv ciiii eh ii its - In kjjp tluir eLjnliiiiii In th.-nis.-lvj-i. In this paper we describe the quite unexpected evolution of recipes [a the vent utter they were released, and the striki up.clih vcrgcncc of this very short evolution on an algorithm very similar to an unpublished algorithm recently developed independently hv iliiIifie experts that improves over previous methods. Results In the social development environment provided by Foldit, pliivers evolved u wide variety of recipes to eodifv their diverse •lltlr^W i- |h. 4 lr i,, •, K|||j_ .....j. i iii- ill iff 111-1 ■ lull' hi- ii ill ■iLLji.1v p.rkid i iv Miticiiu.'h ami Mi i. _ . hikli L pi ih'lls ran 5.488 unique recipes 15S,tiS2 times and 5ti8 players wrote 5,202 recipes. We studied tbesj ii kiorithnis iind found that they fell Into four mn in cut ego ri.es; [i | fn-niiih unit >m'i\imri'. (ii) aggressive rebuilding. (/(",') ,'V/c;;.1' uir::iiK~v. \\v\i\ i.'ii ic tinKiminn: I'liu first '!■).■■, ).■ *- Ii.-.ii.i.I Mi, ........ri> ...........-> i.i.i pmvidjd tn J'iililit phv.-r-.. nfiijli ha- 111.- ;li-:i;h il r.-:i;llk Protein folding Rosetta RosettaOhome Sociální evoluce foldit receptů Foldit Robetta Shrnutí Acid Tweeker v0.5 Blue Fuse vl.l • Algorithm discovery by protein folding game players. Khatib, F., Cooper S., Tyka M. D., Xu K., Makedon I., Popovic Z., et al. Proc Natl Acad Sci USA (2011) Protein folding Rosetta RosettaOhome ROBETTň beta • Server pro predikci proteinových struktur • Rozděluje proteiny na domény • Využívá homologní a ab initio modelování (Rosetta) Protein folding Rosetta RosettaOhome Foldit Robetta Shrnutí Přínos • Predikce struktury proteinů • Návrh nových proteinů • Návrh léčby chorob: rakovina, AIDS, Alzheimerova choroba, Creutzfeldt-Jakobova choroba • Interakce proteinů s proteiny (dokování) • Interakce proteinů s malými molekulami (návrh léčiv) • Design nových proteinů (vakcíny, paliva) • Testování nových metod ve strukturní bioinformatice Protein folding Rosetta Rosetta© home Foldit Robetta Shrnutí Závěr • Přístup Rosetta byl inovativní díky využití fragmentových knihoven pro hledání vhodných konformací • Se znalostí lokálních struktur lze snadněji získat globální strukturu • Rosetta předpokládá, že informace o lokální struktuře lze získat ze strukturních databází » Jeden z nejúspěšnějších programů na určení struktury proteinů: soutěže CASP, CAPRI