Vývoj software v Loschmidtových laboratořích Jan Štourač Vývoj software 1. Nové algoritmy a metody 2. Komplexní bioinformatická workflow Vývoj software v LL 2 Vývoj software 1. Nové algoritmy a metody 2. Komplexní bioinformatická workflow Vývoj software v LL 3 Motivace ▪ Nový nápad ☺ ▪ Problémy existujících programů ▪ Nízká/nedostatečná přesnost ▪ Nespolehlivost ▪ Zastaralost ▪ Výpočetní náročnost Vývoj software v LL 4 CaverDock Vývoj software v LL Automatická analýza transportu malých molekul tunely v proteinech s využitím molekulového dokování. 5 CaverDock Vývoj software v LL 6 CaverDock Vývoj software v LL ? 7 CaverDock Vývoj software v LL Discretization 8 CaverDock Vývoj software v LL 9 CaverDock Vývoj software v LL 10 Vývoj software 1. Nové algoritmy a metody 2. Komplexní bioinformatická workflow Vývoj software v LL 11 Motivace Vývoj software v LL 12 Motivace Vývoj software v LL 15 nástrojů 2 databáze 13 Motivace ▪ Náročná instalace ▪ Většinou podpora pouze pro Linux ▪ Nedostupnost balíčků v repozitářích → nutnost kompilace ▪ Zastaralý zdrojový kód ▪ Obskurní knihovny ▪ Velké množství (desítky) nástrojů Vývoj software v LL 14 Motivace ▪ Náročné používání ▪ Často žádné uživatelské rozhraní ▪ Velké množství konfiguračních parametrů (i stovky) ▪ Každý nástroj má své “háčky” ▪ Výstupy většinou textové nebo binární soubory Vývoj software v LL 15 Motivace ▪ Náročné propojení a analýza výsledků ▪ Výstupy a vstupy často nejsou kompatibilní ▪ Výsledky je nutné manuálně kombinovat a vizualizovat Vývoj software v LL 16 Motivace ▪ Nedostatek výkonu ▪ Málokdo má k dispozici velké výpočetní zdroje ▪ Náročné na správu a používání ▪ 1 výpočet FireProt = ~3 000 CPU hodin ▪ → na běžném notebooku cca 31 dní Vývoj software v LL 17 Motivace Vývoj software v LL 18 Motivace Vývoj software v LL 19 HotSpot Wizard Vývoj software v LL Automatická identifikace reziduí vhodných k mutagenezi a návrh „chytrých knihoven“ pro proteinové inženýrství. 20 HotSpot Wizard Vývoj software v LL 21 HotSpot Wizard Vývoj software v LL 22 zvýšená termostabilita o 24° C HotSpot Wizard Vývoj software v LL 23 HotSpot Wizard Vývoj software v LL Analýza výsledků Stabilitní hot spoty (evoluce) Stabilitní hot spoty (flexibilita) Funkční hot spoty Korelované hot spoty Výpočet Návrh knihoven Standardní mód SwiftLib Vstupní data Struktura proteinu Esenciální rezidua Sekvence proteinu Parametry Teplotní stabilita Jednobodové mut. Vícebodové mut. 24 29 nástrojů 12 databází HotSpot Wizard Vývoj software v LL 25 https://loschmidt.chemi.muni.cz/peg/software Caver 3.0, CaverAnalyst 2.0 analysis of protein tunnels and channels CaverDock 1.0 energetic analysis of passage of ligands Hotspot Wizard 3.0 safe mutagenesis and smart libraries FireProt 1.0 design of thermostabilizing mutations EnzymeMiner 1.0 mining of novel enzymes in genetic databases SoluProt 1.0 prediction of protein solubility CalFitter 1.0 analysis of thermal denaturation data Vývoj software v LL Technologie ▪ Frontend ▪ HTML, CSS, JavaScript (TypeScript) ▪ React, Redux, d3.js ▪ Backend ▪ Java, Python ▪ Spring, Hibernate, Lombok ▪ MySQL/MariaDB 27 Vývoj software v LL Technologie ▪ Deployment ▪ Git, Gitlab ▪ Redmine, ▪ Jenkins ▪ CentOS, Docker 28 Infrastruktura ▪ Vlastní produkční a vývojové prostředí ▪ 47 serverů ▪ 1500 CPU jader ▪ 24 TB RAM ▪ MetaCentrum ▪ > 200 serverů ▪ 20 000 CPU jader ▪ 19 PB úložiště Vývoj software v LL 29 Statistiky používání >100 000 uživatelů >111 000 úloh Vývoj software v LL 30 Možnosti BP a DP ▪ Co nabízíme ▪ Vědecky atraktivní témata na pomezí biologie, chemie a informatiky s celosvětovým dosahem ▪ Možnost podílet se na: ▪ Návrhu algoritmu nebo workflow a jeho validaci ▪ Vývoji a testování software ▪ Možnost pracovat s moderními technologiemi ▪ Včetně zaškolení ▪ Úzká spolupráce s modeláři a experimentátory Vývoj software v LL 31 Možnosti BP a DP ▪ Co očekáváme ▪ Praktické zkušenosti se: ▪ Skriptováním – vývoj a validace workflow a metod ▪ Programováním – vývoj software ▪ Ochotu se vzdělávat (v informatice i biologii) ▪ Ochotu na práci strávit více než poslední semestr Vývoj software v LL 32 Kontakt Jan Štourač ▪ UČO: 113869 ▪ Budova A13, místnost 108 ▪ E-mail: stourac@mail.muni.cz ▪ Web: loschmidt.chemi.muni.cz/peg/ Vývoj software v LL 33 https://loschmidt.chemi.muni.cz/peg/software Caver 3.0, CaverAnalyst 2.0 analysis of protein tunnels and channels CaverDock 1.0 energetic analysis of passage of ligands Hotspot Wizard 3.0 safe mutagenesis and smart libraries FireProt 1.0 design of thermostabilizing mutations EnzymeMiner 1.0 mining of novel enzymes in genetic databases SoluProt 1.0 prediction of protein solubility CalFitter 1.0 analysis of thermal denaturation data