C7800 Počítačová chemie a molekulové modelování – cvičení -1Petr Kulhánek kulhanek@chemi.muni.cz Národní centrum pro výzkum biomolekul, Přírodovědecká fakulta Masarykova univerzita, Kotlářská 2, CZ-61137 Brno Referenční manuál - Infinity C7800 Počítačová chemie a molekulové modelování I - cvičení C7800 Počítačová chemie a molekulové modelování – cvičení -2- Infinity https://lcc.ncbr.muni.cz/whitezone/development/infinity/ C7800 Počítačová chemie a molekulové modelování – cvičení -3Přehled příkazů Správa software: • module aktivace/deaktivace software Správa úloh: • psubmit zadání úlohy do dávkového systému • pinfo informace o úloze • pgo přihlásí uživatele na výpočetní uzel, kde se úloha vykonává • pjobs přehled úloh uživatele zadaných do dávkového systému Další užitečné příkazy: pqueues, pnodes, pqstat C7800 Počítačová chemie a molekulové modelování – cvičení -4Životní cyklus úlohy ...... ...... ...... fronty(queues) short normal long torque-server (pbs_server) stav uzlů (nodes) pnodes pjobs pqstat pqueues torque-scheduler (pbs_sched) řazení úloh na výpočetní uzly dle požadovaných zdrojů torque-mom (pbs_mom) torque-mom (pbs_mom) výpočetní uzel#1 np=2 výpočetní uzel#2 np=1 psubmit psubmit psubmit připravená úloha čekající úloha běžící úloha C7800 Počítačová chemie a molekulové modelování – cvičení -5- Úloha Úloha musí splňovat následující podmínky: • každá úloha se spouští v samostatném adresáři • všechny vstupní data úlohy musí být v adresáři úlohy • adresáře úloh nesmí být do sebe zanořené • průběh úlohy je řízen skriptem nebo vstupním souborem (u automaticky detekovaných úloh) • skript úlohy musí být v bashi • ve skriptu úlohy se nesmí používat absolutní cesty, všechny cesty musí být uvedeny relativně k adresáři úlohy /home/kulhanek job1 job2 /home/kulhanek job1 job2 C7800 Počítačová chemie a molekulové modelování – cvičení -6Spuštění úlohy v gaussianu Úlohy v programu Gaussian budeme spouštět vždy přes rozhraní Infinity. Úlohy budeme spouštět na 1 CPU ve frontě normal, kde výpočetní uzel bude vaše pracovní stanice. $ module add gaussian $ psubmit localhost@normal soubor.com aktivace modulu gaussian pouze jednou v daném terminálu vstupní soubor pro program gaussian úloha bude zařazena do fronty normal (max imální doba běhu úlohy 12 hodin) běh úlohy je omezen pouze na vaší pracovní stanici Po doběhnutí úlohy bude výsledek výpočtu uložen v souboru soubor.log K monitorování průběhu úlohy lze použít příkaz pinfo, který se spouští v adresáři úlohy. Dalšími možnostmi jsou příkazy pjobs a pqstat. Pokud je úloha spuštěna, je možné použít příkaz pgo, který vás příhlásí na výpočetní uzel a změní aktuální adresář do pracovního adresáře úlohy. Lze tak kontrolovat průběh výpočtu za běhu úlohy. C7800 Počítačová chemie a molekulové modelování – cvičení -7Servisní soubory V adresáři úlohy vznikají při zadání úlohy do dávkového systému a dále v průběhu života úlohy a po jejím ukončení servisní soubory. Jedná se o textové soubory, které je možné analyzovat pomocí libovolného textového prohlížeče (příkazy less, more) či editoru (vi, kwrite, gedit). Pro účely cvičení je možné obsah souborů ignorovat, kromě případů, kdy úloha nedoběhne v pořádku. Význam souborů je následující: • *.info kontrolní soubor s informacemi o průběhu úlohy • *.infex vlastní skript (wrapper), který se spouští dávkovým systémem • *.infout standardní výstup z běhu *.infex skriptu, nutno analyzovat při nestandardním ukončení úlohy • *.nodes seznam uzlů vyhrazených pro úlohu • *.gpus seznam GPU karet vyhrazenych pro úlohu • *.key unikátní identifikátor úlohy • *.stdout standardní výstup z běhu skriptu úlohy, nutno analyzovat při nestandardním ukončení úlohy C7800 Počítačová chemie a molekulové modelování – cvičení -8Přenos dat Typ synchronizace Význam sync Data úlohy jsou při spuštění úlohy zkopírována ze vstupního adresáře do pracovního adresáře. Pak je spuštěn vlastní výpočet. Po jeho doběhnutí jsou všechna data z pracovního adresáře zkopírována zpět do vstupního adresáře úlohy. Uživatelské rozhraní (UI) (Frontend) /job/input/dir Výpočetní uzel #1 Worker Node (WN) /scratch/job_id/ rsync rsync Poznámky: • výchozí synchronizační mód • při použití localhost@normal je výpočetní uzel a uživatelské rozhraní identický stroj