C2115 Praktický úvod do superpočítání -1- C2115 Praktický úvod do superpočítání Petr Kulhánek, Jakub Štěpán kulhanek@chemi.muni.cz Národní centrum pro výzkum biomolekul, Přírodovědecká fakulta, Masarykova univerzita, Kotlářská 2, CZ-61137 Brno VI. lekce C2115 Praktický úvod do superpočítání -2- Obsah  Cvičení LV.2 výsledky, diskuze  Architektura počítače limitující faktory, typy aplikací a jejich vztah k limitujícím faktorům  Cvičení LV.3 výsledky, diskuze C2115 Praktický úvod do superpočítání -3Cvičení LV.2 C2115 Praktický úvod do superpočítání -4- Výsledky wolf01, 4 CPU, Intel(R) Xeon(R) CPU X3460 @ 2.80GHz, L1: 32kB, L2: 256kB, L3: 8192kB load_cpu Počet souběžně spuštěných procesů Skutečná doba běhu (twall) [s] Teoretická doba běhu (tideal) [s] Režie (overhead) [%] 1 14.5 14.5 0.0 2 15.7 14.5 8.1 3 18.4 14.5 26.8 4 24.5 14.5 69.1 8 50.3 29.0 73.4 12 78.8 43.5 81.1 16 103.3 58.0 78.1 20 135.7 72.5 87.1 24 892.6 87.0 926.0 100 ideal idealwall t tt overhead   udává o kolik % je běh aplikace pomalejší než za ideálního stavu C2115 Praktický úvod do superpočítání -5- Výsledky wolf01, 4 CPU, Intel(R) Xeon(R) CPU X3460 @ 2.80GHz, L1: 32kB, L2: 256kB, L3: 8192kB růstrežie load_cpu Počet souběžně spuštěných procesů Skutečná doba běhu (twall) [s] Teoretická doba běhu (tideal) [s] Režie (overhead) [%] 1 14.5 14.5 0.0 2 15.7 14.5 8.1 3 18.4 14.5 26.8 4 24.5 14.5 69.1 8 50.3 29.0 73.4 12 78.8 43.5 81.1 16 103.3 58.0 78.1 20 135.7 72.5 87.1 24 892.6 87.0 926.0 C2115 Praktický úvod do superpočítání -6- Výsledky wolf01, 4 CPU, Intel(R) Xeon(R) CPU X3460 @ 2.80GHz, L1: 32kB, L2: 256kB, L3: 8192kB CPUcache load_cpu Počet souběžně spuštěných procesů Skutečná doba běhu (twall) [s] Teoretická doba běhu (tideal) [s] Režie (overhead) [%] 1 14.5 14.5 0.0 2 15.7 14.5 8.1 3 18.4 14.5 26.8 4 24.5 14.5 69.1 8 50.3 29.0 73.4 12 78.8 43.5 81.1 16 103.3 58.0 78.1 20 135.7 72.5 87.1 24 892.6 87.0 926.0 přepínání kontextu swap C2115 Praktický úvod do superpočítání -7Architektura, celkový pohled CPU severní můstek jižní můstek paměť řadiče SATA pevné disky síť (ethernet) C2115 Praktický úvod do superpočítání -8Architektura, limitující faktory CPU severní můstek jižní můstek paměť síť (ethernet) řadiče SATA pevné disky cache Nejrychlejší komponentou je CPU ostatní komponenty jsou pomalejší RAM ~10 GB/s SATA disk SATA III: 600 MB/s Síť 10/100/1000 Mb/s limitující faktory C2115 Praktický úvod do superpočítání -9Paměť, swap CPU severní můstek jižní můstek síť (ethernet) pevné disky cache paměť swap swap = odkladná paměť, která je většinou uložena na diskovém zařízení, • je využívána, pokud není dostatek systémové paměti pro běh procesů • rychlost přístupu ke swapu je limitován rychlostí daného hardware a všech komunikačních kanálů mezi ním a fyzickou paměti ~10 GB/s SATA III: 600 MB/s C2115 Praktický úvod do superpočítání -10Architektura, limitující faktory CPU severní můstek jižní můstek paměť síť (ethernet) řadiče SATA pevné disky cache Nejrychlejší komponentou je CPU ostatní komponenty jsou pomalejší RAM ~10 GB/s SATA disk SATA III: 600 MB/s Síť 10/100/1000 Mb/s limitující faktory vysoké latence C2115 Praktický úvod do superpočítání -11Cvičení LV.3 C2115 Praktický úvod do superpočítání -12Datové toky, LV.3.1 /home/home wolf01wolfxx scp wolf – front end C2115 Praktický úvod do superpočítání -13Datové toky, LV.3.1 /home/home wolf01wolfxx scp nfs, readnfs, write network switch NFS – Network File System wolf – front end C2115 Praktický úvod do superpočítání -14Datové toky, LV.3.2 /home/home wolf01wolfxx scp nfs, read network switch NFS – Network File System wolf – front end C2115 Praktický úvod do superpočítání -15Datové toky, LV.3.3 /home/home wolf01wolfxx scp network switch NFS – Network File System wolf – front end C2115 Praktický úvod do superpočítání -16Datové toky, LV.3.4 /home/home wolf01wolfxx network switch wolf – front end C2115 Praktický úvod do superpočítání -17Parametry síťového rozhraní [kulhanek@wolf01 ~]$ ethtool eth0 Settings for eth0: Supported ports: [ TP ] Supported link modes: 10baseT/Half 10baseT/Full 100baseT/Half 100baseT/Full 1000baseT/Full Supported pause frame use: No Supports auto-negotiation: Yes Advertised link modes: 10baseT/Half 10baseT/Full 100baseT/Half 100baseT/Full 1000baseT/Full Advertised pause frame use: No Advertised auto-negotiation: Yes Speed: 1000Mb/s Duplex: Full Port: Twisted Pair PHYAD: 2 Transceiver: internal Auto-negotiation: on MDI-X: off