Přeskočit na obsah

Novinky infrastruktury MetaCentrum & CERIT-SC

Novinky infrastruktury MetaCentrum & CERIT-SC

  1. Nový GPU cluster pro umělou inteligenci
  2. Začlenění clusteru a diskového pole Botanického ústavu AV ČR v Průhonicích
  3. Přesun clusteru zenon (hde.cerit-sc.cz) centra CERIT-SC do OpenStacku, upgrade na Debian10


1) Nový GPU cluster pro umělou inteligenci -- adan.grid.cesnet.cz (1952 CPU) - Stroj s 192GB RAM, 2x 16-core Xeon a 2x nVidia Tesla T4 16GB

  • MetaCentrum bylo rozšířeno o nový GPU stroj adan.grid.cesnet.cz (lokalita Biocev, vlastník CESNET), 61 uzlů, každý s následující specifikací:
    • 32x Intel(R) Xeon(R) Gold 5218 CPU @ 2.30GHz
    • RAM: 192 GB
    • Disk: 4x 240GB SSD
    • GPU: 2x nVidia Tesla T4 16GB s podporou AI

Pro přístup do fronty 'adan' je potřeba speciální oprávnění. Pokud máte zájem stát se AI testerem, konraktujte nás na meta(at)cesnet.cz.

Jméno ADAN není náhodné, ve světě J. R. R. Tolkiena označuje v elfském jazyce „člověka“. Cluster ADAN je díky svým parametrům určen zejména pro tzv. strojové učení (machine learning), které spadá do sféry umělé inteligence.

Tip: Pokud narazíte na problém s kompatibilitou mezi jednotlivými generacemi GPU karet, je možné omezit výběr strojů s určitou generací karet pomocí parametru gpu_cap=[cuda20,cuda35,cuda61,cuda70,cuda75].

 

  

2) Začlenění clusterů a diskového pole Botanického ústavu AV ČR v Průhonicích

  • MetaCentrum bylo rozšířeno o cluster carex.ibot.cas.cz (lokalita Průhonice, vlastník Botanický ústav AV ČR), 8 uzlů s následující specifikací:
    • 8x AMD EPYC 7261 8-Core Processor
    • RAM: 512 GB
    • Disk: 2x 960GB NVMe
  • Cluster draba.ibot.cas.cz (lokalita Průhonice, vlastník Botanický ústav AV ČR), 240 CPU jader s následující specifikací:
    • 80x Intel(R) Xeon(R) Gold 6230 CPU @ 2.10GHz
    • RAM: 1536 GiB
    • Disk: 2x 960GB NVMe
    • Stroj určen pro úlohy s velkou spotřebou paměti (až 1,5 TB).

Dále byl zprovozněn frontend tilia.ibot.cas.cz (s aliasem tilia.metacentrum.cz) a diskové pole /storage/pruhonice1-ibot/home dedikovane pro skupinu ibot.
 

Clustery jsou dostupné prostřednictvím fronty 'ibot' (vyhrazené vlastníkům clusteru). Po otestování bude pravděpodobně zpřístupněný prostřednictvím krátkých standardních front.

Pravidla využití jsou dostupné na stránce vlastníka clusteru: https://sorbus.ibot.cas.cz/


3) Přesun clusteru zenon hde.cerit-sc.cz centra CERIT-SC do OpenStacku, upgrade OS na Debian10


Aktuálně probíhá stěhování clusteru zenon.cerit-sc.cz (1888 CPU, 60 uzlů) do OpenStacku, během několika dní bude znovu přístupný přes PBS server wagap-pro. Zároveň probíhá upgrade operačního systému na Debian10.

Cluster bude dostupný stejným způsobem jako doposud (PBS server wagap-pro, běžné fronty).


Problémy s kompatibilitou některých aplikací s OS Debian10 průběžně řešíme rekompilací nových SW modulů. Pokud narazíte na problém u své aplikace, vyzkoušejte přidání modulu debian9-compat na začátek spouštěcího skriptu. Pokud problémy přetrvávají, dejte nám vědět na meta(at)cesnet.cz.


Seznam uzlů s OS Debian9/Debian10/Centos7 je možné zobrazit v seznamu vlastností ve webové aplikaci PBSMon:

https://metavo.metacentrum.cz/pbsmon2/props?property=os%3Ddebian9
https://metavo.metacentrum.cz/pbsmon2/props?property=os%3Ddebian10
https://metavo.metacentrum.cz/pbsmon2/props?property=os%3Dcentos7 


Ivana Křenková, Wed Oct 30 15:35:00 CET 2019