Nový GPU cluster v CERIT-SC

Nový GPU cluster v CERIT-SC

Vážení uživatelé,

MetaCentrum bylo rozšířeno o nový cluster:

zia.cerit-sc.cz (lokalita Brno, vlastník CERIT-SC), 5 uzlů, 640 jader CPU a GPU kartami NVIDIA A100, s následující specifikací každého uzlu:

Cluster je dostupný v prostředí plánovacího serveru @pbs-cerit prostřednictvím standardních krátkých front a prioritní fronty gpu.

Vyjímečná specifikace clusteru

Cluster je vybavený aktuálně nejvýkonnějšími grafickými akcelerátory NVIDIA A100 https://www.nvidia.com/en-us/data-center/a100/ . Na těchto grafických kartách je možné ještě více urychlit mnoho masivně paralelních úloh a vědeckých (HPC) aplikací nebo efektivněji řešit algoritmy umělé inteligence (AI).

Mezi hlavní výhody NVIDIA A100 patří specializovaná Tensor jádra pro machine learning aplikace nebo velká paměť (40 GB na každý akcelerátor). Podporuje výpočty pomocí tensor jader s různou přesností, kromě INT4, INT8, BF16, FP16, FP64 přibyl i nový formát TF32.
 

Na clusterech CERIT-SC je možné využívat dockerové obrazy z NVIDIA GPU Cloud (NGC) -- nejpoužívanější prostředí pro vývoj machine learning a deep learning aplikací, HPC aplikací nebo vizualizaci akcelerovanou NVIDIA GPU kartami. Nasazení těchto aplikací je pak otázkou zkopírování odkazu na příslušný Docker obraz, jeho spuštění spuštění v Docker kontejneru (v Podmanovi, alternativně v Singularity). Více informací najdete na https://wiki.metacentrum.cz/wiki/NVidia_deep_learning_frameworks

 

Kompletní seznam aktuálně dostupných výpočetních serverů je na http://metavo.metacentrum.cz/pbsmon2/hardware.


S přáním příjemného počítání,

MetaCentrum

 


Ivana Křenková, 8. 2. 2021