Nový HW v MetaCentru
Nový HW v MetaCentru
MetaCentrum bylo rozšířeno o nové clustery:
1) GPU cluster
galdor.metacentrum.cz vlastník CESNET, 20 uzlů, 1280 jader CPU a 80 GPU kartami NVIDIA A40, s následující specifikací každého uzlu:
- CPU: 64x AMD EPYC 7543
- RAM: 512 GiB
- GPU: 4x NVIDIA A40
- disk: 2x7.68 TiB NVME
- Net: x Ethernet 10 Gbit/s
- OS: Debian 11
- výkon každého uzlu je dle SPECfp2017: 513 (8 na jádro)
Cluster je dostupný v prostředí plánovacího serveru @pbs-meta prostřednictvím standardních krátkých front a prioritní fronty gpu.
Na GPU clusterech je možné využívat dockerové obrazy z NVIDIA GPU Cloud (NGC) -- nejpoužívanější prostředí pro vývoj machine learning a deep learning aplikací, HPC aplikací nebo vizualizaci akcelerovanou NVIDIA GPU kartami. Nasazení těchto aplikací je pak otázkou zkopírování odkazu na příslušný Docker obraz, jeho spuštění spuštění v Docker kontejneru v Singularity. Více informací najdete na https://wiki.metacentrum.cz/wiki/NVidia_deep_learning_frameworks
2) CPU cluster
halmir.metacentrum.cz vlastník CESNET, 31 uzlů, 1984 jader CPU, s následující specifikací každého uzlu:
- CPU: 64x AMD EPYC 7543
- RAM: 1024 GiB
- disk: 2x7.68 TiB NVME
- Net: Ethernet 10 Gbit/s
- OS: Debian 11
- výkon každého uzlu je dle SPECfp2017: 513 (8 na jádro)
Cluster je dostupný v prostředí plánovacího serveru @pbs-meta prostřednictvím standardních krátkých front. Po otestování budou přidány i delší fronty.
Kompletní seznam aktuálně dostupných výpočetních serverů je na http://metavo.metacentrum.cz/pbsmon2/hardware.
Problémy s kompatibilitou některých aplikací s OS Debian11 průběžně řešíme rekompilací nových SW modulů. Pokud narazíte na problém u své aplikace, vyzkoušejte přidání modulu debian10-compat na začátek spouštěcího skriptu. Pokud problémy přetrvávají, dejte nám vědět na meta(at)cesnet.cz.
S přáním příjemného počítání,
Ivana Křenková, Fri Mar 11 23:40:00 CET 2022

